最新版栏目

中国科学院上海硅酸盐研究所 | 数据驱动材料科学与工程大模型训练与应用

发布日期:2026-05-21来源:国家数据局 字号:

牵头单位:中国科学院上海硅酸盐研究所

获得奖项:国家数据要素x大赛科技创新赛道 优秀奖 应用实践奖

材料数据是智能创制的基础,但目前材料研发面临数据集规模较小、局域化特征明显的问题,导致数据分布泛化能力差。中国科学院上海硅酸盐研究所聚焦材料研发数据难以利用的难题,提出数据与知识驱动的材料智能研发新范式,以科学数据为基础,以材料大模型为载体,以机器人协作的自主实验为实施主体,推动材料研发智能化探索的关键突破。

图 1 业务逻辑


一是聚合结构化材料数据和非结构化材料数据,扩大数据基础。一方面汇集来自高通量材料计算、自主实验以及文献、专利的数据,以材料组分、结构、工艺参数、性能等数据构成材料科学与工程大模型MatMind领域知识问答、性能预测、结构生成与工艺推荐等功能训练的基础。另一方面利用材料科学与知识大模型的材料知识网络及信息提取能力,通过数据生成的方式,实现数据信息补全和数据量扩充,极大地提升了材料数据种类和数量。

二是构建“数据工程—模型推荐—自主实验”的数据治理新模式,激发材料数据价值。建立以数据为基础、模型为载体、自主实验实施验证的材料创制闭环,围绕发挥数据要素乘数作用,聚焦新材料创制领域,利用大语言模型算法的核心能力,加速数据收集与应用,实现材料高效、精准创制。

三是拓展广泛的数据应用主体,加速材料工程领域产业升级企业、科研院所还是政府部门,均可依托平台实现高效协同,通过数智融合加速推动材料工程领域技术创新。这缓解了新材料从实验室设计到商业化应用需要10—15年的研发周期,投入巨大且失败率高的问题,此外也在加速材料发现与创新、优化资源利用、提升产业竞争力、推动可持续发展以及促进跨学科融合能力上发挥作用。

四是由“任务驱动”转向“平台驱动”,赋能材料科研高质量发展。通过数据支撑、模型赋能、协议开放,从数据、模型、材料智能创制和应用4个层面,向科研院所和产业界推广。构建开放协作的数据生态,推动先进材料实现“智能自主实验—工业(工程)应用验证”。

附件:

为确保最佳浏览效果,建议您使用Google Chrome、Microsoft Edge及Mozilla Firefox等主流浏览器最新版本。