三部门联合部署建设新材料大数据中心:到2027年搭建形成“1+N”架构体系,形成30个以上数据资源节点

10月30日,工业和信息化部、财政部、国家数据局联合印发《新材料大数据中心总体建设方案》(以下简称《方案》)。

《方案》指出,新材料是战略性、基础性产业,也是高技术竞争的关键领域。数据作为新型生产要素,是关乎新材料技术创新、产业高质量发展的战略资源。《方案》的制定旨在充分发挥大数据、人工智能对新材料产业的技术支撑作用,支持新材料大数据中心建设,培育材料研发与应用的全新发展模式。

《方案》提出的总体要求是,到2027年,搭建形成“1+N”(1个中心主平台、N个数据资源节点)的新材料大数据中心架构体系,形成30个以上数据资源节点、30项以上材料大数据算法软件和工具、20种以上典型关键材料和产品的数据赋能应用示范;到2035年,新材料大数据中心体系全面建成并稳定运行,数据规模进入国际第一梯队。

《方案》提出的总体要求 图片来源:工信部

旨在破解材料数据的“孤岛化”难题

党的二十大报告提出,构建新材料等一批新的增长引擎。党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革 推进中国式现代化的决定》明确提出,“建设和运营国家数据基础设施,促进数据共享”。

工信部有关部门负责人就《方案》进行解读时表示,近年来,我国新材料产业蓬勃发展,布局建设一批材料数据平台,积累了大量的材料科学、技术、生产、应用等数据,但数据作为新要素流转共享不通畅、开发利用不深入、潜值释放不充分等问题突出,材料数据“孤岛化”现象严重,难以充分发挥数据基础资源和生成式人工智能赋能作用,亟需提高数据服务新材料产业发展的能力。

基于此,制定本《方案》是为了贯彻落实党中央、国务院决策部署,发挥大数据对新材料产业的重要支撑作用,构建材料研发与应用的新模式,培育新质生产力。

北京大学大数据分析与应用技术国家工程实验室特聘副研究员王娟接受《每日经济新闻》记者电话采访时表示,《方案》的内核就是要支持行业内头部企业、科研单位或者高校等有数据集的单位把数据开发、共享出来,让其他有关联业务的机构能够获取、使用数据,从而发挥出数据的价值。

王娟对记者表示,在新材料领域,以高校为例,比如做化工材料、新材料的课题组,他们做某个材料就会形成自己的数据集,在实验过程中会产生海量数据,数据配比成功后就可以发论文、申请专利,然后相关的成果可以转让给相关的工业企业。

王娟强调,实际上这是一种小作坊式的科研模式,在这个模式下大家可能并不互联互通,有不同的高校或企业都在做相关的研发,做的方向和目标都基本一致,这样实际上就会造成实验时间和成本的巨大浪费。

建设大数据中心就相当于做有组织的科研,由相关部门加以推动,把行业这种共性的实验数据、加工数据等构建成一个数据集,这样后来者要在这个领域去做创新和研究时,可以站在别人数据的肩膀上,再去做下一步的科学研究或研发,这样就可以节约整个社会的探索和创新成本。

聚焦先进钢铁材料等领域建设数据资源节点

《方案》提出,新材料大数据中心是促进新材料产业创新发展的新型研发基础设施,充分发挥产业数据规模优势和应用优势,通过平台、标准、技术、市场的引导,逐步实现科技、产业等材料数据的融通和应用。

在搭建新材料大数据中心架构体系方面,《方案》提出要建立中心主平台,布局数据资源节点等任务。

其中,在建立中心主平台方面,《方案》提出,统筹建门户、出标准、定规则。负责建设数据存储、灾备、交互服务器集群等硬件基础设施,以及数据管理发布、共享交互、应用服务、安全保障等系统;建立统一的数据标准规范体系、分类分级的数据安全保障体系;依场景构建无偿共享和有偿使用相结合的数据管理共享机制等。

在布局数据资源节点方面,《方案》提出,依托优势企业、科研院所、高校、新材料重点平台等各类创新载体,负责采数据、用数据、保质量。参照《工业战略性新兴产业分类目录(2023)》新材料产业分类,聚焦先进钢铁材料、先进有色金属材料、先进石化化工材料、先进无机非金属材料、高性能纤维及制品和复合材料、前沿材料等6个材料领域,以及1个材料综合应用领域,分科技、产业和计算三类,支持建设数据资源节点。

数据资源节点主要开展重点行业、领域的材料设计、研制、应用和专用计算等数据采集积累、质量控制和可靠性评价,数据内容和指标体系构建;按照统一数据标准体系和管理共享机制,与中心主平台联结,开展数据流通、共享、交换;开展材料数据增值应用的典型场景探索和个性化数据产品开发。

其中,每个领域遴选确定1到2个数据资源骨干节点,先行先试、率先联结,无偿提供具有公共属性的数据产品和服务,推动形成数据资源汇聚、共享、利用的“小核心”,充分发挥引领带动作用。

王娟看来,中心主平台相当于建立一个大的平台,N个数据资源节点可以看作是N个分散的点或者枢纽中心,可以通过接口与主平台上的数据互联互通。其目的就是让数据流通起来,更好地发挥数据要素的价值。