数据治理(Data Governance)是围绕数据全生命周期,通过管理优化和技术工具,确保数据的可用性、一致性、安全性、合规性的管理体系。数据治理涉及数据的整个生命周期,包含数据的产生、采集、清洗、存储、处理、应用、共享及销毁。
当前,人工智能正迅速渗透到经济社会的各个领域。2025 年,中央经济工作会议将“人工智能 +”列为重点任务,旨在用人工智能技术改造提升传统产业、发展新兴产业、培育未来产业;全国工业和信息化工作会议也规划了“人工智能 + 制造”行动,强调大模型研发和场景应用。近期,中国大模型凭借其高性能和高能效比,引发了全球关注。DeepSeekV3/R1 通过混合专家模型(MOE)、多头潜在注意力机制(MLA)、FP8 混合精度训练等前沿技术,大幅提升了模型能力。其高算力效能、开源特性和本地化部署为企业提供了低成本、高隐私保障的 AI 解决方案,正在快速推动制造业的数字化和智能化转型。
算力、算法、数据是 AI 发展的三大核心要素。我国数据潜力虽大,但数据治理水平亟待提升。《全国数据资源调查报告(2023 年)》显示,全国数据产存转化率仅为 2.9%,未使用数据占比高达 38.9%。此外,高质量中文语料匮乏,Hugging Face 数据集中中文占比仅为 3.2%。相比之下,美国早在 2009 年就启动了 Data.gov平台,汇集了超过 30 万种数据集,数据体量和质量全球领先。
因此,加强数据治理刻不容缓。国家层面,强化数据治理有助于弥补算力短板,提升 AI 伦理和安全保障;企业层面,数据治理能更好地赋能生产经营,实现智能化转型。高水平的数据治理是推动人工智能赋能实体经济、抢占未来科技和产业发展制高点的关键。
一、人工智能时代制造业数据的新特征
(一)来源广泛化
传统工业数据主要来自生产设备运行参数和产品质量检测。随着传感技术和物联网的广泛应用,智能传感器、工业机器人、智能机床等设备在生产线中大量部署,数据种类更加丰富。供应链上下游的数据流通也推动数据来源和规模的爆发式增长。例如,智能工厂的传感器可实时监测温度、振动等数据;工业机器人不仅能够传输传统加工参数,还能生成路径规划和决策评估数据;产品通过内置传感器将使用数据回传至生产企业。
(二)产生实时化
人工智能技术使数据采集和控制更加精细,数据生成实时性显著增强。工业智能机器人、智能装备等设备的普及,使数据采集效率大幅提升,毫秒级甚至微秒级的数据采集成为常态。例如,自动化生产线需实时监控设备运行数据以确保稳定性,宝钢与华为合作的热轧自然宽展预测模型已实现毫秒级预测控制。
(三)多模态融合
人工智能重构了工业制造形态,推动全流程、全价值链的互联互通。工业数据不再局限于结构化数据,图像、视频、音频等多模态数据大量涌现并深度融合。例如,科大讯飞的“工业六感”传感器模拟工人的“视听嗅味触思”感知能力,采集并分析多模态数据,为智能控制和决策提供支持。
(四)存储新要求
人工智能应用产生海量数据,对存储容量和模式提出了更高要求,促使分布式存储技术成为主流,且需满足高性能、高并发、高可靠和高可扩展性需求。例如,新能源汽车、化工和钢铁企业采用分布式存储技术,确保数据高效访问和流转。
(五)安全性要求高
工业数据涉及企业核心竞争力,需要严密保护。人工智能时代,数据投毒、模型越狱等攻击手段可能影响决策和装备运转,甚至引发安全事故。例如,危化品行业的模型决策失误、越狱攻击等问题可能导致泄漏甚至爆燃爆炸事故,航空航天企业则通过多重加密和访问控制确保数据安全。
二、工业数据行业管理现状
近年来,我国工业数据行业管理工作以统筹发展和安全为核心,从政策法规、标准建设、企业管理等方面综合施策,推动数据高质量发展与高水平安全的良性互动。
(一)政策法规逐步完善
《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规,为工业数据安全提供了基本法律框架。2022 年,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)出台,奠定了数据要素市场的基础制度体系。同年,工业和信息化部发布《工业和信息化领域数据安全管理办法(试行)》,细化国家工业数据安全管理制度。2023 年,财政部印发《企业数据资源相关会计处理暂行规定》,为企业数据资源的会计处理提供明确指导。2024 年,国家数据局等部门联合发布《关于促进企业数据资源开发利用的意见》,提出提升数据治理能力的要求;工业和信息化部发布《工业领域数据安全能力提升实施方案(2024—2026 年)》,体系化推动工业数据安全工作向纵深发展。
(二)标准建设稳步推进
工业和信息化部与国家标准化管理委员会联合发布《工业领域数据安全标准体系建设指南(2023 版)》,提出到 2026 年形成完备的数据安全标准体系 。目前已发布工业领域重要数据识别、安全防护等亟需的行业标准,并编制了工业数据资源目录和图谱。全国信息化和工业化融合管理标准化技术委员会(SAC/TC573)归口了 5 项工业软件行业标准,推动工业软件底层数据的打通和兼容。此外,行业数据管理能力成熟度评估工作也在逐步展开。
(三)企业数据管理水平逐步提升
部分企业重视数据安全管理,设立专门的数据安全管理部门或岗位,明确责任和权限,实施数据分类分级管理及相应的安全策略。工业和信息化部建立了工业领域重要数据和核心数据识别报备机制,基本摸清了重要工业行业数据底数,并构建了数据安全风险监测预警体系,持续提升行业数据安全风险防范和应对能力。通过政策引导和标准规范,一些头部企业数据安全管理逐步走向系统化、专业化。
虽然我国工业数据行业管理在政策法规、标准建设、企业能力等方面取得了一定进展,但仍面临政策落地难、标准不完善、企业能力不足、数据共享与隐私矛盾、技术创新与安全平衡难题以及行业协同不足等问题。未来,需进一步加强政策执行力度、完善标准体系、提升企业数据管理能力、探索数据共享与隐私保护的平衡机制,并推动行业协同与生态建设,以实现工业数据的高质量发展与高水平安全。
三、人工智能时代工业数据治理挑战
(一)数据治理难
工业数据治理面临两大难题。一是获取难,数据高度分散于企业内部,“数据孤岛”现象严重。企业 IT 资产种类繁多、来源多样、协议标准不统一,导致数据异构性问题突出,难以实现统一交换与共享。二是质量参差不齐,工业生产环境复杂多变,数据噪声和异常值较多,设备故障、传感器失效等问题导致数据缺失和不完整现象普遍存在。例如,汽车制造企业中,不同供应商提供的数据格式和标准各异,数据整合难度大,有效的数据清洗、标注和整合成为行业模型建设面临的主要挑战。
(二)数据确权难
工业数据确权问题复杂,既有一般数据确权的共性难点,也有工业领域的特殊性。数据的无形性、易复制性和流动性使其在传输、存储和使用过程中容易被非法复制、篡改或滥用,导致数据边界模糊、产权归属不清。此外,工业数据的生成、处理和使用涉及多个主体,各方在数据生产、流通和价值实现中的利益诉求不同,进一步增加了权利主体识别和界定的难度。数据确权技术尚未成熟,企业投入意愿不足,使得实际操作中数据确权更加困难。
(三)数据加工成本高
工业数据的专业性强,尤其在石油、化工、汽车、飞机等细分行业,数据标注难度大,专业标注能力供给不足。为满足大模型训练需求,企业需频繁组织行业专家进行数据标注,每次标注工作往往需要 20~30 位专家参与,成本高且效率低。尽管国内外人工智能企业正探索通过自动化工具与人工审核结合的方式降低标注成本,但整体成本压力依然较大。
(四)数据安全风险突出
(五)数据人才短缺
我国数据人才培养体系尚处于起步阶段,缺乏统一的培训、认证和考核评价标准,人才培养速度远落后于市场需求。据人社部测算,我国人工智能人才缺口超过 500 万;英国德勤发布的报告指出,我国数字人才总体缺口在2500 万至 3000 万。尤其在工业领域,既懂工业知识又具备数据分析和人工智能技术的复合型人才极为紧缺,严重制约工业数据治理和应用的发展。
(一)强化数据标准,推动专业化工业数据集建设
一是加快工业数据标准规范建设,围绕工业重点领域、典型场景和关键环节,制定数据资源管理、安全保障、基础设施建设和技术产品等相关标准,确保标准贴合高质量发展需求。坚持“急用先行”原则,强化标准推广应用,推动行业数据规范化管理。二是建设专业化工业数据集,整合工业领域专业知识库、互联网资源、书籍及合成数据等多方来源,系统化整理、存储和关联专家经验、操作规程等隐性知识,构建高质量工业数据集,支撑工业大模型的预训练和微调,推动数据汇聚、优化与应用。
(二)以企业数据资产化为核心,推动数据价值实现
数据价值实现需要经历资源化、资产化和资本化三个阶段,其中资产化是关键。通过数据入表,推动企业数据价值实现,具体步骤可参考如下:一是制定数据资产管理战略;二是明确数据资产定义和范围;三是建立数据治理框架;四是选择合适技术工具;五是优化数据管理流程;六是建立数据资产目录;七是推动数据资产价值实现;八是开展培训与文化建设;九是实施监控与持续改进;十是确保合规与审计。
(三)引导企业建立数据质量与安全管理体系
一是建立数据质量管理体系,推动企业构建数据质量驱动的治理机制,开展数据质量评估。支持化工、新材料等重点行业龙头企业贯通产业链,共建高质量数据集。深化仿真合成数据应用,解决数据稀缺和不平衡问题。二是建立数据安全保障体系,强化企业数据安全主体责任,以重要数据保护为核心,加强监测预警技术建设,针对数据流转的关键环节、人员和场景,实施有效安全措施,确保数据全生命周期安全。
(四)建设数据可信空间,推动数据共享流通
一是构建基于区块链的可信流通体系,探索可信工业数据空间建设,提升数据流通效率与安全性。发展高性能智能合约、多链组网架构、异构跨链交互等关键技术,推动区块链数据确权技术应用。二是建立数据模型分享机制,明确数据模型分享要求和激励措施,激发数据开放动力,释放数据模型应用价值,促进数据共享生态建设。
(五)强化国家产业安全,建立三大安全保障机制
一是建立工业模型(软件)安全保障机制,加强重要工业模型(软件)清单管理,开展安全性测试,提升供应链和生产系统安全稳定水平。二是打造工业数据安全保障机制,完善数据安全管理制度,制定重点行业数据识别、防护和出境等政策指引,持续开展“数安护航”“数安铸盾”专项行动,提升风险防范和应急处置能力。三是健全工业网络安全保障机制,实施工业互联网安全分类分级管理,强化工业控制系统网络安全防护能力评估,开展“铸网”实网演练,构建与新型工业化相适应的网络安全保障体系。
(六)加强数据复合型人才培养
一是在政府层面建设数字战略科学家队伍,培育数字领军人才,壮大数字技术工程师队伍,提升产业工人数字素养。二是在企业层面提升管理者数据洞察力和决策力,从业务、数据、AI 三个维度综合提升员工能力。三是在高校层面加强数字技术通识教育,推动数字技术专业学生深入产业,以解决实际问题为导向,培养数据复合型人才,为产业发展储备智力资源。
五、总结
高水平数据治理是“人工智能 + 制造”行动落实的关键,强化数据治理不仅有利推动人工智能更好地融入实体经济,同时对弥补算力短板,提升 AI 伦理和安全保障也有着重要意义。当前,人工智能时代的工业数据面临新特征和治理挑战,需引起高度重视,并通过综合施策加以解决。在此背景下,可通过强化数据标准、推动数据资产化、建立质量与安全管理体系、建设可信数据空间、完善安全保障机制以及加强人才培养等相关措施,推动制造业数据治理迈向更高水平,为产业数字化智能化转型提供坚实基础。
作者:王江平,第十四届全国政协委员、工业和信息化部原副部长,研究员级高级工程师。
来源:数字化转型期刊
上一篇: 矿用设备丨防爆标志解读
邮箱:suyuanxu@126.com
QQ:342897643
微信:suyuanxu
一、什么是数字化? 不同国家和不同行业,似乎对数字化转型有不同的定义。比如: 美国早在 2003 年
大数据和人工智能技术在数字经济时代的消费模式变革中扮演着极其重要的角色,都有什么,具体如下1. 精准
(来源:企业网D1net)全球37%的数字化转型项目以失败告终,研究显示,64%的项目缺乏明确路线图
违法和不良信息举报投诉电话:0377-62377728 举报邮箱:fbypt@ex12580.com