工业大数据是指工业设备在生产过程中所产生的大量多样性的数据,其因物联网而广为人知。工业大数据因2012年“工业4.0”概念的出现而被重视,旨在以工业设备产生的数据为基础,通过大数据技术进行处理并且挖掘出更多的商业价值。
01 工业大数据的特点
工业大数据利用工业网络技术对原始数据进行处理,为管理决策提供依据,达到降低维护成本、改善客户关系的目的。
大数据一般具有3V的特点,即Volume(大量)、Velocity(高速)、Variety(多样),因此其以传统工具难以处理,只能采用新的策略进行存储分析等。而工业大数据则还有其自己的两个V。一个是visibility(可见性),即需要发现对现有资产和生产过程难以察觉的见解,并且以数据形式变为可见;另一个则是Value(价值),由于行业面临的风险及影响差异,工业大数据被要求有更高的精准度,否则其价值将会大打折扣。
工业大数据相比其他大数据来看,其结构化数据更多,相关性和实时性更强,也更易于分析。这是因为工业数据普遍是由自动化设备在生产过程中产生的,其环境和操作受到人为因素影响较小,不会产生太多不可控因素。
工业大数据的分析更侧重于关系挖掘和现象捕捉。一般来讲,工业大数据可以在现象中提取出的特征会涉及诸多的物理学科等问题,有效的分析将会比普通大数据涉及的知识领域更为宽泛,其分析困难程度可见。
另外,其数据驱动分析系统需要从不同的工作条件中获取数据。但是在不同来源获取的数据存在离散和非同步的问题,因此需要预处理以保障数据的完整性、连续性和同步性。
02 工业大数据的挑战
工业大数据还面临质量差的难关。通常大数据分析的重点在数据挖掘,以数据的量来弥补数据的质缺陷。可是工业大数据中,变量通常具有明确的物理意义,数据完整性对于分析系统至关重要,低质量的数据可能彻底改变两个变量间的关系,对于高精度的分析可能造成灾难性的影响。
其与传统商业智能不同,传统BI的处理工作主要集中于数据内部的结构化,并且定期进行周期性处理即可。而工业大数据的分析系统则要求达到实时分析和可视化处理结果。
鉴于这些特点的存在,工业大数据并不能简单的移植普通大数据的分析技术直接使用。工业大数据需要采用的是对于相关领域知识更了解,分析系统功能定义明确,分析速度快并且可以提供更明确的分析策略的大数据分析手段。
03 工业大数据的技术
工业大数据的不断增加为其后续处理工作制造了麻烦。由于自动化工业设备的不断增多,工业大数据产生的速度和数量都在暴涨,这对大数据的存储和管理的基础设施形成挑战。
其次应当建立适当的数据管理系统。工业大数据的存储需要能够处理大量数据并且做到实时分析,以便于迅速为决策提供支持,为了提高速度,这就需要存储、管理和处理更为集成化。这对数据存储基础设施有较高要求,需要在能够处理高速度、高数量的数据流的同时进行数据分析,这一步将会是未来工业大数据行业的核心和基础。
信息物理系统(CPS,Cyber-Physical Systems)也是工业大数据的核心技术。信息物理系统是计算进程和物理进程之间无缝集成的系统。与传统操作技术有着明显不同,工业大数据需要在更广泛的角度来进行决策,其核心部分在于设备状态。重点在于5C架构(Connection,Conversion,Cyber,Cognition,Configuration,即连接,转换,网络,认知,配置)。该架构意为将原数据传输并转换为可操作信息,利用分析洞察数据,最终通过知情决策改进流程。这一步将会进一步提高生产力降低成本。
在工业系统中,每时每刻都在由不同设备产生大量的数据。每一条流水线大量的机械会产生不同的数据样本,例如波音787每天航班都会产生超过5TB的数据,工业系统所产生的数据远远超过了传统方法的处理能力,因此对于管理和处理都构成了极大的挑战。
为了应对这一挑战,企业和研究人员都在收集、统计、存储和分析工业大数据集方面做出了努力,将一些数据集公布用于科研。不过即便如此,工业大数据所面临的压力依然巨大。但是,工业大数据是未来工业4.0和物联网的核心技术之一,工业大数据的发展提高生产水平的必要环节。
麦可思致力于利用大数据、物联网、区块链等技术,构建工业B2B数字科技平台,为工业中小企业提供线上化集采、供应链数字科技服务以及工业园区数字化,助力工业产业集群的发展和企业数字化的转型升级。