智能制造大数据平台是智能决策的基础平台。它由数据源、数据治理、数据建模、流计算和大数据应用组成。大数据平台建设应具备实时数据和事件捕捉、流数据处理技术、分析优化技术、预测分析等特点。
利用射频识别、嵌入式技术、无线通信、传感技术、总线通信等信息技术,通过多种传感技术手段采集分散的设计信息、生产信息、供应链信息、资源信息等,通过可靠的将PLM、ERP、MES、SRM、CRM等系统的数据整合到大数据中心。
结构化的业务数据从原业务系统的数据库中获取,智能制造运行过程中采集的文件、音频、视频、传感器数据、定位数据等信息由Hadoop分布式文件系统HDFS进行管理。
大数据平台管理着海量数据、种类繁多的数据。需要对这些数据进行整合,适时将数据存储在合适的介质中,实现对数据生命周期的管理。制定数据生命周期的管理策略,制定完整的备份和恢复策略,对数据进行分类,分层管理存储,根据数据类型确定存储策略。
数据集成ETL(Extract-Transform-Load)包括数据提取、清洗、转换和加载的过程。还提供数据质量管理、数据转换清洗、调度监控,贯穿数据中心解决方案的全流程。数据排序是建设数据中心的关键环节。它按照统一的规则整合和提升数据的价值,负责完成数据从数据源到目标数据中心的转换过程。
大数据平台应提供多种数据挖掘算法,包括分类、关联、分割等,并提供可用于在一次建模运行中尝试各种方法、估计和比较多种不同方法的自动建模技术。建模方法。通过这样的建模方法和算法模型设计,可以在智能制造的诸多领域挖掘大数据的价值。常见的模型包括聚类、决策树、回归模型、关联模型、线性规划、时间序列模型等。
建模完成后,绘制模型的评级量表,包括增益图、响应图、提升图、利润图和投资回报率图。对应的函数以交叉表的形式提供,用于评估模型的预测能力,比较一个或多个模型的不同预测值与实际目标值的准确性。
流式计算是一种新的计算模式,对于无处不在的移动设备、设备运行监控数据、位置服务、传感器等新的数据生产场景来说是不可或缺的。需要可扩展的计算平台和并行架构来处理生成的大量数据流。智能制造中会有大量的实时数据,比如产线数据、设备数据、传感器数据等。
如果我们使用传统的数据处理方法,往往需要数据的收集、整合、治理、存储、建模、挖掘和分析等一系列复杂的流程。然而,许多分析和决策需要实时做出以避免错失机会。例如,通过实时检测设备的工作状态数据,可以预测产品质量。使用实时流计算分析方法可以有效解决此类问题。
大数据平台需要采用流计算技术在几分钟到几小时的时间内从移动信息(数据流)中揭示有意义的模式。大数据平台通过为时间关键型应用程序提供低延迟洞察力和更好的结果来提供业务价值。可以合并多个流,使用户能够从多个流中获取新的价值信息。
大数据平台的建设要引入Hadoop架构来处理非结构化、海量数据的存储、检索和分析。Hadoop技术是经过验证的分布式解决方案,可以扩展到海量数据的分布式存储,解决海量数据(半结构化和非结构化)的存储和访问问题,并且该解决方案可以构建在低成本的机器集群上,提高性价比。
上一篇: 中国消费电子产销规模均居世界第一
违法和不良信息举报投诉电话:0377-62377728 举报邮箱:fbypt@ex12580.com