智能制造背景下工业大数据的数据质量控制探讨 段〓成 (北京神舟航天软件技术有限公司,北京〓100094) 摘要:随着智能制造新时代的到来,工业大数据应用作为企业创新与变革的重要驱动力日益受到重视,然而及时、可靠、准确的高质量数据是工业大数据发挥效能的前提条件。首先梳理了工业大数据的基本特征及面临的数据质量问题,然后研究分析了工业大数据质量控制方法,最后对中国工业大数据质量控制的重点工作方向提出了初步建议。 关键词:智能制造;工业大数据;数据质量;质量控制 中图分类号:TP311〓文献标识码:A〓文章编号:2095-509X(2018)02-0013-04
近年来,随着制造业信息化和工业化的不断融合,我国迎来了以智能制造为主体的新一轮工业革命。制造业是增强国家综合国力和国际竞争力的根本保障,世界制造强国纷纷加快智能制造战略布局和规划,无论是德国提出的“工业4.0”战略,美国提出的“工业互联网”,英国提出的“制造2050”计划,法国提出的“新工业法国”战略,日本提出的“智能制造系统”国际合作计划,还是我国提出的实施“中国制造2025”行动计划,它们的主要特征都是基于CPS(cyber physical systems)实现对人、机、物的实时状态的全面感知,对海量异构的工业现场数据和信息进行智能分析并处理,推动制造业向基于工业大数据分析与应用智能化的产品需求、设计、制造、销售及服务的转型。 工业大数据是智能制造的引擎,蕴含着巨大的经济社会价值。麦肯锡报告认为:大数据能够帮助制造商提高设计和生产效率,降低缺陷和返工,更好地满足客户需求和进行有效的营销。以波音公司飞机系统为例,波音737发动机在飞行过程中每30min就能产生10TB数据,这些数据被有效用于故障诊断和预测。工业大数据是由工业领域信息化应用所产生的海量数据组成。制造业的工业大数据来源涉及产品全生命周期的需求设计、原材料采购、生产制造、仓储物流、销售售后、报废回收等环节,包括传感器、工控系统、MES(manufacturing execution system)、ERP(enterprise resource planning)、CAX(computer-aided technologies)、PDM(product data management)、SCM(supply chain management)、CRM(customer relationship management)等相关工业信息化应用,数据的多源和类型的多样性导致数据情况十分复杂。由于采集系统缺陷、链路问题、硬件故障、模型参数错误、人为因素等主客观原因造成了数据质量问题不可避免地广泛存在,而低劣的数据将导致大数据分析出现偏差,可直接导致生产事故或错误决策,给企业经营发展造成不利影响。拥有高质量的数据是发挥工业大数据效能的前提条件,只有从高质量数据中挖掘出隐含的、有用的信息,才能更好地为企业的经营决策服务。数据质量控制是工业大数据分析应用的关键问题之一。
1〓工业大数据特征及其数据质量定义 1.1〓工业大数据的特征 智能制造背景下的工业大数据呈现典型的大数据“4V”特征,具体表现在以下4个方面:第一,数据量大(volume)。随着设备感知数据的广泛接入,一些企业的数据量甚至可达到EB级别。第二,高速生成(velocity)。设备高速运转,数据产生和采集频率(如机床的输出功率、动态切削力、主轴振动、扭矩等)可达到毫秒级。第三,模态多样(variety)。工业大数据的类型丰富多样,涉及结构化(如产品开发、人财物、产供销、客户及用户等)、半结构化(如HTML页面、XML文本、报表等)及非 结构化(如工况、文档、图形、音视频等)数据。......
基金项目:国家科技支撑计划资助项目(2015BAF32B01) 作者简介:段成(1985—),男,江西九江人,北京神舟航天软件技术有限公司工程师,博士,主要研究领域为智能制造、工业大数据、云计算等。
(文章来源《机械设计与制造工程》杂志如需详细资料请联系江苏机械门户网客服QQ:2980918915,电话025-83726289)
更多关注,请扫码
|