基于粗糙集的首台套重大装备信息系统数据挖掘关键技术研究
朱柏青1,赵红2,何非2
(1.南京工程学院 经济管理学院,江苏 南京211167 )
(2.南京理工大学 机械工程学院,江苏 南京210094)
网络化项目信息管理过程中产生大量异构数据,采用传统方式对此类数据集进行分析和处理往往存在特征提取不充分、数据疏漏等问题。面向首台套重大装备信息系统项目管理数据关键技术研究,构建了结构化数据收集和规则的提取方法,并应用粗糙集理论和算法进行数据挖掘分析,提出了若干决策规则,可为项目评价和管理辅助决策提供依据。
随着企业网络信息、装备技术的不断发展,现代制造业特别是高端装备制造管理积累了大量的历史数据,这些数据中蕴含着对生产制造和装备管理具有很高价值的知识和信息,同时隐藏着为首台(套)重大装备的认定管理提供决策依据的信息。
各种网络技术的应用使得信息共享成为当前提高工作效率的有效途径,无纸化办公及各种数据、文档的电子化,在方便办公的同时也产生了极其庞大的电子数据,随着时间的推移,数据也不断产生混乱与冗余[1],想要从中及时找出所需要的各种信息成为一件大费周折的事。而政府部门作为信息的主要掌控者,面临着如何科学有效地处理这样庞大数据的问题。就目前江苏省内首台(套)重大装备申报管理项目的数据而言,由于其管理信息的广泛性、复杂性使得数据具有如下特点:
a.多维性。由于重大装备管理信息是源自江苏省范围内不同区域的装备制造企业的不同年份的数据资源,因此这些数据具有时间和空间属性。
b.数据类型的多样性[2]。随着网络信息技术的不断发展,首台套重大装备申报管理数据也产生了大量不同的数据类型,并进行数字化存储。现有的数据中包含由数字值或字母值的字段组成的表格、单据等结构化数据;由申请报告、Web文档构成的半结构化数据;由多媒体记录的可视化文件,如录像等形成的非结构化数据。这些数据有2种出口,一种是从数据走向数据垃圾;另一种是从数据走向信息并最终形成知识。
c.多源性。现有的数据资源来源不同,有来自之前的历史材料,有手工录入的数据,还有来自各地方经信部门汇总的EXCEL表等,数据获取方式不同,统计方式不同,描述形式不同使得数据之间存在着很多差异。
这些问题的存在,使得在现有数据状况条件下想要及时获取所需信息的难度越来越大。针对以上问题,利用数据挖掘工具,对各种数据进行分析处理,提取用户所需的关键信息。首先搜集数据,对数据进行整合分析处理,然后通过建模挖掘,挖掘出相关的信息,为用户评价项目的决策制定提供辅助支持。使得系统具有良好的决策支持能力,又有良好的交互能力[3],从而使得重大装备的推广应用与相关决策的制定更为高效。
1数据挖掘
数据挖掘是一个多阶段递进的、循环往复的、......
作者简介:朱柏青(1963—),女,湖北荆州人,南京工程学院副教授,主要研究方向为制造业信息化。
(文章来源《机械设计与制造工程》如需详细资料请联系江苏机械门户网025-83726289) |