工业大数据时序数据存储安全预警研究 刘倍雄,张毅,陈孟祥 (广东环境保护工程职业学院机电工程系,广东 佛山 528216) 摘要:为提高工业大数据背景下工业大数据时序数据(IBDTSD)存储的安全性,研发了IBDTSD存储安全预警系统。该系统分为Hadoop分布式存储子系统与资源管理子系统。资源管理子系统管理IBDTSD系统中的所有部件配置,而Hadoop分布式存储子系统则为IBDTSD存储安全监测的功能实现系统,该系统主要由数据采集与处理模块和异常诊断模块构成,根据最小二乘支持向量机算法,完成IBDTSD存储安全异常检测。结果表明:文中设计的系统进行IBDTSD存储安全预警的均方根误差和平均相对误差都小于其他两种系统,说明文中设计的系统预警误差小、泛化能力高;且当时间序列高于30后,系统的预警检测值与实际值趋于相同,说明时序数据越大,时序数据存储安全检测越精确。同时经过多次实验,确认系统的安全预警时延均值为0.02s,预警效率较高。 关键词:工业大数据;时序数据;存储;安全预警;异常检测;支持向量机 中图分类号:TP273 文献标识码:A 文章编号:2095-509X(2019)05-0062-05
随着大数据时代的快速崛起,时序数据存储技术被广泛地应用在电力和金融等领域中。工业大数据时序数据(industrial big data time series data,IBDTSD)存储安全预警问题正逐渐成为现阶段相关领域关注的重点问题。文献采用超前安全预警方法实现能源互联网中大数据和能源安全运行,但SVM(support vector machine,支持向量机)算法在重构大规模数据样本时,耗费的内存较多,时间较长,预警误差较大;文献根据事故隐患预警系统,统计企业全部历史隐患数据,并进行预警,但耗费时间长,预警效率低下;文献提出用垂直数据格式挖掘算法对企业隐患进行预警,但仅能预警高维隐含数据,具有一定的局限性。 针对上述存在的问题,本文结合最小二乘支持向量机算法完成IBDTSD存储安全异常检测,通过建立IBDTSD存储安全预警系统,实现准确、安全预警。
1 IBDTSD存储安全预警系统设计 1.1 系统整体结构设计 IBDTSD存储系统包含资源管理子系统与Ha doop分布式存储子系统。资源管理子系统通过虚拟化层中的虚拟机和CentOS实现工业大数据的存储控制,对物理层中服务器和存储器存储的工业大数据进行分析,并采用以太网络实现工业大数据传输。Hadoop分布式存储子系统位置设定在资源管理子系统配置的虚拟机池里,其数据采集与处理模块负责采集和处理时序数据,并将处理后的数据传输到异常诊断模块中,由异常诊断模块检测该存储数据中是否存在异常,对检测出的异常信息进行报警,实现准确、安全预警。系统整体结构如图1所示。
图1 系统整体结构图
1.1.1 数据采集与处理模块设计 数据采集与处理模块对不同区域里的工业时序数据进行实时采集,并把采集到的实时数据变换为可加载的格式传输至异常诊断模块诊断后进行安全预警。
基金项目:2015年广东省高等学校优秀青年教师培养计划资助项目(YQ2015237);广东省教育厅重点平台和重大科研项目——特色创新类项目(自然科学) (2017GKTSCX042);2017年佛山市科技局科技计划项目(2017AB004072) 作者简介:刘倍雄(1983—),男,高级工程师,硕士,主要研究方向为软件技术、环保大数据,1783146750@qq.com.
|