物联网环境下电力数据安全分级算法的研究
赵 明1,宋 驰1,王成化1,王华伟1,郭凯明2
(1. 国网安徽省电力有限公司滁州供电公司,安徽 滁州 239000)
(2. 中能博望(北京)科技有限公司,北京 102488)
作者简介:赵明(1964—),男,高级工程师,硕士,主要研究方向为电力系统规划,zhaom091@qq.com.
摘要:电力公司采用物联网技术可以便捷地采集大量的电力数据,提高电网的安全性。针对电力管理数据安全分级的现状,提出了混合特征分级算法,用于电力数据的安全分级,基于词频参数的改进特征项降维方法,降低文本的噪声,并结合优化的支持向量机模型,提高分类算法的准确率,实现电力数据的自动化和智能化安全定级。对比实验结果表明,提出的算法对比经典的数据分类算法,准确率在80%以上,极大地提高了分类的准确率。
关键词:物联网;数据安全分级;混合特征分类算法
中图分类号:G807.01 文献标识码:A 文章编号:2095-509X(2021)04-0052-05
随着电力公司对电力物联网建设的全面推动,数据中台建设的有序进行,各类数据的“融汇贯通”,跨业务、跨系统的数据“广泛共享”已基本形成,数据作为资产将逐步面向全公司、全社会开放应用[1]。在数据共享过程中,如何保障数据安全、提供高效的数据算法模型就显得尤为重要。目前,各行业纷纷开展了数据安全和隐私保护的深入研究,国内外针对电力数据的安全也进行了加密、脱敏、防泄漏等方面的研究[2-3],但是对于数据安全分级的技术研究尚未深入,运用自然语言处理技术开展电力数据安全分类分级研究还比较欠缺。电力数据量庞大,人工形式逐字段进行数据安全定级效率太低,且误差较大,借助数据安全分级工具可实现自动化或半自动化的安全等级划分,极大地减少人工工作量,同时可避免人为操作的主观性和不稳定性。
基于此,本文提出了基于词频参数的改进特征项降维方法,降低文本的噪声,并结合优化支持向量机模型,提高分类算法的准确率,建立了数据安全分级术语库,开发了数据安全定级工具,实现电力数据的自动化和智能化安全定级,并通过实验论证了本文算法具有较高的准确率,且分布均匀性明显增加,可以有效解决数据分析及安全分级存在的性能和效率问题,指导数据共享,促进数据管理水平持续提升。
1 物联网智能电力数据采集系统
首先采用智能传感器获取电网的数据,为后续安全分级提供数据支撑。使用物联网技术将具备智能判断与自适能力的能源统一入网络,采用智能电表作为物联网三层架构中的核心感知层获取电力负荷参数,测量传感器、电流互感器及电压、电流采集芯片采集电网和用户信息以及各类电力参数信息,对电网信息的实时采集可达到秒级,采集的数据通过网络层的无线传输网络、专用网、互联网进行传输,提供给表现层进行数据的分类分级和可视化展示。物联网电力数据采集系统架构如图1所示。 |