资源受限下的网络安全动态博弈模型
鄂小松1, 石峻松2
(1.树蛙信息科技(南京)有限公司,江苏 南京 210033)
(2.南京信奥弢电子科技有限公司,江苏 南京 210039
作者简介:鄂小松(1976—),男,工程师,硕士,主要研究方向为网络安全,jinququ73@163.com.
摘要:针对网络安全中攻防冲突双方信息获取不完整问题,在假定总资源受限的情况下,建立了网络攻防对抗博弈模型,提出了一种求解纳什均衡及代价函数的算法。通过案例,分析并验证了模型中纳什均衡的存在性及有效性。该方法可为不完全信息、资源受限情况下博弈过程策略选择问题提供借鉴。
关键词:网络安全;动态博弈论;贝叶斯纳什均衡;代价函数
中图分类号:TP393 文献标识码:A 文章编号:2095-509X(2020)12-0121-04
一般情况下,网络中攻防双方的对抗过程符合博弈论各项特征,因而可将博弈论引入解决攻防双方策略抉择问题。在实际对抗中,由于攻防双方知之甚少,因此在网络攻防冲突时会产生不完全信息问题。为有效解决不完全信息下的博弈问题,国内外学者进行了大量研究。Harsanyi[1]提出用贝叶斯纳什均衡解来解决静态博弈论中不完全信息问题。针对动态博弈论领域,通常的解决方法包括完美贝叶斯均衡[2]和序贯均衡[3]两种方法。对于有限动态不完全博弈过程,序贯均衡总能得到混合策略,然而对于完美贝叶斯均衡方法,其计算过程较为复杂。Nayyar等[4]在假设动态随机非零和博弈状态和观测方程是线性的且初始随机变量为高斯随机变量的前提下,利用求解线性方程组序列,提出了公共信息马尔科夫完美均衡计算方法。该方法的关键是将初始不完全信息下的博弈过程转化为一个完全信息下的虚拟博弈过程以及众多不同的或者更大的状态/动作空间。然而该方法无法对攻击者的策略集和效用函数进行差异性分析,且建模过程复杂。此外,为提高随机博弈过程状态观测及动作策略选取效率,Cole等[5]将具有惩罚函数的第三方观察者引入系统,且为每一个对抗参与者赋予私有信息观测状态。模型中每个参与者状态置信度仅依赖于当前状态而不依赖其策略,这种假设使得每个参与者当前策略选取受过去私有观测状态影响,严重时,策略选取将会产生较大偏差。
国内也有不少学者将博弈论引入网络信息安全领域。刘荣等[6]将信息安全中攻防冲突双方的收益进行量化,建立了对抗双方的博弈矩阵,同时将演化博弈理论引入冲突模型,求解攻防双方对抗过程中网络动态微分方程。在MATLAB中对网络攻防双方对抗过程进行了策略稳定性分析,通过5组均衡解验证了模型的准确性与有效性,然而在建模过程中假设攻防双方处于理想化背景,导致在计算对抗双方博弈冲突过程时,缺乏一定的现实基础。朱建明等[7]结合网络对抗攻防双方效能函数,基于系统动力学方程建立了不完全信息下具有自主学习机制的网络对抗演化博弈模型,并对模型进行了仿真,验证了引入第三方动态惩罚策略的非合作演化博弈过程纳什均衡的存在性与唯一性,然而建立模型过程中没有考虑计算资源受限情况。
综上,为了解决获取信息不完全以及计算资源受限情况下的网络安全问题,本文通过量化信息获取机制及资源受限条件,建立了网络安全中攻防双方动态博弈过程方程,并给出了纳什均衡及代价函数的计算过程。 |