您的位置：主页 > 论文范文 > 经济论文 > 正文

大数据挖掘风险评估研究

作者：admin 来源：未知日期：2020-11-27 08:29人气：

　　摘要：随着网络数据体量的增加，AI图景中隐含的风险因素增多，加重了AI图景的使用风险，威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则，当数据体量不断上涨时，其风险等级评估结果严重脱离实际，因此研究AI图景下，基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘，获取风险因素动态关联规则；利用云模型，粒化AI图景；根据评估矩阵，评估AI图景的使用风险。实验证实数据体量不断增长条件下，此次研究方法的风险评估结果，与给定结果一致。可见此次研究的风险评估方法，可用来测量AI图景的使用风险。

　　关键词：AI图景；大数据挖掘；风险评估；动态关联规则

　　现阶段我国提出“新一代人工智能发展规划”，并在第十三届全国人大一次会议政府工作报告中指出，“做大做强新兴产业集群，实施大数据发展行动，加强新一代人工智能研发应用”。可见在网络科技创新发展背景下，人工智能技术的发展越来越受到国家的关注。人工智能技术全称为ArtificialIntelligence，是根据人脑思维模式创建的一项机器智能技术，但随着人工智能技术的不断优化升级，AI图景下，各行各业都将该技术应用到企业发展中，通过提升高工作效率、降低决策成本等，进一步调整企业生产与项目管理。但AI图景发挥强大功能的同时，也带来了巨大的风险，例如人工智能技术构建AI图景时，需要智能采集基本数据，侵害了企业的数据产权；黑盒疏漏打破了大数据平衡等等[1]。因此针对现阶段的问题，传统方法根据文献[2]中的部分内容，将风险程度分为无风险、一般风险、中度风险以及重度风险，结合贝叶斯网络，建立了基于多状态贝叶斯决策树的风险评估模型，用来评估AI图景下的风险因素[2]。但随着网络信息体量的不断增加，该评估方法出现了不适用的问题，因此在AI图景下，研究基于大数据挖掘的风险评估方法。大数据挖掘就是从大规模异构或多源数据中，找出其中隐藏的风险因素，或识别风险因素之间的关联特征，再通过计算评估风险程度，为目前海量的网络数据，提供更加可靠的评价结果。

　　1AI图景下基于大数据挖掘的风险评估方法

　　1.1基于大数据挖掘获取风险因素动态关联规则

　　一般意义上来说，风险因素关联规则是静态的和永恒有效的，但是当前社会的大环境在变化，人们的需求也在不断改变，风险因素的静态关联规则，已经是过去的风险评估基本条件，此次研究根据目前的变化特征，引入支持度向量和置信度向量，通过大数据挖掘结果，描述规则在时间变化下的动态特性。大数据挖掘算法，将动态关联规则进行定义：现阶段的风险因素动态关联规则，是描述AI图景数据自身特性随时间变化而改变特性的关联规则。因此假设在t时间段内，AI图景下基于大数据挖掘的风险评估研究王伟（河南工业贸易职业学院信息工程系，河南郑州，451191）摘要：随着网络数据体量的增加，AI图景中隐含的风险因素增多，加重了AI图景的使用风险，威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则，当数据体量不断上涨时，其风险等级评估结果严重脱离实际，因此研究AI图景下，基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘，获取风险因素动态关联规则；利用云模型，粒化AI图景；根据评估矩阵，评估AI图景的使用风险。实验证实数据体量不断增长条件下，此次研究方法的风险评估结果，与给定结果一致。可见此次研究的风险评估方法，可用来测量AI图景的使用风险。关键词：AI图景；大数据挖掘；风险评估；动态关联规则获得事务数据集A，然后根据需要，将时间段t分割为n个不相交的时间序列，即{}12,,,nt=ttt，用{}12,,,mI=iii，表示项的集合。再将数据集A划分为n个不相交的数据子集，即{}12,,,nA=AAA，此时可以说数据子集(1,2,,)iAi∈n的数据，是在(1,2,,)iti∈n时间段内收集到的。假设X、Y表示非空项集，且X、Y均属于集合项的集合I，则关联规则可用X⇒Y表示。该规则同时具有支持度和置信度[3]。令支持度()Ac=PX∪Y，表示两个项集在A中同时出现的概率；令置信度(|)As=PYX，表示项集X在A中某一事务集出现的情况下，该事务集同时也出现项集Y的概率。根据上述参数，确定风险因素动态关联规则的表达式为X⇒Y(C,S,c,s)，其中C表示支持度向量；S表示置信度向量。则该规则的频数向量计算表达式，如下所示：在数据子集(1,2,,)iAi∈n中出现的频数。因此大数据挖掘算法，按照下列步骤挖掘整个动态关联规则：找出频繁项集F，并计算其相应的频数向量H；根据频繁项集F，再次扫描AI图景生成数据库，产生动态规则，且根据H产生向量C和向量S。由于大数据的特征之一就是价值密度低，因此大数据挖掘算法通过两阶段挖掘的形式，计算节点间的动态负载均衡，以此实现对风险因素动态关联规则的挖掘。

　　1.2粒化AI图景

　　云模型是大数据挖掘中一个计算型模型，可以揭示风险因素的模糊性与随机性之间的关联，因此通过云模型粒化AI图景。假设定量论域用D表示，G是定量论域的定性概念，若定量值α∈D，且α是定性概念的一次随机实现，那么α对G的确定度为λ(α)∈0,1，表示有稳定倾向的随机数，即λ:D→0,1，∀α∈D，α→λ(α)，此时在论域D上的分布，就是云模型，每一个α为一个云滴。利用期望Eα、熵En以及超熵Ge的特征，反映定性概念G整体上的定量特征。使用云模型粒化AI图景，就是使用逆向云发生器，从数据集中得到反映定性概念的数字特征集，该集合可表示为{(Eα,En,Ge)}，利用该集合将图景划分为n个粒。利用云模型分割具有不同风险AI图景，得到每个图景对应的一个粒，根据该粒以推广的方式，评估风险指数。1.3风险评估根据粒化后的AI图景，建立判断矩阵，进行AI图景使用稳定性风险评估。该判断矩阵的部分参数，K表示图景使用稳定性风险；U1、U2、U3、U4分别表示机制风险、社会用户风险、图景生成风险、环境影响风险；uij表示指标Ui比指标Uj重要的程度量化值。该判断矩阵中，uii=1；uji=1/uij，且uij>0。根据上表1中的数据，制定所有影响AI图景的风险因素的判断矩阵，并计算所有判断矩阵的最大特征值和对应的特征向量，通过归一化得到判断矩阵的权重向量，该权重用ijω表示。假设最大特征值为maxϕ，则一致性指标的计算结果为：由于风险因素具有多样性、复杂性等特征，因此只依靠上述指标，判断图景使用稳定性风险K时，还具有一定的片面性，因此利用平均随机一致性指标RI，来弥补一致性指标的不足。用一致性指标CI比上平均随机一致性指标RI，得到的一致性比率用CR表示。当CR<0.1时，则判断矩阵通过一致性检验；当CR≥0.1时，说明判断矩阵未通过一致性检验，需要重新调整判断矩阵。根据确定的评估矩阵，执行评估工作。至此在AI图景下，实现基于大数据挖掘的风险评估。

　　2对比实验

　　设置此次研究的风险评估方法，为实验组；传统方法为对照组。搭建仿真实验平台，利用仿真测试软件,模拟海量信息生成的AI图景存在的风险程度。分别利用上述两个测试组，测试数据体量动态变化下，AI图景中隐含的风险指数，结果如图1所示。根据图中的风险评估结果可知，当数据体量在100GB时，两种方法的风险评估结果极为相近。当数据体量分别为5000GB、10000GB以及100000GB时，实验组的风险评估结果，与表3中给定的数据近似；而对照组对含有3组海量信息的图景，其风险评估结果均在0.3~0.4之间，当数据体量增加到10000GB、100000GB时，风险评估结果的变化非常微弱。表1为两个测试组的风险等级评估结果。根据表中的数据可知，虽然实验组的风险指数评估结果，没能与给定结果完全一致，但高度近似的评估结果，可以认为实验组方法评估可靠，其得到的风险等级，也与给定数据一致。而对照组的风险指数评估结果，只有前两组与给定结果近似，后两组评估结果完全失真，因此最终得到的风险等级，也完全错误。可见实验组评估结果更加贴合实际。

　　3结束语

　　此次研究的风险评估方法，经过实验论证后，得到了较高的评价，但受个人能力以及研究经验限制，还存在一些不足之处，今后的风险研究工作中，可以对大数据挖掘算法进行改进，进一步优化关联规则获取方式，使得到的评估数据，更能体现AI图景基本现状，为国家AI技术的发展与应用，提供性能更好的评估方法。

　　参考文献

　　[1]蒋洁.AI图景下大数据挖掘的风险评估与应对策略[J].现代情报,2018,38(05):147-151.

　　[2]杨建华,周震宇,奚洪磊,等.基于数据挖掘的继电保护系统风险评估模型[J].信息技术,2018,42(07):60-64.

　　[3]李珏,李世杰.基于文本挖掘的高处坠落事故致因及关联规则分析[J].长沙理工大学学报(自然科学版),2020,17(02):61-67+74.

　　作者：王伟单位：河南工业贸易职业学院信息工程

上一篇：地方区域性金融风险分析
下一篇：饲料行业经济现状及未来前景分析

栏目分类

热门排行