当前位置:主页 > 经济论文 > 技术经济论文 >

人工智能风险分析技术研究进展

发布时间:2021-02-11 19:29
  目前基于深度学习模型的预测在真实场景中具有不确定性和不可解释性,给人工智能应用的落地带来了不可避免的风险。首先阐述了风险分析的必要性以及其需要具备的3个基本特征:可量化、可解释、可学习。接着,分析了风险分析的研究现状,并重点介绍了笔者最近提出的一个可量化、可解释和可学习的风险分析技术框架。最后,讨论风险分析的现有以及潜在的应用,并展望其未来的研究方向。 

【文章来源】:大数据. 2020,6(01)

【文章页数】:13 页

【部分图文】:

人工智能风险分析技术研究进展


文献数据集中的数据表示例

框架图,风险分析,框架,风险


图1 文献数据集中的数据表示例以实体解析为例,其需要把任一候选记录对标为“匹配”或“不匹配”。规则是一种常见的而且容易被人类理解的知识,因此笔者提出以规则的形式来表达风险特征。具体地说,首先设计能衡量属性值的相似度以及差异度的基本指标,然后在带有真实标签的记录对集合上,以这些基本指标为输入特征,通过生成单边随机森林来获得具有可解释性、高区分度和高覆盖率的规则,得到的规则即风险特征。需要指出的是,单边随机森林中的每一棵树都是单边决策树。传统的双边均衡的决策树用于判定实例的标签,因此其生成的规则有双向的指示作用。例如,在文献数据集上,“EditDistance(r1i[title],r2j[title])>0.9→equivalent(r1i,r2j)”作为一个标记规则,其含义如下:如果两条记录r1i和r2j在标题这个属性上的编辑距离相似度大于0.9,那么,这两条记录表示同一篇文章;否则,这两条记录表示不同的文章。与此不同的是,作为风险特征的规则仅具有单边的指示作用。例如,在文献数据集上,规则“r1i[year]≠r2j[year] →inequivalent(r1i,r2j)”是一个有效的风险规则,因为当两个记录在年份这个属性上的值不一样时,它们表示不同的文章的概率较大。然而,其并不适合作为一个标记规则,因为即便两个记录在年份这个属性上的值一样,它们也很有可能表示不同的文章。

示例,风险分析,人工智能,机器学习


4 风险分析的应用风险分析技术不仅可以直接用于评估人工智能算法所作决策的风险,进行风险的根因解释,保障人工智能的安全,还可以用于众包的问题选择和分类的质量控制等任务。另外,风险分析为理解机器学习和人工智能提供了独特的分析视角和手段,潜在地可以影响机器学习的几乎每一个核心环节,包括训练数据的主动选择以及模型的训练等。本章讨论风险分析的一些初步应用以及其潜在的更广泛的应用,并通过它们展望风险分析未来的研究方向。


本文编号:3029593

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jiliangjingjilunwen/3029593.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户31500***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com