融合多特征的TextRank藏文文本关键词抽取方法研究
发布时间:2021-02-11 21:38
[目的/意义]旨在为提升藏文文本关键词的抽取效果提供参考。[方法/过程]分析中英文文本关键词抽取方法的特点和存在问题,针对藏文文本特点,提出一种融合多特征的TextRank关键词抽取方法,通过实验获取不同特征的相对最优权重系数,并将权值计算公式应用于TextRank的初始权值与转移概率的计算中。[结果/结论]该方法通过融合藏文文本的结构特征以及词语之间语法关系等关键词提取影响因素,实现了候选关键词的量化权值,相比于传统方法关键词抽取效果有明显提升,同时证明融合结构特征与语法特征能有效改善TextRank算法的性能。
【文章来源】:情报探索. 2020,(07)
【文章页数】:6 页
【文章目录】:
0 引言
1 相关研究
2 研究方法
2.1 词图构建
2.2 特征构建
2.2.1 位置特性
2.2.2 词性特征
2.2.3 分布特征
2.2.4 语义特征
2.3 转移矩阵计算与关键词抽取
3 实验结果与分析
3.1 实验数据
3.2 参数确定
3.3 实验结果分析
4 结语
【参考文献】:
期刊论文
[1]融合多特征的TextRank关键词抽取方法[J]. 李航,唐超兰,杨贤,沈婉婷. 情报杂志. 2017(08)
[2]学术文本的结构功能识别——在关键词自动抽取中的应用[J]. 方龙,李信,黄永,陆伟. 情报学报. 2017(06)
[3]词向量聚类加权TextRank的关键词抽取[J]. 夏天. 数据分析与知识发现. 2017(02)
[4]词向量与LDA相融合的短文本分类方法[J]. 张群,王红军,王伦文. 现代图书情报技术. 2016(12)
[5]中文事件抽取研究文献之算法效果分析[J]. 吉久明,陈锦辉,李楠,孙济庆. 现代情报. 2015(12)
[6]面向Web的藏文文本分词策略研究[J]. 艾金勇,陈小莹,华侃. 图书馆学研究. 2014(21)
[7]基于多特征融合的中文文本关键词提取方法[J]. 张建娥. 情报理论与实践. 2013(10)
[8]基于主题特征的关键词抽取[J]. 刘俊,邹东升,邢欣来,李英豪. 计算机应用研究. 2012(11)
[9]基于信息增益与信息熵的TFIDF算法[J]. 李学明,李海瑞,薛亮,何光军. 计算机工程. 2012(08)
[10]基于词汇链的关键词自动标引方法[J]. 李纲,戴强斌. 图书情报知识. 2011(03)
硕士论文
[1]基于信息融合的Web信息可信度研究[D]. 罗庆平.中南大学 2014
本文编号:3029747
【文章来源】:情报探索. 2020,(07)
【文章页数】:6 页
【文章目录】:
0 引言
1 相关研究
2 研究方法
2.1 词图构建
2.2 特征构建
2.2.1 位置特性
2.2.2 词性特征
2.2.3 分布特征
2.2.4 语义特征
2.3 转移矩阵计算与关键词抽取
3 实验结果与分析
3.1 实验数据
3.2 参数确定
3.3 实验结果分析
4 结语
【参考文献】:
期刊论文
[1]融合多特征的TextRank关键词抽取方法[J]. 李航,唐超兰,杨贤,沈婉婷. 情报杂志. 2017(08)
[2]学术文本的结构功能识别——在关键词自动抽取中的应用[J]. 方龙,李信,黄永,陆伟. 情报学报. 2017(06)
[3]词向量聚类加权TextRank的关键词抽取[J]. 夏天. 数据分析与知识发现. 2017(02)
[4]词向量与LDA相融合的短文本分类方法[J]. 张群,王红军,王伦文. 现代图书情报技术. 2016(12)
[5]中文事件抽取研究文献之算法效果分析[J]. 吉久明,陈锦辉,李楠,孙济庆. 现代情报. 2015(12)
[6]面向Web的藏文文本分词策略研究[J]. 艾金勇,陈小莹,华侃. 图书馆学研究. 2014(21)
[7]基于多特征融合的中文文本关键词提取方法[J]. 张建娥. 情报理论与实践. 2013(10)
[8]基于主题特征的关键词抽取[J]. 刘俊,邹东升,邢欣来,李英豪. 计算机应用研究. 2012(11)
[9]基于信息增益与信息熵的TFIDF算法[J]. 李学明,李海瑞,薛亮,何光军. 计算机工程. 2012(08)
[10]基于词汇链的关键词自动标引方法[J]. 李纲,戴强斌. 图书情报知识. 2011(03)
硕士论文
[1]基于信息融合的Web信息可信度研究[D]. 罗庆平.中南大学 2014
本文编号:3029747
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/3029747.html