基于混合策略的英汉双语新闻聚类研究
发布时间:2017-08-17 20:10
本文关键词:基于混合策略的英汉双语新闻聚类研究
【摘要】:英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类结果。
【作者单位】: 南京大学信息管理系;
【关键词】: 双语聚类 多语聚类 混合策略方法
【基金】:教育部人文社会科学重点研究基地重大项目(08JJD870225) 2011年南京大学研究生科研创新基金资助项目(2011CW12)
【分类号】:H087
【正文快照】: 1概述随着网络的迅速发展、普及以及全球化趋势,一方面,使得在线文本资源中非英语的比例快速增加,在新闻媒体领域,越来越多的新闻门户网站提供多语言新闻,如英国最大的新闻广播机构BBC,提供43种语言广播,27种新闻网络报道。中国日报、新华网、中国新闻网、腾讯新闻国际频道等
【二级参考文献】
中国期刊全文数据库 前1条
1 骆卫华;于满泉;许洪波;王斌;程学旗;;基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报;2006年01期
,本文编号:690864
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/690864.html