有色行业跨语言新闻事件信息获取与分析方法
本文关键词:有色行业跨语言新闻事件信息获取与分析方法
【摘要】:随着"一带一路"战略的不断推进,我国有色金属行业的国际化程度越来越高,有色金属企业对每天发生在不同国家的与有色金属产品、企业、市场、、技术等相关的事件越来越关注。及时全面的掌握这些事件信息,对于有色金属企业预防风险,提升国际竞争力具有重要作用。不同国家互联网上大量对这些事件进行报道的新闻,为有色金属企业了解相关事件信息,提供了及时广泛的信息。本文研究有色金属行业跨语言新闻事件信息获取与分析方法,目的是借助于计算机,利用不同国家互联网上与有色金属行业相关的不同语言新闻,实现对发生在各个国家相关事件信息以及不同事件之间关联的自动获取与分析,并将获取与分析的结果展示给用户,能够为有色金属企业获取与分析相关事件信息,提供一个方便快捷的手段,具有重要的现实意义。通过互联网新闻对有色金属行业新闻事件信息进行自动获取与分析,面临的关键问题在于,如何准确识别互联网上不同语言的有色金属行业相关新闻,如何对报道相同事件的不同语言有色金属行业相关新闻进行自动整合,以及在此基础上如何从众多对事件进行报道的不同语言新闻中自动提取出重要的事件信息形成摘要,如何对不同事件之间的相互关联关系进行分析和结果展示。针对这些任务由于有色金属行业缺乏相关的双语资源以及可用的机器翻译工具,现有方法难以适用,此外现有方法,没有考虑有色金属行业相关新闻所具有的特点,难以取得很好的效果。本文针对这些关键问题对有色金属行业跨语言新闻识别方法,跨语言新闻聚类方法,跨语言新闻摘要方法,跨语言事件相关性识别及关联图构建方法开展研究,主要取得了如下成果:(1)提出了基于CNN的有色金属行业跨语言新闻识别方法。针对现有跨语言新闻识别方法没有考虑领域特点的问题,在有色金属行业缺少相关双语资源的情况下,利用双语词典构建跨语言词向量对不同语言新闻进行统一表示,再在此基础上利用CNN,对不同语言有色金属行业新闻进行识别特征的学习和识别模型的构建。实验结果表明该方法取得了很好的识别效果,相较于传统基于词典的方法效果提升的较为明显。(2)提出了基于事件要素的有色金属行业跨语言新闻聚类方法。针对现有跨语言新闻聚类方法没有考虑新闻中事件信息的问题,将有色金属行业新闻中包含的有色金属企业、产品等作为事件要素对新闻进行表征。在此基础上采用有监督的方式对不同语言新闻间的相似度进行计算,并采用增量聚类的方法对在线增量出现的新闻进行聚类。实验结果表明该方法有效提升了对不同语言新闻事件进行自动归类的效果。(3)提出了结合双语主题模型和图模型的有色金属行业跨语言新闻摘要方法。针对现有方法依赖机器翻译工具以及无法同时利用新闻主题信息及句子之间关联关系的问题,利用互译的领域实体术语作为跨语言桥梁对不同语言新闻进行双语主题挖掘;借助于跨语言词向量以及双语主题模型构建句子关联图对不同主题下句子的重要程度进行打分;最终同时根据摘要与不同主题的语义相似度以及不同主题下句子的重要程度进行摘要的生成。实验结果表明所提出的方法能够在不使用机器翻译的情况下对不同语言有色金属行业新闻进行自动摘要,而且能够有效提升自动摘要的效果。(4)提出了显式和隐式两种跨语言相关事件识别方法,并在此基础上进一步提出并构建了一个融合时间信息的事件关联图,对所有事件之间的前后关联,直接和间接关联进行表示。两种相关事件识别方法,针对现有事件相关性识别方法只在单语环境下,只对单个事件词或句之间关系进行识别的问题,将对事件进行报道的所有不同语言新闻作为判断不同事件之间是否相关的依据,前者根据相关事件在新闻中共现特点进行识别,后者则根据不同事件要素之间相似度和相关度对事件之间是否相关进行推断。实验结果表明两种方法都取得了不错的效果,共同使用能够更加全面准确的识别出有色金属行业不同语言新闻事件之间的关联。
【学位授予单位】:昆明理工大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:G254;F416.32
【相似文献】
中国期刊全文数据库 前10条
1 武振萍;语言交际与交际法策略[J];辽宁税务高等专科学校学报;1999年02期
2 魏悦;;浅析汉语作为第二语言习得过程中语言规则的泛化现象[J];新西部(理论版);2013年05期
3 周力;;现代法国青年人在日常生活中的语言特点研究[J];福建论坛(社科教育版);2008年06期
4 颜世亭;;英汉语言表达异同浅析[J];科技咨询导报;2007年30期
5 李德胜;;语言文化、思维定势与外语学习[J];山西经济管理干部学院学报;2006年02期
6 李毅;;试析语言与民族主义[J];石家庄经济学院学报;2008年03期
7 赵国栋;刘潇;;内蒙古财经学院大学生英语两项语言技能实验分析[J];内蒙古财经学院学报(综合版);2006年03期
8 宋力英;浅谈英语语言在广告中的应用[J];商业研究;1997年05期
9 马玲玲;;应用交际教学法提高学生的语言交际能力[J];边疆经济与文化;2007年06期
10 杨明宇;李丹;;广告语言的意象生成[J];云梦学刊;2010年01期
中国重要会议论文全文数据库 前4条
1 李韧之;;拓扑学及其理论框架下的语言比较[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
2 窦丽梅;;语言反省:现代文化秩序的内省机制[A];中国的前沿 文化复兴与秩序重构——上海市社会科学界第四届学术年会青年文集(2006年度)[C];2006年
3 郭龙生;;语言潜、显理论[A];王希杰修辞思想研究[C];2004年
4 梁坤峰;高春艳;卫尧;王志远;;“Matlab语言”对理工科教学的重要性探讨[A];制冷空调学科教学研究进展——第四届全国高等院校制冷空调学科发展与教学研讨会[C];2006年
中国重要报纸全文数据库 前10条
1 本报记者 翟慎良 汪晓霞;如何面对网络语言[N];新华日报;2002年
2 谢云挺邋郑旭萍;是是非非网络语言[N];福建日报;2007年
3 福建师范大学协和学院 王进安;建设网络强国需要和谐健康的网络语言环境[N];光明日报;2014年
4 张桂辉;网络语言:令人堪忧的“另类蓝藻”[N];中国文化报;2007年
5 本报记者 常丽君;语言是人类的本能吗?[N];科技日报;2014年
6 语言所 程荣;和谐语言与和谐社会[N];中国社会科学院院报;2005年
7 ;大脑中“预设”了基本语言规则?[N];新华每日电讯;2004年
8 本报记者 刘振兴;“做俯卧撑”一词井喷的背后[N];青岛日报;2008年
9 王广瑞;别让语言妨碍孩子写作[N];中国邮政报;2006年
10 中国上市公司舆情中心观察员 周凯莉;公务员的皮子与里子[N];证券时报;2014年
中国博士学位论文全文数据库 前4条
1 洪旭东;有色行业跨语言新闻事件信息获取与分析方法[D];昆明理工大学;2017年
2 李志强;公元前6-前3世纪中西方语言学的萌芽[D];华东师范大学;2007年
3 葛晶;整合性描写原则视域下的语言多义性研究[D];首都师范大学;2012年
4 陆前;英、汉跨语言话题检测与跟踪技术研究[D];中央民族大学;2013年
中国硕士学位论文全文数据库 前10条
1 刘梓晗;新课标下中学语文课堂教学语言的转型研究[D];黄冈师范学院;2016年
2 任道;语言规则及其掌握的合理途径[D];东北师范大学;2007年
3 刘晴;网络语言的文化研究[D];华中师范大学;2006年
4 马迎;英语语言规则及其合理教学手段探究[D];长春理工大学;2009年
5 王延;技术时代语言发展状况的哲学分析[D];陕西师范大学;2001年
6 温长先;大学生英语语言规则意识与学习成绩的相关性研究[D];东北师范大学;2012年
7 刘敏;语言交际与中西文化差异[D];西南师范大学;2001年
8 张广兰;论伽达默尔主体间性语言观[D];华侨大学;2011年
9 申珍丽;试论网络语言的挑战与语文教学的应对[D];湖南师范大学;2013年
10 覃理;广告语言艺术[D];广西大学;2002年
,本文编号:1298842
本文链接:https://www.wllwen.com/shoufeilunwen/jjglss/1298842.html