汉越双语新闻观点句抽取及其情感倾向性分析方法研究
发布时间:2024-01-27 06:02
汉越双语新闻文本的观点句抽取及其情感倾向性分析方法研究是指针对某个特定事件,中国媒体和越南媒体对其进行的新闻报道评述表达了怎样的观点和情感倾向。其意在帮助人们可以迅速地从大量的相关新闻文档中获取某篇新闻的情感倾向,从而了解到不同国家的人们在面对同一事件时都是从哪些不同的方面对新闻事件所持有的观点、态度以及情感的倾向,这对预测社会舆论的走向起到指示作用,具有重要研究意义。与通用的跨语言情感分析方法不同的是,本文认真分析了汉语和越南语新闻文本的特征,分析句子关联关系在情感分析过程中的作用,在基于双层编码和双向LSTM等深度学习网络框架下,研究了跨语言新闻文档观点句的识别和情感倾向性分析方法,本文面向汉语、越南语新闻文本,主要完成了以下工作:(1)汉语、越南语新闻文本的获取和数据集的构建。本文通过基于模板的新闻数据抓取方法,为特定新闻网站编写对应的Xpath路径来获取指定的新闻数据。根据观点句识别和新闻文档情感分析的任务需求,在爬取到的24639篇双语新闻文本中选择最具代表性的热门事件“中美贸易战”、“一带一路”、“中越防务合作”,在这三个话题下人工标注了共计200篇文档,2832个句子的用...
【文章页数】:67 页
【学位级别】:硕士
本文编号:3886439
【文章页数】:67 页
【学位级别】:硕士
图1.1研究框架
图2.1新浪新闻国内页面
图2.3新闻网页Xpath结构
图2.2越南报刊网我们可以通过Xpath网页解析技术对嵌套在Html标签中的信息进行抽取
本文编号:3886439
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3886439.html