基于主观强度Bootstrapping优化的微博观点句识别
发布时间:2017-11-05 10:15
本文关键词:基于主观强度Bootstrapping优化的微博观点句识别
更多相关文章: 观点句识别 主观性特征 主观强度 Bootstrapping优化
【摘要】:微博观点句识别对于情感分类、舆情调查等具有重要的作用,为了尽量减少训练语料的标注工作,文章提出一种主观强度Bootstrapping优化的方法来识别微博观点句。首先,采用优势率和独立主观表达能力计算主观性特征的主观强度,再结合其在测试集微博句子中的权重信息计算微博句子的主观强度并进行排序;然后,进行Bootstrapping优化,以训练集中主客观句子特征分布的相对熵作为阈值将排序序列中置信度高的主客观句子分别加入到训练集中,重新训练主观性特征的主观强度,迭代进行直至不再有新句子加入。实验结果表明,本方法具有一定的可行性和有效性,Bootstrapping过程的引入可以极大优化观点句识别的结果。
【作者单位】: 山东师范大学信息科学与工程学院;山东省分布式计算机软件新技术重点实验室;山东交通学院信息科学与电气工程学院;
【基金】:国家自然科学基金(61373148) 国家社科基金(12BXW040) 教育部人文社科基金(14YJC860042) 山东省自然科学基金(ZR2012FM038,ZR2014FL010) 山东省优秀中青年科学家奖励基金(BS2013DX033) 山东省高等学校科技计划(J12LN21) 山东省社科规划项目(12BXWJ01)
【分类号】:TP393.092;TP391.1
【正文快照】: 0引言由于微博具有消息发布迅速、发布手段多样、内容结构自由、便捷交互等特点,受到越来越多人的青睐,用户每天更新并传播的微博高达数千万条,微博正日益成为信息传播、意见共享、观点交流的实时性平台。微博平台经常占据信息发布的起源点和信息传播的制高点,许多备受人们关,
本文编号:1143753
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1143753.html