当前位置:主页 > 科技论文 > 信息工程论文 >

基于主观倾向性分析的微博群体信息采集研究

发布时间:2016-09-24 19:32

  本文关键词:文本倾向性分析中的情感词典构建技术研究,,由笔耕文化传播整理发布。


《华中师范大学》 2013年

基于主观倾向性分析的微博群体信息采集研究

肖琴  

【摘要】:近几年,微博如雨后春笋般成长起来并迅速发展壮大,我们进入了一个全新的“微时代”。微博的信息聚合功能也日益凸显,各类重要话题信息、热点事件信息、政务信息、新闻信息、企业产品信息、个人情感信息等都成为微博信息的重要组成部分。微博成为热点事件、重要话题的发源地和孵化地,微博逐渐成为各类信息交流、分享的最大、最便捷平台。 物以类聚,人以群分。存在于微博空间中的用户并不是孤立的个体,他们或因为志趣、爱好、信仰、奋斗目标相同;或由于某些事件的吸引;或因为相同、相近、相似社会地位或特征而聚集在一起成为群体。群体围绕事件、事物,利用微博平台发表所见、所闻、所感,这些信息或正面;或负面;或中立,其主观倾向程度也各不相同。这些信息的采集,对商业营销;舆情采集、监控与引导;政务管理等领域极具参考利用价值。 本文的主体分为六部分。第一部分为绪论,介绍了论文的选题背景、研究意义、主要内容、研究思路、研究方法和创新点,并阐述了国内外微博群体信息采集和主观倾向性分析的研究现状。第二部分主要介绍了微博群体信息采集的基础理论,主要涉及微博中的群体类型、微博群体信息的类型、特点以及微博群体信息的采集工具。第三部分阐述了微博群体信息主观倾向性分析的基础理论,包括主观倾向性分析方法;微博群体主观倾向性的类型;微博群体信息主观倾向性分析的应用价值等。第四部分对微博群体信息采集分析进行了具体研究探讨,以话题“大学生卖烧饼”为例,进行具体微博群体信息采集操作,分步骤从情感词典的构建、导入、中文分词及词性标注探究了如何对采集的信息进行主观倾向性分析。第五部分对微博群体信息采集价值最大化的实现策略进行了研究。第六部分为总结与展望,在总结本文的研究成果以及不足的基础上,提出进一步的研究方向。

【关键词】:
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G252
【目录】:

  • 摘要6-7
  • Abstract7-8
  • 目录8-11
  • 1 绪论11-20
  • 1.1 研究背景及意义11-14
  • 1.1.1 研究背景11-13
  • 1.1.2 研究意义13-14
  • 1.2 国内外研究现状14-17
  • 1.2.1 国内外微博群体信息采集研究现状14-15
  • 1.2.2 国内外主观倾向性分析研究现状15-17
  • 1.3 研究内容及研究思路17-19
  • 1.3.1 研究内容17
  • 1.3.2 研究思路17-19
  • 1.4 研究方法及创新点19-20
  • 1.4.1 研究方法19
  • 1.4.2 创新点19-20
  • 2 微博群体信息采集基础理论20-30
  • 2.1 微博的由来和发展20-21
  • 2.2 微博中的群体类型21-23
  • 2.2.1 以个人为中心的群体21-22
  • 2.2.2 以组织机构为中心的群体22
  • 2.2.3 以兴趣话题为中心的群体22-23
  • 2.3 微博群体信息的类型23-26
  • 2.3.1 微博群体客观信息23-25
  • 2.3.2 微博群体主观信息25-26
  • 2.4 微博群体信息的特点26-28
  • 2.4.1 议题多样化26
  • 2.4.2 信息传播面广26-27
  • 2.4.3 信息变异性强27
  • 2.4.4 意见领袖影响力大27
  • 2.4.5 网络语言特征明显27-28
  • 2.5 微博群体信息采集工具28-30
  • 2.5.1 网络爬虫28-29
  • 2.5.2 软件工具29-30
  • 3 微博群体信息主观倾向性分析基础理论30-35
  • 3.1 微博群体信息主观倾向性分析的含义30-31
  • 3.2 微博群体信息主观倾向性分析方法31-32
  • 3.2.1 基于语义的文本倾向性分析方法31
  • 3.2.2 基于统计的文本倾向性分析方法31-32
  • 3.3 微博群体主观倾向性的类型32-33
  • 3.3.1 正面倾向型32
  • 3.3.2 负面倾向型32-33
  • 3.3.3 中性型33
  • 3.4 微博群体信息主观倾向性分析的应用价值33-35
  • 3.4.1 商业营销价值33
  • 3.4.2 舆情获取与监控价值33-34
  • 3.4.3 政务管理价值34-35
  • 4 微博群体信息采集及主观倾向性分析35-54
  • 4.1 微博群体信息采集实例——以新浪微博话题“大学生卖烧饼”为例35-38
  • 4.1.1 话题背景介绍35-36
  • 4.1.2 话题涉及的群体主客观信息采集36-38
  • 4.2 微博群体信息主观倾向性分析38-54
  • 4.2.1 微博情感词典的构建38-47
  • 4.2.2 微博情感词典的导入47-49
  • 4.2.3 中文分词及词性标注49-52
  • 4.3.4 主观倾向性判断及计算52-54
  • 5 微博群体信息采集价值最大化实现策略54-57
  • 5.1 用户属性信息与主观倾向性相结合54-55
  • 5.2 微博项信息与主观倾向性相结合55
  • 5.3 微博群体客观信息与主观倾向性程度相结合55-56
  • 5.4 外部因素与主观倾向性相结合56-57
  • 6 总结与展望57-59
  • 6.1 总结57-58
  • 6.2 展望58-59
  • 参考文献59-62
  • 攻读硕士学位期间参加的项目和发表的论文62-63
  • 参加的主要科研项目62
  • 已发表或录用的论文62-63
  • 致谢63
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【参考文献】

    中国重要报纸全文数据库 前1条

    1 商报记者 李铎;[N];北京商报;2010年

    中国博士学位论文全文数据库 前1条

    1 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年

    【共引文献】

    中国博士学位论文全文数据库 前10条

    1 邱闯仙;现代汉语插入语研究[D];南开大学;2010年

    2 李颖玉;基于语料库的欧化翻译研究[D];上海外国语大学;2010年

    3 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年

    4 刘春兰;《训世评话》语法研究[D];南开大学;2010年

    5 彭懿;英汉肤觉形容词的认知语义研究[D];湖南师范大学;2010年

    6 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年

    7 李青;现代汉语把字句主观性研究[D];吉林大学;2011年

    8 王欣;汉日否定表达对比研究[D];吉林大学;2011年

    9 张翼;复合动词和及物结构[D];南京大学;2011年

    10 陈勇;汉语数量范畴及其非范畴化研究[D];暨南大学;2011年

    【二级参考文献】

    中国重要报纸全文数据库 前1条

    1 马海兵;[N];光明日报;2007年

    中国博士学位论文全文数据库 前1条

    1 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年

    【相似文献】

    中国期刊全文数据库 前10条

    1 赵静;王玉平;;群体信息能力测试分析模型[J];图书情报工作;2008年06期

    2 赵静;王玉平;郑杰;;西部农村群体信息能力现状[J];情报科学;2009年03期

    3 常文英;刘冰;;网络环境中信息弱势群体信息援助模式与策略研究[J];情报杂志;2011年05期

    4 李妍丽;;图书馆在提高弱势群体信息素质中的作用[J];河南图书馆学刊;2012年06期

    5 董见新;;考研群体信息需求的调查与分析[J];图书馆建设;2007年05期

    6 李昊青;;社会弱势群体信息权利表达研究——影响成因、表达特点与价值意涵[J];现代情报;2011年12期

    7 华凌;;对弱势群体信息援助与支撑的理性思考[J];图书馆理论与实践;2007年03期

    8 石德万;;信息技术的发展对信息弱势群体信息行为的影响[J];图书情报工作;2008年11期

    9 井西晓;;公平视角下我国信息弱势群体信息能力研究[J];科技管理研究;2013年13期

    10 赵静;朱春艳;王玉平;;西部农村群体信息能力培育[J];情报科学;2009年04期

    中国硕士学位论文全文数据库 前3条

    1 崔宇;群体信息觅食中的干扰效应作用研究[D];北京邮电大学;2012年

    2 邓美维;基于公共服务均等化的弱势群体信息权益保障研究[D];湘潭大学;2014年

    3 肖琴;基于主观倾向性分析的微博群体信息采集研究[D];华中师范大学;2013年

    中国知网广告投放

    相关机构

    >北京邮电大学

    >华中师范大学

    >湘潭大学

    相关作者

    >肖琴 >邓美维

    >崔宇

    基于主观倾向性分析的微博群体信息采集研究

    《中国学术期刊(光盘版)》电子杂志社有限公司
    同方知网数字出版技术股份有限公司
    地址:北京清华大学 84-48信箱 大众知识服务
    京ICP证040441号
    互联网出版许可证 新出网证(京)字008号
    出版物经营许可证 新出发京批字第直0595号

    订购热线:400-819-9993 010-62982499
    服务热线:010-62985026 010-62791813
    在线咨询:
    传真:010-62780361
    京公网安备11010802020475号



      本文关键词:文本倾向性分析中的情感词典构建技术研究,由笔耕文化传播整理发布。



    本文编号:122266

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/122266.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户cd7fe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com