面向微博的消费意图识别
发布时间:2021-06-24 00:11
互联网的快速发展和互联网软硬件的革新给人们的生活带来了巨大的变化,如今PC,手机,PDA等电子设备已经进入千家万户,成为人们生活中的必需品。在现阶段互联网的发展中,社交化已成为主要的发展方向和趋势,各个社交网站例如推特和新浪微博迅速出现且占领大量的用户。大众通过社交网络分享自己生活点滴和发表自己的观点,在用户分享的内容中包含着大量个人对某种产品的消费意图倾向信息。因此,微博作为一种社会媒体与社交网络应用,包含着巨大的商业价值。本文面向微博中的消费意图进行了一系列的研究。在研究方面尝试采用模板匹配和分类方法识别用户消费意图,在工程方面提出了消费意图识别的解决方案。本文主要通过以下方法进行微博消费意图的识别:新浪微博数据获取和基于分类的僵尸用户过滤,基于自动抽取模板技术的消费意图识别,基于分类的消费意图识别。下面简要介绍各个研究点的主要研究内容。(1)我们对新浪微博的数据获取采用了两种方式,调用新浪微博API的方式和模拟登陆爬取网页的方式。由于新浪微博对爬数据的限制,如每小时每IP只能调用API一万次,爬取网页一段时间后出现验证码等限制,本文最终搭建Hadoop云计算平台,以多个IP同时爬...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
Hub与Authority权值计算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈尔滨工业大学工学硕士学位论文L 的语言学知识资源和语料库资源,上层提供分词,词性标注,命名,依存句法分析,语义消歧,语义角色标注等核心功能。在上层提供接口供用户调用,DLL API,Web Service还有可视化的结果和网页Dem统已经提供给国内上百家科研机构和企业使用,被证明在实用性是上产品。
本文编号:3245942
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
Hub与Authority权值计算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈尔滨工业大学工学硕士学位论文L 的语言学知识资源和语料库资源,上层提供分词,词性标注,命名,依存句法分析,语义消歧,语义角色标注等核心功能。在上层提供接口供用户调用,DLL API,Web Service还有可视化的结果和网页Dem统已经提供给国内上百家科研机构和企业使用,被证明在实用性是上产品。
本文编号:3245942
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3245942.html