Web观点挖掘系统的关键技术研究
本文关键词:Web观点挖掘系统的关键技术研究,由笔耕文化传播整理发布。
《扬州大学》 2011年
Web观点挖掘系统的关键技术研究
宫海平
【摘要】:随着互联网的迅速发展和普及,互联网已成为人们获取信息的重要渠道;同时,它也成为人们表达自己观点、看法、情感的平台。因此,在各大电子商务网站、电子公告板以及门户网站上出现了大量的有关各种商品的评论信息。商家和厂家的决策者需要了解顾客使用他们商品情况的反馈意见,潜在的购买者也需要根据别人的使用体验来作出是否购买该商品的决定。对于商品生产厂家和潜在的商品购买者而言,面对网络上如此大量、复杂的评论信息,如何迅速有效地获取自己感兴趣的商品评论的总体观点极性倾向(正面的还是负面的)就成为了一个新的问题。观点挖掘技术的出现,正是为了解决这个问题。它融合了信息检索、信息抽取、文本分类、机器学习、自然语言处理、本体论等众多技术,具有一定的文本理解能力,更具有一定的智能性。 近年来观点挖掘技术的研究十分活跃,由于观点挖掘涉及到大量的理论技术,本文只对观点挖掘系统中的几个关键方面进行了深入的研究,并尝试构建了一个观点挖掘系统(OMS)框架,主要的研究工作如下: 1)根据PageRank算法的思想,结合基于文本内容的启发式方法和基于Web超链分析的方法二者之间的优点,提出一种新的爬行方法,为我们的观点搜索系统专门设计了分布式的、改进的聚焦网络爬虫算法,并实现了这个高效的分布式的聚焦爬虫子系统。 2)基于最大熵和支持向量机的方法进行评论的高质量与低质量分类研究,过滤掉大量低质量的商品评论,从而保证观点搜索系统能够给出高质量的查询结果。 3)利用《知网》构造具有主观性词的种子列表,然后,根据从《知网》中获得的主观词种子列表以及《知网》中词与词之间相似或相反的关系提出了一个观点词的极性倾向判别算法,从而构建一个带有标注词语情感极性倾向的主观词词典。 4)使用了本论文的成果以及其它研究者的成果设计了一个基于Web的观点评论挖掘系统框架。
【关键词】:
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前3条
1 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
2 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
3 徐军;丁宇新;王晓龙;;使用机器学习方法进行新闻的情感自动分类[J];中文信息学报;2007年06期
中国硕士学位论文全文数据库 前1条
1 杨晖;基于标签分类内容共享平台的网页自动文摘模型[D];重庆大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 李荣军;王小捷;周延泉;;PageRank模型在中文情感词极性判别中的应用[J];北京邮电大学学报;2010年05期
2 庞娜;;增量学习算法对文本情感识别模型的改进[J];电脑开发与应用;2011年07期
3 梁坤;古丽拉·阿东别克;;基于SVM的中文新闻评论的情感自动分类研究[J];电脑知识与技术;2009年13期
4 张彬;杨志晓;;基于基准词的文本情感倾向性研究[J];电脑知识与技术;2011年08期
5 李艺红;蒋秀凤;;中文句子倾向性分析[J];福州大学学报(自然科学版);2010年04期
6 廖祥文;张小琴;;基于句型结构的领域倾向词表构建[J];福州大学学报(自然科学版);2011年04期
7 李迎凯;徐小良;;一种改进的基于知网的句子相似度计算方法[J];电子科技;2012年07期
8 罗安;王勇;张福浩;刘纪平;;基于角色标注的中文POI名称语义分类方法[J];测绘通报;2012年S1期
9 薛云霞;李寿山;王中卿;;基于社会关系网络的半监督情感分类[J];北京大学学报(自然科学版);2014年01期
10 邹明;;基于情感分析的恶意发帖检测方法研究[J];电脑知识与技术;2014年07期
中国重要会议论文全文数据库 前10条
1 边海容;万常选;李国林;杨莉;;Web金融信息情感倾向与上市公司财务危机的关系研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
2 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
3 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
4 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
5 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
6 姚天昉;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 李斌;卢俊之;章成志;陈小荷;;基于聚类引擎的话题褒贬度计算[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 倪茂树;林鸿飞;;基于关联规则和极性分析的商品评论挖掘[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 王克;张春良;高晓兴;朱靖波;;基于三类训练两类判别框架的主客观性句子识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
2 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
3 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
4 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
5 杨峰;本体映射关键技术研究[D];吉林大学;2011年
6 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
8 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年
9 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
10 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
4 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
5 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
6 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
7 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
8 李海林;网络舆情热点信息发现及其倾向性研究[D];武汉理工大学;2010年
9 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
10 罗亚平;面向网络舆情的中文评论文本情感倾向分析研究[D];东北财经大学;2010年
【二级参考文献】
中国期刊全文数据库 前8条
1 李蕾,钟义信,郭祥昊;面向特定领域的理解型中文自动文摘系统[J];计算机研究与发展;2000年04期
2 季姮,罗振声,万敏,高小云;基于概念统计和语义层次分析的英文自动文摘研究[J];中文信息学报;2003年02期
3 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
4 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
5 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
6 刘挺,吴岩,王开铸;自动文摘综述[J];情报科学;1998年01期
7 郭燕慧,钟义信,马志勇,姚均勇;自动文摘综述[J];情报学报;2002年05期
8 侯志霞,曹军;自然语言处理的发展概况及前景展望[J];山东外语教学;2003年05期
【相似文献】
中国期刊全文数据库 前10条
1 谢长卫;;分布式环境下的集成数据挖掘系统[J];黑龙江科技信息;2007年16期
2 蒲筱哥;基于Web的个性化信息智能挖掘系统的构建[J];现代图书情报技术;2005年04期
3 李静;;高校教学管理关联规则挖掘系统设计与实现[J];现代教育技术;2007年02期
4 刘敏钰,薛鸿民;Web数据挖掘系统的设计及关键技术研究[J];航空计算技术;2005年01期
5 贾丰,张燕;网络信息挖掘系统评价初探[J];情报理论与实践;2003年03期
6 章成志;www信息挖掘技术及其在农业信息领域中的应用[J];计算机与农业;2001年12期
7 朱炜,王晓国,黄韶坤,李启炎;Email挖掘系统的体系模型及其具体实现[J];计算机辅助工程;2004年02期
8 殷燕,白庆华,秦耕,成晓,李伟,杜磊;基于Multi Agent技术的信息挖掘系统研究[J];计算机应用研究;1999年12期
9 赵瑜,王志坚,尹燕敏,杨敏;水文时间序列趋势预测挖掘系统研究[J];计算机工程;2003年02期
10 张霄军,张凌岚;基于XML的Web中文文本挖掘系统设计[J];术语标准化与信息技术;2004年03期
中国重要会议论文全文数据库 前6条
1 崔晋川;常维宝;;基于因特网的综合数据挖掘系统模型[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
2 陶兰;李四明;冯爽;;面向领域的网上信息挖掘系统研究与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
3 王海涛;王振瑯;;浅述缅甸反铲挖泥船挖掘系统设计[A];第九届全国内河船舶及航运技术学术交流会论文集[C];2004年
4 刘湘平;郭明;;UCW400刀轮挖泥船[A];机械疏浚专业委员会第十六次疏浚与吹填技术经验交流会论文与技术经验总结文集[C];2002年
5 曾嵘;夏其昌;吴家睿;;蛋白质组研究技术平台的建立及其应用[A];中国蛋白质组学首届学术大会论文摘要集[C];2003年
6 李昌勇;杨利民;方振峰;;700t/d烧劣质低挥发份燃料新型干法生产线的优化改造[A];第六届全国新型干法水泥技术经验交流会论文汇编[C];2005年
中国重要报纸全文数据库 前10条
1 汪春玫 王萍;[N];人民邮电;2004年
2 赵雷;[N];中华工商时报;2005年
3 ;[N];网络世界;2003年
4 戴肃军 作者单位:江苏总队;[N];人民武警;2005年
5 ;[N];电脑报;2004年
6 北京理工大学 刘勇 张丽平;[N];计算机世界;2003年
7 ;[N];中国电子报;2002年
8 广东 林鸣;[N];电脑报;2004年
9 方茜;[N];中国机电日报;2002年
10 刘志勇;[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前1条
1 谢毓湘;辅助情报分析的新闻视频挖掘技术研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前10条
1 程再峰;中小型工程企业客户潜在价值分析与挖掘系统设计及评价[D];浙江大学;2004年
2 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
3 赵国富;基于聚类的空间数据挖掘方法与应用研究[D];山东理工大学;2006年
4 张磊;基于Internet的智能信息挖掘系统建模及关键技术研究[D];西北工业大学;2003年
5 颜学优;网络信息挖掘在电子商务中的应用研究[D];吉林大学;2007年
6 于青子;具有明确语义的关联规则挖掘系统的研究与实现[D];河海大学;2002年
7 金妮;基于数据仓库和OLAP技术的聚类挖掘系统的设计与实现[D];大连理工大学;2005年
8 蔡立军;电子文档信息挖掘系统的研究[D];湖南大学;2003年
9 尹华;数据挖掘项目实施过程研究——基于分类的信用卡挖掘系统应用[D];武汉大学;2004年
10 王惠坡;基于决策树的货票数据挖掘系统的研究[D];郑州大学;2003年
本文关键词:Web观点挖掘系统的关键技术研究,,由笔耕文化传播整理发布。
本文编号:86947
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/86947.html