基于文本挖掘的商品推荐
本文选题:特征词 切入点:相似度计算 出处:《哈尔滨商业大学学报(自然科学版)》2017年04期 论文类型:期刊论文
【摘要】:对电子商务网站的评论文本进行分词、去停用词等整理,通过词频统计提取特征词,应用词频-逆文档频率提高特征词的类别区分能力以增加特征词的准确性.在收集大量的电子商务网站的评论文本及一系列预处理后构建了特征词词库.采用词语相似度计算方法用于关键词向量与特征词词库相似度的计算.根据相似度计算结果对用户评论的商品进行排序以实现对用户商品的推荐.设计了商品推荐系统并完成了实验程序.利用收集到的用户评论文本完成了对商品的推荐实验,并对实验结果进行了考察与分析.
[Abstract]:The comment text of electronic commerce website is partitioned, the word is stopped, and the feature words are extracted by word frequency statistics. Using word frequency-inverse document frequency to improve the classification ability of feature words in order to increase the accuracy of feature words. After collecting a large number of comment texts and a series of preprocessing of e-commerce websites, a feature word database was constructed. The similarity calculation method is used to calculate the similarity between the keyword vector and the word base of feature words. According to the result of similarity calculation, the items commented by the user are sorted to realize the recommendation of the user's goods. A commodity recommendation system is designed. And completed the experimental program. Using the collected user comments to complete the product recommendation experiment, The experimental results are investigated and analyzed.
【作者单位】: 哈尔滨商业大学计算机与信息工程学院;黑龙江旅游职业技术学院基础学部;
【基金】:黑龙江省教育厅科学研究项目(12511127)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 徐建民;张猛;吴树芳;;基于话题的事件相似度计算[J];计算机工程与设计;2014年04期
2 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期
3 单建芳;刘宗田;周文;;事件相似度计算[J];小型微型计算机系统;2010年04期
4 刘文剑;郭宁;金天国;;制造资源本体的相似度计算模型[J];计算机集成制造系统;2010年11期
5 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期
6 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期
7 田卫东;强继朋;;基于问句类型的问句相似度计算[J];计算机应用研究;2014年04期
8 廉站俊;吕学强;张玉杰;施水才;;基于句子相似度计算的信息抽取[J];现代图书情报技术;2007年06期
9 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期
10 兰美辉;任友俊;徐坚;高炜;;k-部排序本体相似度计算[J];计算机应用;2012年04期
相关会议论文 前10条
1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
4 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年
9 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
相关博士学位论文 前4条
1 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年
2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
4 任磊;推荐系统关键技术研究[D];华东师范大学;2012年
相关硕士学位论文 前10条
1 梁韬;中文微博新词与热点话题发现技术研究[D];湖南工业大学;2015年
2 汪建成;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年
3 唐海燕;基于全文的教育资源检索模型研究[D];四川师范大学;2015年
4 舒佳根;中文实体链接研究[D];苏州大学;2015年
5 孔行;基于主题推荐的辅助写作系统[D];哈尔滨工业大学;2015年
6 孙润志;基于语义理解的文本相似度计算研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年
7 刘敏;基于词向量的句子相似度计算及其在基于实例的机器翻译中的应用[D];北京理工大学;2015年
8 康毅;面向客服的自动问答系统关键技术研究[D];东北大学;2014年
9 吴宇浩;南海档案数字化半自动校勘中的底本推荐探讨[D];南京大学;2015年
10 吐尔逊阿依·阿不来提;小学维吾尔语文教材中的单句相似度研究[D];新疆师范大学;2015年
,本文编号:1625537
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1625537.html