一个新的个性化搜索引擎排序算法
本文关键词:一个新的个性化搜索引擎排序算法
更多相关文章: 个性化排序 用户兴趣模型 奇异值分解 k-means聚类算法 朴素贝叶斯分类器
【摘要】:通过对现有个性化搜索引擎排序算法的研究,提出了一个新的排序算法。该算法首先在不同粒度上多次使用SVD技术和k-means聚类技术,将用户浏览历史及其所包含的词在不同层次上进行文档聚类和词聚类,创建两棵加权兴趣树:文档类树和词类树。其中,树中每个节点的权值表示用户对该类文档或该类词的感兴趣程度。接着,利用朴素贝叶斯分类器对搜索引擎得到的网页进行文档分类和词分类,并根据分类结果进行网页评分。最后,将网页根据文档得分降序排列。实验表明该方法能为用户提供更为精确的个性化排序。
【作者单位】: 太原科技大学计算机科学与技术学院;
【关键词】: 个性化排序 用户兴趣模型 奇异值分解 k-means聚类算法 朴素贝叶斯分类器
【分类号】:TP391.3
【正文快照】: 在早期的搜索引擎中,搜索结果的排序只是以检索器在数据库中找到匹配网页的先后顺序排列。随着互联网的不断发展,大量的垃圾信息和重复信息充斥着互联网,影响了用户对感兴趣信息的访问。而传统的搜索引擎排序只能依靠关键词的相似度计算,当数据达到千万级别的时候,用户的一次
【参考文献】
中国期刊全文数据库 前5条
1 刘海峰;王元元;张学仁;;基于潜在语义空间的文本检索问题研究[J];情报科学;2007年05期
2 曾春,邢春晓,周立柱;个性化服务技术综述[J];软件学报;2002年10期
3 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期
4 常璐,夏祖奇;搜索引擎的几种常用排序算法[J];图书情报工作;2003年06期
5 杨思洛;搜索引擎的排序技术研究[J];现代图书情报技术;2005年01期
中国硕士学位论文全文数据库 前2条
1 冯超;K-means聚类算法的研究[D];大连理工大学;2007年
2 张跃火;基于用户兴趣偏好模型的个性化搜索算法[D];重庆大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 汪洁;朱军;;基于Linux的中文垃圾邮件过滤系统设计与实现[J];安徽农业大学学报;2011年02期
2 姚克娟,李晋宏;应用Agent技术实现个性化信息服务[J];北方工业大学学报;2004年03期
3 王丽影;刘媛媛;李建英;;个性化服务在网络课程中的应用研究[J];办公自动化;2009年20期
4 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
5 张俊芬;;搜索引擎之竞价排名的法律问题研究[J];北京邮电大学学报(社会科学版);2009年06期
6 纪良浩;王国胤;杨勇;;基于协作过滤的Web日志数据预处理研究[J];重庆邮电学院学报(自然科学版);2006年05期
7 纪良浩;;协作过滤信息推荐技术研究[J];重庆邮电大学学报(自然科学版);2012年01期
8 陈大平;;搜索引擎技术方式之探析[J];长春理工大学学报(高教版);2009年10期
9 许建潮;王红梅;;改进的协同过滤算法[J];吉林大学学报(信息科学版);2008年01期
10 辛勤芳;;基于项目聚类的协同过滤算法研究[J];赤峰学院学报(自然科学版);2011年09期
中国重要会议论文全文数据库 前10条
1 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
2 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
3 徐羽琼;李石坚;姚敏;;基于情境感知的个性化邮件服务[A];第四届和谐人机环境联合学术会议论文集[C];2008年
4 刘咏梅;卢鸿剑;杜美玲;;基于Multi-agent的个人电脑客户定制服务推荐系统[A];2006中国控制与决策学术年会论文集[C];2006年
5 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年
6 刘涛;王晓光;黄琨;;数字图书馆的发展及其技术概论[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
7 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 柯慧燕;;基于粗糙集的远程教育个性化服务研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 宋巍;张宇;刘挺;李生;;基于检索历史上下文的个性化查询重构技术研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 杜亚军;裴峥;彭宏;徐扬;;基于不确定性推理的主题推荐方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
2 林甲灶;构建个性化智能移动电子商务系统的关键技术与方法研究[D];兰州大学;2011年
3 张卫;基于XaaS的制造服务链形成与应用研究[D];浙江大学;2011年
4 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
5 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
6 张晓刚;面向软件过程改进的知识管理技术研究[D];中国科学院研究生院(软件研究所);2004年
7 陈福集;电子政务系统中面向公众的信息集成化管理与个性化服务研究[D];合肥工业大学;2004年
8 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
9 周娜;基于Web的制造业电子商务平台关键技术的研究与应用[D];南京航空航天大学;2005年
10 赵野军;橡胶挤出机智能CAD的技术和方法研究[D];北京化工大学;2005年
中国硕士学位论文全文数据库 前10条
1 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年
2 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
3 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
4 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
5 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
7 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年
8 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
9 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
10 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
2 李育嫦;搜索引擎中完善关键词检索功能的探索[J];图书与情报;2003年05期
3 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
4 罗敏,王丽娜,张焕国;基于无监督聚类的入侵检测方法[J];电子学报;2003年11期
5 应晓敏,刘明,窦文华;一种面向个性化服务的无需反例集的用户建模方法[J];国防科技大学学报;2002年03期
6 陶蕾;一种智能型的信息检索方法:隐含语义索引法[J];情报理论与实践;2004年03期
7 陶剑文;;一种自动获取用户兴趣的个性化搜索算法[J];情报理论与实践;2007年04期
8 陈海龙;搜索引擎的评价标准及方法研究[J];情报杂志;2001年09期
9 袁文莉;中文搜索引擎分类检索工具发展的大趋势[J];情报杂志;2004年05期
10 冯翱,刘斌,卢增祥,路海明,王普,李衍达;Open Bookmark——基于Agent的信息过滤系统[J];清华大学学报(自然科学版);2001年03期
中国硕士学位论文全文数据库 前2条
1 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
2 刘俊晖;企业内部个性化搜索系统的研究与实现[D];复旦大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 李俊,张灵玲,周文辉,潘金贵;一个智能用户接口Agent设计与实现[J];软件学报;1999年08期
2 欧洁,林守勋,李锦涛;数字图书馆中的个性化信息检索[J];微电子学与计算机;2002年07期
3 王志军,于超;基于隐式反馈的个人信息检索技术及实现[J];计算机工程;2003年06期
4 龚婕,姜军,张桂林;基于奇异值分解和支持向量机的人脸检测[J];计算机与数字工程;2003年01期
5 徐科;崔志明;;基于搜索历史的用户兴趣模型的研究[J];计算机技术与发展;2006年05期
6 许春漫;;数字图书馆个性化信息检索模型研究[J];现代图书情报技术;2006年03期
7 乔晓明;刘有耀;;基于粗糙集理论和FCM的图像聚类方法[J];微计算机信息;2007年12期
8 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
9 许天亮;王义峰;曾平;;个性化元搜索引擎技术研究[J];电子科技;2008年01期
10 张东娜;刘博;;三种属性约简方法的比较研究[J];电脑知识与技术;2008年04期
中国重要会议论文全文数据库 前10条
1 曾建国;陈光梦;;基于张量分解的动态纹理合成技术研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
2 倪蓉蓉;阮秋琦;;一种新的数字水印算法的研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 王修运;柏森;李秀;刘阳;粘永健;;基于图像直方图不变矩和奇异值分解的图像认证方法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
4 徐慧英;朱信忠;赵建民;殷建平;;基于分块奇异值分解的数字水印算法及实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 李蓓;金聪;;基于奇异值分解的数字水印算法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 聂秀山;关华勇;关东东;;基于奇异值分解的三维网格数字水印算法[A];第十二届全国图象图形学学术会议论文集[C];2005年
7 聂秀山;矫立峰;钱建磊;刘杰英;;一种基于SVD的三维模型数字水印算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 杜先峰;张爱辉;任震林;丁文霞;;一种嵌入位置随机变化的数字视频可见水印算法[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
9 刘俊景;蒋华;;一种基于离散余弦变换与奇异值分解的数字图像水印算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 余香敏;焦占亚;;一种基于DWT与SVD的数字图像水印算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
中国博士学位论文全文数据库 前10条
1 梁毅雄;基于子空间分析的人脸特征提取及识别研究[D];重庆大学;2005年
2 胡蓉;增量机器学习算法研究[D];南京理工大学;2013年
3 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
4 梁栋;基于多视图的参数估计与形状重构[D];安徽大学;2002年
5 吕英华;信息隐藏相关方法及应用的研究[D];吉林大学;2007年
6 刘艳艳;子空间特征提取方法及其在人脸识别中的应用[D];大连理工大学;2008年
7 荆永君;教育资源分布式配送与调度算法研究[D];东北师范大学;2008年
8 王好贤;数字视频水印嵌入和抽取算法研究[D];哈尔滨工业大学;2008年
9 陆铭;WEB2.0网络热点发现与个性化检索研究[D];中国科学技术大学;2012年
10 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 孙鑫;元搜索引擎结果个性化排序的研究与实现[D];中国石油大学;2008年
2 崔顷顷;基于个性化搜索的系统研究与设计[D];北京交通大学;2011年
3 魏雪娟;基于傅立叶变换技术的人脸识别系统[D];四川大学;2005年
4 龙开文;基于模板匹配的人脸检测[D];四川大学;2005年
5 李娅;个性化智能元搜索引擎模型研究[D];西南大学;2006年
6 廖文彬;基于矩阵奇异值分解的图像压缩方法研究[D];成都理工大学;2007年
7 范河淋;分布式文档管理系统的研究和实现[D];西北大学;2008年
8 王炫盛;基于Lanczos双对角化过程的非负矩阵快速分解的初始化方法[D];厦门大学;2009年
9 苏盛曲;图像信息隐藏中的数字水印技术研究[D];南昌大学;2010年
10 许国梁;应用于数字视频监控系统的人脸识别技术[D];中国人民解放军国防科学技术大学;2002年
,本文编号:562366
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/562366.html