当前位置:主页 > 管理论文 > 移动网络论文 >

潜在狄利克雷分配模型在网络日志的应用

发布时间:2019-07-03 18:47
【摘要】:近年来,基于Web日志的数据挖掘技术逐渐成为理论研究和商业应用中的热点问题,而其中Web用户分类又是挖掘领域中最重要的研究主题之一.对Web用户分类能够发现用户之间相似的用户行为,从而针对具体用户群设置对应的服务项目.根据用户的历史访问网页地址(URL)信息,提出了基于加权潜在狄利克雷分配(LDA)模型的用户分类方法,将用户划分到不同的主题群体,实验表明,这种方法能达到很好的分类效果.
[Abstract]:In recent years, data mining technology based on Web log has gradually become a hot issue in theoretical research and commercial application, and Web user classification is one of the most important research topics in the field of mining. The classification of Web users can find similar user behavior between users, so that the corresponding service items can be set up for specific user groups. According to the (URL) information of web page address visited by users, a user classification method based on weighted potential Dirichlet assignment (LDA) model is proposed, which divides users into different subject groups. Experiments show that this method can achieve good classification effect.
【作者单位】: 厦门大学信息科学与技术学院;厦门网宿科技股份有限公司;
【分类号】:TP393.09

【参考文献】

相关期刊论文 前3条

1 刘加伶;范军;;基于用户访问树的Web日志挖掘数据预处理[J];计算机科学;2009年09期

2 崔凯;周斌;贾焰;梁政;;一种基于LDA的在线主题演化挖掘模型[J];计算机科学;2010年11期

3 石晶;胡明;石鑫;戴国忠;;基于LDA模型的文本分割[J];计算机学报;2008年10期

相关博士学位论文 前2条

1 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年

2 朱志国;Web用户使用模式与兴趣挖掘方法研究[D];大连理工大学;2010年

相关硕士学位论文 前1条

1 王华;基于遗传算法的Web日志挖掘的应用研究[D];安徽工业大学;2011年

【共引文献】

相关期刊论文 前10条

1 吴永辉;王晓龙;丁宇新;徐军;郭鸿志;;基于主题的自适应、在线网络热点发现方法及新闻推荐系统[J];电子学报;2010年11期

2 胡艳丽;白亮;张维明;;网络舆情中一种基于OLDA的在线话题演化方法[J];国防科技大学学报;2012年01期

3 曹智勇;陈妤倩;;基于数据挖掘的网络教学决策支持系统研究[J];计算机光盘软件与应用;2012年15期

4 王小芳;王瑞芳;张树功;;基于最优化控制模型的文本主题域划分[J];吉林大学学报(理学版);2009年04期

5 崔凯;周斌;贾焰;梁政;;一种基于LDA的在线主题演化挖掘模型[J];计算机科学;2010年11期

6 石晶;李万龙;;基于LDA模型的主题词抽取方法[J];计算机工程;2010年19期

7 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期

8 刘培奇;孙捷焓;;基于LDA主题模型的标签传递算法[J];计算机应用;2012年02期

9 武浩;王美姣;冯佳明;裴以建;;专家检索研究进展[J];计算机应用研究;2010年10期

10 张小平;周雪忠;黄厚宽;冯奇;陈世波;;基于词相似性与CRP的主题模型[J];模式识别与人工智能;2010年01期

相关会议论文 前1条

1 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年

相关博士学位论文 前8条

1 丁轶群;基于概率生成模型的文本主题建模及其应用[D];浙江大学;2010年

2 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年

3 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年

4 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年

5 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年

6 李博;基于LDA和LSA的医学文本和影像分析模型及应用研究[D];吉林大学;2012年

7 张冬梅;文本情感分类及观点摘要关键问题研究[D];山东大学;2012年

8 贾冬梅;基于数据挖掘方法的聂莉芳教授治疗慢性肾小球肾炎经验研究[D];中国中医科学院;2012年

相关硕士学位论文 前10条

1 王秀锋;网络环境下异构日志信息获取和预处理研究[D];哈尔滨工程大学;2010年

2 田凤珍;基于Web的用户个性化服务研究[D];河北农业大学;2011年

3 杨鹏;Web日志挖掘数据预处理算法研究与实现[D];北京邮电大学;2011年

4 马晓娟;基于E-learning的用户学习行为分析及应用研究[D];华中师范大学;2011年

5 肖云;基于Web日志挖掘的聚类算法研究[D];安徽大学;2011年

6 李丽;面向交友网站的Web日志关联规则挖掘及系统实现[D];重庆大学;2010年

7 蒋泽;一种基于相似预测的粗糙集预处理研究[D];哈尔滨工程大学;2011年

8 王慧鹏;ⅡS日志挖掘在电子商务网站邮件营销中的应用研究[D];华南理工大学;2011年

9 李红美;云南信息港网站用户行为分析系统的分析与设计[D];北京邮电大学;2012年

10 郭静;最大和最长频繁项集增量更新研究[D];燕山大学;2010年

【二级参考文献】

相关期刊论文 前10条

1 王华;胡学钢;;基于关联规则的数据挖掘在临床上的应用[J];安徽大学学报(自然科学版);2006年02期

2 张立;刘云;;网络舆论传播的无标度特性及其衰减模型的研究[J];北京交通大学学报;2008年02期

3 张小平;周雪忠;黄厚宽;冯奇;陈世波;焦宏官;;一种改进的LDA主题模型[J];北京交通大学学报;2010年02期

4 张辉;宋瀚涛;徐晓梅;;基于语义的Web用户会话识别算法[J];北京理工大学学报;2007年06期

5 纪良浩;王国胤;杨勇;;基于协作过滤的Web日志数据预处理研究[J];重庆邮电学院学报(自然科学版);2006年05期

6 易芝;汪林林;王练;;基于关联规则相关性分析的Web个性化推荐研究[J];重庆邮电大学学报(自然科学版);2007年02期

7 代宇;刘宴兵;程瑶;;基于异步Web Service调用的Web应用程序研究[J];重庆邮电大学学报(自然科学版);2008年06期

8 朱秋云;;一种关联规则挖掘筛选算法设计[J];重庆工学院学报(自然科学版);2008年06期

9 吕佳;;Web日志挖掘技术应用研究[J];重庆师范大学学报(自然科学版);2006年04期

10 李垠含;石岩;;数据挖掘技术在中医研究中的运用初探[J];长春中医药大学学报;2009年01期

相关重要报纸文章 前1条

1 宋小莉;[N];中国中医药报;2004年

相关博士学位论文 前3条

1 郝先中;近代中医废存之争研究[D];华东师范大学;2005年

2 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年

3 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年

相关硕士学位论文 前1条

1 汤亚玲;基于遗传算法的Web关联规则挖掘的研究与设计[D];苏州大学;2004年

【相似文献】

相关期刊论文 前10条

1 黄e,

本文编号:2509594


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2509594.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3299a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com