当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎广告用户行为预测与特征分析

发布时间:2018-10-25 10:24
【摘要】:介绍了搜索引擎广告系统的基本运作模式。通过对广告四元组的特征提取、特征值平滑等操作,将广告记录解析成为训练数据,并将数据分为训练集和测试集,使用支持向量机算法并利用训练集训练出的模型将测试集分类,从而预测出用户的行为。通过对特征的分析,得出对用户行为预测准确率影响最大的特征是点击率。实验证明,在使用该模型中所有特征的情况下,分类的准确率能够达到83.17%。
[Abstract]:This paper introduces the basic operation mode of search engine advertising system. By extracting features of quaternion and smoothing feature value, the advertisement record is parsed into training data, and the data is divided into training set and test set. By using support vector machine (SVM) algorithm and using the model trained by training set, the test set is classified to predict the user's behavior. Based on the analysis of the features, it is concluded that the most important feature that affects the accuracy of user behavior prediction is the click-through rate. The experimental results show that the classification accuracy can reach 83.17 when all the features in the model are used.
【作者单位】: 北京大学光华管理学院;中国民生银行博士后工作站;北京大学信息科学技术学院;中国民生银行科研培训学院;
【基金】:国家自然科学基金资助项目(61272343) 国家教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题(2011110)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前3条

1 高洁,吉根林;文本分类技术研究[J];计算机应用研究;2004年07期

2 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期

3 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[J];微电子学与计算机;2006年09期

【共引文献】

相关期刊论文 前10条

1 陈基漓;牛秦洲;;WEB挖掘在农业信息网站个性化服务中的应用[J];安徽农业科学;2008年35期

2 陈键;胡学刚;;词分布均衡度评价特征词选取方法的文本分类[J];安徽科技学院学报;2009年02期

3 李玉擰;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期

4 李荣艳;金鑫;王春辉;郑宁;别荣芳;;一种新的中文文本分类算法[J];北京师范大学学报(自然科学版);2006年05期

5 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期

6 袁晓峰;;一种基于主题的Web文本聚类算法[J];成都大学学报(自然科学版);2010年03期

7 冀胜利;李波;;基于SVM的中文文本分类算法[J];重庆工学院学报(自然科学版);2008年07期

8 殷宏威;赵伟;杨志伟;;蚁群算法在KNN文本分类中的应用[J];长春理工大学学报(自然科学版);2010年01期

9 吕佳;;基于改进分类模型的文本分类系统实现[J];重庆师范大学学报(自然科学版);2009年02期

10 李家兵;;基于交叉覆盖算法的文本分类研究[J];滁州学院学报;2008年05期

相关会议论文 前10条

1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年

2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年

4 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年

5 曹玉娟;牛振东;彭学平;江鹏;;一个基于特征向量的近似网页去重算法[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年

6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

7 门洪;武玉杰;李小英;高艳春;;基于支持向量机的分类算法研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年

8 郎加云;胡学钢;;电子邮件内容过滤的相关特征研究[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

9 张宝荣;薛禄宇;丁立芳;刘凤辉;付立娟;张沛刚;孙跃强;;SVM方法在乡镇精细化温度预报中的应用[A];第28届中国气象学会年会——S7城市气象精细预报与服务[C];2011年

10 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

相关博士学位论文 前10条

1 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年

2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年

3 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年

4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年

5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年

6 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年

7 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年

8 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年

9 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年

10 石陆魁;非线性维数约减算法中若干关键问题的研究[D];天津大学;2005年

相关硕士学位论文 前10条

1 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年

2 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年

3 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年

4 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年

5 李琼琼;网络文本自动分类器的设计与实现[D];电子科技大学;2010年

6 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年

7 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年

8 姜国新;支持多语言标签优先的元搜索引擎结果聚类研究[D];浙江工商大学;2011年

9 张宁;基于语义的中文文本预处理研究[D];西安电子科技大学;2011年

10 赵显亮;基于小世界理论的P2P文本检索研究[D];西安电子科技大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期

2 朱寰,阮彤,于庆喜;文本分割算法对中文信息过滤影响研究[J];计算机工程与应用;2002年13期

3 朱明,王军,王俊普;Web网页识别中的特征选择问题研究[J];计算机工程;2000年08期

4 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期

5 贺海军,王建芬,周青,曹元大;基于决策支持向量机的中文网页分类器[J];计算机工程;2003年02期

6 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期

7 马笑潇,黄席樾,柴毅;基于SVM的二叉树多类分类算法及其在故障诊断中的应用[J];控制与决策;2003年03期

8 何新贵,彭甫阳;中文文本的关键词自动抽取和模糊分类[J];中文信息学报;1999年01期

9 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期

10 解冲锋,李 星;基于序列的文本自动分类算法[J];软件学报;2002年04期

【相似文献】

相关期刊论文 前10条

1 秦玉平;艾青;王秀坤;李祥纳;刘卫江;;基于支持向量机的兼类文本分类算法研究[J];计算机工程与设计;2008年02期

2 宋军涛;周铜;杜庆灵;;支持向量机和蚁群算法的网页分类研究[J];计算机工程与应用;2009年17期

3 刘江,郑家恒,张虎;中文文本语料库分词一致性检验技术的初探[J];计算机应用研究;2005年09期

4 王陈飞;肖诗斌;;基于SVM的图像分类研究[J];计算机与数字工程;2006年08期

5 倪丽萍;倪志伟;李锋刚;潘永刚;;基于蚁群算法的SVM模型选择研究[J];计算机技术与发展;2007年09期

6 韦娜;王涛;;结合ReliefF与支持向量机的特征选择方法研究[J];计算机应用与软件;2008年01期

7 石元博;;支持向量机技术在人脸识别考勤机上的应用[J];现代科学仪器;2009年02期

8 赵更寅;邱兆文;;一种基于支持向量机的图像检索方法[J];东北林业大学学报;2009年10期

9 封化民,方卫,刘森,方勇,宋国森;视频分割和关键帧提取统一框架[J];清华大学学报(自然科学版);2005年S1期

10 刘明宇,王珏,燕楠,魏娜,郑崇勋;一种新的注意力相关脑电分类算法设计[J];西安交通大学学报;2005年10期

相关会议论文 前10条

1 张敏情;苏光伟;杨晓元;;保局投影在图像隐密检测中的应用[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

2 宋金伟;刘广利;沈翠华;李迪;;基于支持向量机的织物组织识别方法[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

3 张瑞民;袁震东;;基于小波变换和支持向量机的心电图分类[A];2004中国控制与决策学术年会论文集[C];2004年

4 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

5 刘怡光;游健;张建伟;;基于支持向量的多类分类器设计[A];第十三届全国图象图形学学术会议论文集[C];2006年

6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年

7 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年

8 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年

9 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年

10 乔立岩;彭喜元;彭宇;;基于支持向量机的键盘密码输入异常检测方法研究[A];2004全国测控、计量与仪器仪表学术年会论文集(上册)[C];2004年

相关重要报纸文章 前10条

1 记者 王小海邋实习生 李华炎;电子月饼虽“香”还得小心病毒[N];南方日报;2007年

2 窦毅;荣丰:客户逼出来的ERP[N];中国经营报;2006年

3 通讯员 裴顺强;中国天气网点击率列国内生活服务类网站第一名[N];中国气象报;2009年

4 王泽蕴;eBay撤广告彰显谷歌危机[N];中国计算机报;2007年

5 盖东海;炒股软件夸大功效借牛市蒙钱[N];消费日报;2007年

6 张一君;“点击欺诈”磨钝竞价排名?[N];中国经营报;2006年

7 记者 胡Z,

本文编号:2293431


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2293431.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3cc82***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com