农业科技信息个性化服务推送模型研究
本文选题:信息抽取 + 用户兴趣模型 ; 参考:《计算机应用与软件》2013年06期
【摘要】:针对农业科技信息共享率低、分散分布等问题,应用Web信息抽取方法实现自动采集多源农业科技信息入库,采用XML文件实现失败重试机制。通过对日志文件进行处理,采用改进的k-means聚类方法建立用户访问模式,并得到访问模式的网页特征词及权重的集合,构建用户兴趣模型库,为来访会话推送网页。在实际应用中,定时更新用户模型库,从而保证了站点内容的及时性、推送服务的可靠性、可用性。
[Abstract]:Aiming at the problems of low sharing rate and dispersed distribution of agricultural science and technology information, Web information extraction method is used to automatically collect agricultural science and technology information from many sources into database, and XML file is adopted to realize failure retry mechanism. By processing the log file, the improved k-means clustering method is used to establish the user access pattern, and the set of page feature words and weights of the access pattern is obtained, and the user interest model library is constructed to push the web page for the visiting session. In the practical application, the user model base is updated periodically to ensure the timeliness of the site content, the reliability and availability of the push service.
【作者单位】: 西北农林科技大学信息工程学院;
【基金】:国家科技支撑计划项目(012BAH30F00) 十二五科技支撑项目(2011BAD21D21B05)
【分类号】:TP393.09
【参考文献】
相关期刊论文 前9条
1 陈晨;田凤珍;王克俭;;基于农业知识的网上专业书店的个性化服务[J];安徽农业科学;2011年14期
2 岳广飞;何明祥;;关于我国农业个性化信息服务体系的构想[J];农业网络信息;2009年03期
3 周立柱,林玲;聚焦爬虫技术研究综述[J];计算机应用;2005年09期
4 李春;朱珍民;叶剑;周佳颖;;个性化服务研究综述[J];计算机应用研究;2009年11期
5 焦庆争;蔚承建;;一种可靠信任推荐文本分类特征权重算法[J];计算机应用研究;2010年02期
6 刘军;张净;;基于DOM的网页主题信息的抽取[J];计算机应用与软件;2010年05期
7 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
8 陈媛;苟光磊;;个性化服务用户模型研究[J];计算机工程与设计;2008年09期
9 朱晋华;陈俊杰;;Web日志预处理中会话识别的优化[J];太原理工大学学报;2008年02期
相关硕士学位论文 前2条
1 胡宜敏;农业搜索个性化平台的研究与设计[D];中国科学技术大学;2009年
2 岳中原;词典与统计相结合的中文分词的研究[D];武汉理工大学;2010年
【共引文献】
相关期刊论文 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
3 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期
4 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期
5 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
6 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期
7 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期
8 孙英娟;杨柳;何昆鸟;;属性离散化算法研究[J];长春师范学院学报(人文社会科学版);2009年12期
9 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期
10 陈庆枝;陈国龙;郭文忠;陈仕涛;;信息安全评估日志数据的一种混合聚类算法[J];重庆工学院学报(自然科学版);2009年10期
相关会议论文 前10条
1 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年
2 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
3 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
4 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年
5 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
8 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 余灿玲;王丽珍;张元武;;基于网格密度方向的聚类簇边缘精度加强算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
10 刘尊洋;汪作来;王自荣;余大斌;孙晓泉;;基于谱系法改进FCM的仿造迷彩主色提取方法[A];第九届全国光电技术学术交流会论文集(上册)[C];2010年
相关博士学位论文 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
4 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
5 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
6 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
7 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
8 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
9 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年
10 陈彬;面向DEVS的多范式建模与仿真关键技术研究与实现[D];国防科学技术大学;2010年
相关硕士学位论文 前10条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年
3 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
4 翁岩青;网页抓取策略研究[D];哈尔滨工程大学;2010年
5 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
7 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年
8 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
9 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年
10 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
【二级参考文献】
相关期刊论文 前10条
1 阮怀军,郑宏伟;美国的农业信息服务体系[J];山东农业科学;2001年02期
2 迟秀全;;手机短信平台与推进我国农业信息化的探讨[J];安徽农业科学;2006年18期
3 廖亚莉,王锡钢,战学刚;电子商务的个性化服务[J];鞍山科技大学学报;2004年03期
4 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
5 宋丽哲,牛振东,宋瀚涛,余正涛,师雪霖;数字图书馆个性化服务用户模型研究[J];北京理工大学学报;2005年01期
6 郭影帆,林红斌;我国农业信息资源管理探析[J];商业研究;2004年15期
7 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
8 余战秋;中文分词技术及其应用初探[J];电脑知识与技术;2004年32期
9 曾文;鄢军霞;;城市GIS地名定位工具的设计及应用[J];地球科学;2006年05期
10 ;下一代智能搜索技术[J];新电脑;2006年05期
【相似文献】
相关期刊论文 前10条
1 蓝永健;;基于Lucene的校园网垂直搜索引擎的设计与实现[J];广东教育学院学报;2009年03期
2 余淼;杨丹;赵俊芹;;垂直搜索引擎的关键技术研究[J];软件导刊;2007年23期
3 张敏;;中文垂直搜索引擎研究与实现[J];福建电脑;2010年06期
4 马续补;郭菊娥;;基于GATE的任务信息抽取研究[J];情报杂志;2010年01期
5 郭力军;;RSS个性化信息服务的用户兴趣模型实现与应用[J];计算机与现代化;2010年08期
6 刘建培;;基于Delphi的中文分词设计[J];计算机系统应用;2009年03期
7 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期
8 葛冬梅;;基于内容的个性化、自适应的HTML页面转换[J];黑龙江工程学院学报(自然科学版);2009年03期
9 郑如滨;撒力;谢婷;;基于Heritrix与Lucene的垂直搜索引擎研究[J];电脑知识与技术;2008年29期
10 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
相关会议论文 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 徐志明;宋毅;冯子威;李生;;一种基于分类的用户兴趣模型[A];第六届全国信息检索学术会议论文集[C];2010年
3 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
7 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
8 郭宏蕾;郭志立;;基于模型组合训练机制的特定领域名词性实体识别[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
10 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
相关重要报纸文章 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
4 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
5 记者 李霆钧;国内首个“影视剧植入广告分析系统”出炉[N];中国电影报;2010年
6 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
7 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
8 贺俊;汇聚亿万草根智慧 奇虎发布经验搜索[N];证券日报;2006年
9 记者 杨朝晖;医药搜索:不再“众里寻他千百度”[N];科技日报;2007年
10 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
相关博士学位论文 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
4 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 陆铭;WEB2.0网络热点发现与个性化检索研究[D];中国科学技术大学;2012年
6 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
7 牟冬梅;数字图书馆知识组织语义互联策略及其应用研究[D];吉林大学;2009年
8 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
9 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
10 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
4 全海金;基于用户行为及语义相关实时更新的用户兴趣模型[D];西南师范大学;2005年
5 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
6 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
7 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
8 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
9 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
10 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
,本文编号:1806682
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1806682.html