当前位置:主页 > 科技论文 > 软件论文 >

“互联网+”农业小镇资源管理与服务系统的设计与实现

发布时间:2025-01-05 21:05
  在互联网信息快速增长的今天,物流、电商在农业领域快速发展,人们希望能从网络上快速得到自己想要的信息。本文结合农业领域信息具有时效性、信息类别多的特点,将农业信息服务系统、文本分类系统和信息推送系统相结合,探讨实现农业专题信息的智能化推送服务。首先,设计系统的整体框架与流程。研究使用网络爬虫采集网络上与农业相关的文本信息并建立农业专题的搜索引擎,让用户能精确查找到需要的农业信息。在用户使用搜索引擎的过程中,根据用户的检索历史和浏览历史建立用户兴趣模型,以便于系统分析用户对哪一类的信息比较感兴趣。在进行信息推送服务时,使用文本分类器寻找用户感兴趣的信息进行推送。采用扩展的Heritrix网络爬虫采集网络上与农业相关的文本信息并使用文本分类器分类存储,再使用Lucene全文索引框架对这些文本建立索引库,建立农业专题的搜索引擎系统,改善通用搜索引擎在对面向专题的信息时检索深度不够的问题,提高信息检索的准确度。在农业文本信息分类的问题上,采用先自定义分类类别,再用文本分类器对网络爬虫采集到的农业信息文本进行分类的方式。重点探讨了 KNN文本分类器在类别边界处样本分布密度不均匀时导致的分类错误问题。...

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

图1专题搜索引擎总体框架??Fig.l?The?general?framework?of?topic?search?engine??用户通过交互界面接入系统,输入要查询的内容,检索器与索引库对接,在??

图1专题搜索引擎总体框架??Fig.l?The?general?framework?of?topic?search?engine??用户通过交互界面接入系统,输入要查询的内容,检索器与索引库对接,在??

建农业专题词库的过滤器过滤掉与农业不相关的网页链接,然后把与农业相关的??网页信息存放到网页库中。在信息预处理部分通过索引器对对采集到的网页库建??立索引方便系统查询。信息检索部分主要负责与用户的直接对接,如图1所示:??信息检索?'、??I??!???!??!??排序器丨信息预....


图2?Heritrix系统结构图??Fig.2?Heritrix?system?structure??7??

图2?Heritrix系统结构图??Fig.2?Heritrix?system?structure??7??

Heritrix开始工作时,首先从URL列表中选择一""h?URL,根据选定的URL??下载网页信息,然后对这些信息进行分析,根据一定的策略从这些信息中选择??URL加入到URL队列中,以此不断循环。其系统结构图如图2所示:??/? ̄?-?、、??中央控制器??;?1?'?"1?....


图5传统web请求/响应模型??

图5传统web请求/响应模型??

2.S服务推送技术??本课题的最终目标是采用服务推送技术将找到的用户可能感兴趣的信息推??送给用户。传统的Web应用信息交互模型如图5所示:用户端需要数据信息时??主动向Web服务器发送消息请求并建立连接,服务器从数据库中获取数据后再??返回给用户端,最后再将连接断开。但这种每次....


图10KNN分类模型??Fig.lOKNN?classification?model??

图10KNN分类模型??Fig.lOKNN?classification?model??

同水质、寄生虫等相同关键词;病虫害类和气象要闻类的文本也会出现很多如气??温、回暖等相同关键词。这使得向量空间中文本类别边界处会有很多交叉部分,??当类别样本数量不平衡时很容易出现如图11所示的情况:??26??



本文编号:4023263

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4023263.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7249c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com