面向网络化制造资源的垂直搜索技术研究与应用
发布时间:2021-11-29 04:35
本文是在谢庆生教授主持的中国国家自然科学基金资助项目“面向协同商务制造资源管理的关键技术研究”(计划批准号:50475185),国家863计划项目”面向机电行业的ASP应用服务平台开发与应用”(课题编号:2003AA414013、2004AA414070),国家863计划项目”面向ASP平台的产品创新设计与制造资源管理构件的研究和应用”(课题编号:2002AA415310)等项目的支撑下,以制造业信息化理论方法为基础,以区域汽车零部件等行业为应用背景,对网络化制造系统建模及应用实现等进行研究。网络化制造资源检索是实现网络化制造的基础技术,其核心是利用网络寻求合适的企业合作伙伴,实现企业间的资源共享、优势互补,提高企业竞争力。这也是本论文的研究目的。在贵州大学现代制造技术实验室现有研究的基础上,本文着重研究了面向网络化制造资源检索系统的主题爬虫设计和中文分词技术。主题爬虫技术主要包括种子链接的获取、爬行算法、相似度分析、页面解析、摘要技术等。通过在主题爬虫中增加评价网页模块,让程序优先抓取与主题相似度高的网页中的链接,提高了爬虫的工作效率。在中文分词模块,通过一种改进的词典存储格式及相应...
【文章来源】:贵州大学贵州省 211工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
基于TR工E索引树的分词词典叽制3)基于逐字二分的分词词典机制逐字二分词典机制是在整词二分词典机制上的一种改进方案
图5一3:新的基于PA丁 RICIAtree的分词词典机制5)双字哈希机制由图5一4可知,该词典结构由三部分组成[到:(l)首字Hash索引,首字Hash索引的每个单元包括三项内容:①关键字(2字节):词的第一个汉字A;②是否为词(lbio:标示单个首字A是否为词;③次字Hash索引指针(4字节):指向以汉字A起始的所有词语的第二个汉字的索引。(2)次字Hash索引(仅对能跟第一个字构成’词或i司的前缀’的字建立,与第一个字无关的汉字并无相应结点)次字Hash索引的每个单元也包括三项内容:①关键字(2字节):词的第二个汉字B:一45一
【参考文献】:
期刊论文
[1]Web文本分类技术研究及其实现[J]. 饶文碧,柯慧燕. 计算机技术与发展. 2006(03)
[2]Internet上文本的自动摘要技术[J]. 尹存燕,戴新宇,陈家骏. 计算机工程. 2006(03)
[3]基于ASP的动态联盟制造资源管理框架研究[J]. 李少波,谢庆生. 中国机械工程. 2005(06)
[4]元搜索引擎的原理与设计[J]. 郭少友. 情报科学. 2005(02)
[5]主题爬虫的设计与实现[J]. 汪涛,樊孝忠. 计算机应用. 2004(S1)
[6]一种基于文章主题和内容的自动摘要方法[J]. 陈燕敏,王晓龙,刘远超,楼喜中. 计算机工程与应用. 2004(33)
[7]基于Lucene的搜索引擎设计与实现[J]. 高琰,谷士文,谭立球,费耀平. 微机发展. 2004(10)
[8]基于智能技术的生物资源搜索引擎[J]. 许彦彬,倪远平,胡晓. 计算机工程与设计. 2004(09)
[9]中文信息检索引擎中的分词与检索技术[J]. 吴栋,滕育平. 计算机应用. 2004(07)
[10]使用Java编程解析Web页面[J]. 刘遵雄,聂国星. 计算机系统应用. 2004(07)
博士论文
[1]自动主题搜索的应用研究[D]. 陈定权.中国科学院研究生院(文献情报中心) 2003
硕士论文
[1]主题搜索引擎中网络蜘蛛搜索策略研究[D]. 陈杰.浙江大学 2006
[2]主题搜索引擎研究[D]. 李东升.哈尔滨工程大学 2005
本文编号:3525853
【文章来源】:贵州大学贵州省 211工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
基于TR工E索引树的分词词典叽制3)基于逐字二分的分词词典机制逐字二分词典机制是在整词二分词典机制上的一种改进方案
图5一3:新的基于PA丁 RICIAtree的分词词典机制5)双字哈希机制由图5一4可知,该词典结构由三部分组成[到:(l)首字Hash索引,首字Hash索引的每个单元包括三项内容:①关键字(2字节):词的第一个汉字A;②是否为词(lbio:标示单个首字A是否为词;③次字Hash索引指针(4字节):指向以汉字A起始的所有词语的第二个汉字的索引。(2)次字Hash索引(仅对能跟第一个字构成’词或i司的前缀’的字建立,与第一个字无关的汉字并无相应结点)次字Hash索引的每个单元也包括三项内容:①关键字(2字节):词的第二个汉字B:一45一
【参考文献】:
期刊论文
[1]Web文本分类技术研究及其实现[J]. 饶文碧,柯慧燕. 计算机技术与发展. 2006(03)
[2]Internet上文本的自动摘要技术[J]. 尹存燕,戴新宇,陈家骏. 计算机工程. 2006(03)
[3]基于ASP的动态联盟制造资源管理框架研究[J]. 李少波,谢庆生. 中国机械工程. 2005(06)
[4]元搜索引擎的原理与设计[J]. 郭少友. 情报科学. 2005(02)
[5]主题爬虫的设计与实现[J]. 汪涛,樊孝忠. 计算机应用. 2004(S1)
[6]一种基于文章主题和内容的自动摘要方法[J]. 陈燕敏,王晓龙,刘远超,楼喜中. 计算机工程与应用. 2004(33)
[7]基于Lucene的搜索引擎设计与实现[J]. 高琰,谷士文,谭立球,费耀平. 微机发展. 2004(10)
[8]基于智能技术的生物资源搜索引擎[J]. 许彦彬,倪远平,胡晓. 计算机工程与设计. 2004(09)
[9]中文信息检索引擎中的分词与检索技术[J]. 吴栋,滕育平. 计算机应用. 2004(07)
[10]使用Java编程解析Web页面[J]. 刘遵雄,聂国星. 计算机系统应用. 2004(07)
博士论文
[1]自动主题搜索的应用研究[D]. 陈定权.中国科学院研究生院(文献情报中心) 2003
硕士论文
[1]主题搜索引擎中网络蜘蛛搜索策略研究[D]. 陈杰.浙江大学 2006
[2]主题搜索引擎研究[D]. 李东升.哈尔滨工程大学 2005
本文编号:3525853
本文链接:https://www.wllwen.com/kejilunwen/jixiegongcheng/3525853.html