深层网技术在专利数据提取中的应用
本文选题:专利检索 切入点:深层网 出处:《计算机与应用化学》2011年08期 论文类型:期刊论文
【摘要】:深层网技术是获取隐藏在以表单为特征的网络数据库检索入口后的数据页面的提取技术,解决了通用搜索引擎不能有效索引深层网网页的问题。专利数据是一类重要的深层网数据资源,对其进行提取、挖掘具有重要意义。本文利用深层网技术开发了一个专利检索系统,实现了对中国和美国专利数据的本地检索、提取和下载,以及针对中国专利的法律状态检索。该软件支持专利的批量下载及文件管理,并根据中国和美国专利显示为多个单页TIFF格式图片不利于本地管理和浏览的特点,开发了实用性较强的TIFF格式图片多页合并和通用PDF格式转换功能。该专利检索系统采用面向用户的界面设计和功能开发,具有简单、易用的特点。
[Abstract]:Deep web technology is the technology of extracting data pages hidden behind the retrieval entry of a network database characterized by forms. It solves the problem that the general search engine can not effectively index the deep web pages. Patent data is a kind of important deep web data resource. Mining is of great significance. In this paper, a patent retrieval system based on deep web technology is developed to retrieve, extract and download patent data from China and the United States. The software supports batch downloading and file management of patents, and according to the characteristics of Chinese and American patents displaying multiple single-page TIFF format images is not conducive to local management and browsing. The functions of multi-page merging in TIFF format and conversion of general PDF format are developed. The patent retrieval system adopts user-oriented interface design and function development, which is simple and easy to use.
【作者单位】: 中国科学院过程工程研究所多相复杂系统国家重点实验室;
【基金】:国家自然科学基金资助项目(20673119,90612015,20221603,20821092)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 邵诚敏,仇琛;两大中国专利检索系统的比较分析[J];现代图书情报技术;2005年04期
2 黄月;中国专利检索系统的比较分析[J];科技情报开发与经济;2003年10期
3 陈丽君;;深层网网络爬虫设计[J];计算机与信息技术;2009年Z2期
4 ;网上专利文献检索[J];科技通报;2011年01期
5 李晓艳;;网上专利信息的检索[J];科技文献信息管理;2003年02期
6 刘睿智;胡新明;;批量下载工具与Sas程序在实证研究中的应用[J];中国管理信息化;2009年06期
7 徐慧芳;陈朝晖;郑菲;谢华玲;彭皓;陈芳;;专利文献在科技查新中的应用[J];情报理论与实践;2010年05期
8 温平;;谈谈专利检索系统的建立[J];大学图书馆学报;1985年02期
9 陈丽君;;深层网网络爬虫表单检测器设计[J];科技资讯;2009年16期
10 蔡东蛟;;网上专利全文获取技巧与失效专利开发利用[J];现代情报;2010年01期
相关会议论文 前3条
1 何战科;;IGS数据产品批量下载软件的实现[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
2 王丹;张祥合;;科技期刊实现网络化的关键环节解析[A];第五届全国核心期刊与期刊国际化、网络化研讨会论文集[C];2007年
3 李菲;;IPv6技术领域专利文献分析[A];发展知识产权服务业,支撑创新型国家建设-2012年中华全国专利代理人协会年会第三届知识产权论坛论文选编(第一部分)[C];2011年
相关重要报纸文章 前10条
1 王春;“龙头”就是先行先试[N];科技日报;2005年
2 管运涛 杨宏伟;我国水处理专利申请发展趋势[N];中国水利报;2004年
3 徐骏 史珂;江苏专利工作要上“快车道”[N];江苏经济报;2003年
4 本报记者 戴彦;摩托车行业知识产权基础工作薄弱[N];中国汽车报;2002年
5 本报记者 赵建国;中小企业上市应切实注重专利管理[N];中国知识产权报;2010年
6 王春;浦东新区经济发展实现高起点高标准[N];科技日报;2003年
7 记者 张晔;国家专利技术展示交易分中心落户南京[N];科技日报;2011年
8 宁伟 本报记者 姜云飞;信息产业搭建公共平台化危为“机”[N];大连日报;2008年
9 本报记者 贺延芳;我国专利信息资源建设迈上新台阶[N];中国知识产权报;2011年
10 本报记者 王乃迎;文献记录发明创造 专利服务美好生活[N];中国档案报;2011年
相关硕士学位论文 前6条
1 傅立云;国内外三大专利检索系统比较研究[D];湘潭大学;2010年
2 李三义;基于模型匹配的Deep Web数据库分类[D];吉林大学;2010年
3 郭若飞;支持Ajax的Deep Web爬虫技术研究[D];苏州大学;2010年
4 武丽平;基于语用信息的中文专利检索系统[D];北京邮电大学;2011年
5 夏云飞;专利授权期的有效管理研究[D];四川大学;2003年
6 余筱雨;论专利文献分析在企业发展中的作用[D];云南大学;2010年
,本文编号:1652522
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1652522.html