当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于主题词表和FCA的网页语义概念树构建研究

发布时间:2017-09-07 05:49

  本文关键词:基于主题词表和FCA的网页语义概念树构建研究


  更多相关文章: 本体 语义概念树 形式概念分析 主题词表 词语相似度


【摘要】:针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的意义,具有一定的应用价值和借鉴意义。
【作者单位】: 中国人民大学信息学院;中国地质调查局发展研究中心信息工程室;
【关键词】本体 语义概念树 形式概念分析 主题词表 词语相似度
【基金】:国家自然科学基金资助项目(70871115)
【分类号】:TP393.092;TP391.1
【正文快照】: 随着信息技术的快速发展,特别是互联网的应用及普及,网络信息存储呈爆炸式增加趋势。互联网作为信息的主要生产源,已经从普通的静态文本、图像的存储媒介,转向交互式的网络信息平台发展。对于大多数的交互式产品来说,往往注重对其技术先进性和功能丰富性的设计,而忽视产品使用

【参考文献】

中国期刊全文数据库 前4条

1 石倩;陈荣;鲁明羽;;基于规则归纳的信息抽取系统实现[J];计算机工程与应用;2008年21期

2 欧阳纯萍;胡长军;李扬;刘振宇;;一种基于FCA的面向关系数据库的本体学习方法[J];计算机科学;2011年12期

3 张沙清;刘强;张平;陈新;;基于本体语义的制造网格构建机理研究[J];计算机应用研究;2008年08期

4 黄果;周竹荣;;基于领域本体的概念语义相似度计算研究[J];计算机工程与设计;2007年10期

【共引文献】

中国期刊全文数据库 前10条

1 高炜;梁立;;基于概念匹配的本体映射算法[J];安徽大学学报(自然科学版);2010年06期

2 闻敬谦;李青;;基于本体的语义相似在维修案例推理中应用[J];北京航空航天大学学报;2009年02期

3 张兰芳;;一种基于本体的自然语言语义相似度算法[J];桂林理工大学学报;2012年02期

4 江磊;郑彦;余志虎;;基于概念树的语义相似度计算的研究[J];广东通信技术;2010年08期

5 李从东;高杨;赵映红;;突发事件应急管理中的情景适应度研究[J];电子科技大学学报(社科版);2012年04期

6 向程冠;熊世桓;;基于CSS视觉分块的Web碎片信息抽取算法[J];计算机光盘软件与应用;2013年16期

7 侯丽鑫;郑山红;贺海涛;赵辉;韩冬;;融合概念格约简的中文领域本体学习方法[J];吉林大学学报(信息科学版);2013年06期

8 王堂;曹宝香;芦效峰;杨义先;钮心忻;;基于汉字字段的关系数据库数字水印研究[J];计算机科学;2011年12期

9 张忠平;赵海亮;张志惠;;基于本体的概念相似度计算[J];计算机工程;2009年07期

10 胡金柱;周星;舒江波;熊春秀;;基于启发式规则的网页主题信息精确定位方法[J];计算机应用研究;2010年02期

中国重要会议论文全文数据库 前2条

1 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

2 左万利;王英;高金;赵静宇;邵慧勇;;基于本体的语义查询优化[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

中国博士学位论文全文数据库 前7条

1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年

2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年

3 贺颖;基于科学计量视角的同行评议专家遴选问题研究[D];天津大学;2008年

4 谢晓兰;制造网格若干关键技术研究[D];西安电子科技大学;2009年

5 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年

6 胡燕;基于粗糙集的转炉炼钢知识发现及终点控制模型研究[D];重庆大学;2013年

7 王毅;注塑模改模知识的增量式发现研究[D];广东工业大学;2014年

中国硕士学位论文全文数据库 前10条

1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年

2 刘小齐;可复用测试用例的分类与智能检索研究[D];华东理工大学;2011年

3 刘钊;基于映射结果集合的本体映射算法[D];吉林大学;2011年

4 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年

5 蔡开敏;基于本体映射的概念相似性算法研究[D];华中师范大学;2011年

6 塔娜;面向跨语言信息检索的蒙汉语义词典构建[D];内蒙古师范大学;2011年

7 王利鑫;文本自动比对研究与应用[D];南京信息工程大学;2011年

8 孙凯;自动答疑系统中的问句理解与个性化推荐算法研究[D];南京信息工程大学;2011年

9 田竹;基于本体和SWRL推理的知识检索方法研究[D];电子科技大学;2011年

10 江磊;领域词典的构建及其在语法分析中的应用[D];南京邮电大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 林亚平,刘云中,周顺先,陈治平,蔡立军;基于最大熵的隐马尔可夫模型文本信息抽取[J];电子学报;2005年02期

3 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期

4 李晶;陈恩红;;Web信息抽取[J];计算机科学;2003年06期

5 黄美丽;刘宗田;;基于形式概念分析的领域本体构建方法研究[J];计算机科学;2006年01期

6 周文;刘宗田;陈慧琼;;FCA与本体结合研究的综述[J];计算机科学;2006年02期

7 王洪伟;伊磊;王洪滨;;面向关系模式的领域本体获取[J];计算机工程;2007年03期

8 潘谦红,王炬,史忠植;基于属性论的文本相似度计算[J];计算机学报;1999年06期

9 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期

10 吴健,吴朝晖,李莹,邓水光;基于本体论和词汇语义相似度的Web服务发现[J];计算机学报;2005年04期

中国博士学位论文全文数据库 前1条

1 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年

中国硕士学位论文全文数据库 前1条

1 韩贵来;基于Agent的语义网格通信研究[D];广东工业大学;2005年

【相似文献】

中国期刊全文数据库 前10条

1 蒋林宙,陈红亚;对《中国分类主题词表》修订的特点分析及其建议[J];现代情报;2003年10期

2 ;隆重推出《中国分类主题词表》(第二版,电子版)[J];国家图书馆学刊;2004年04期

3 罗庭芝,郑建民;浅论《中国分类主题词表》的修订[J];图书馆;2004年06期

4 卜书庆;汪东波;;网络时代《中国分类主题词表》的发展与应用[J];图书情报工作;2005年07期

5 秦健;;实践中的主题词表及其应用专辑:都柏林元数据年会论文选登[J];现代图书情报技术;2006年01期

6 Wonsook Lee;Shigeo Sugimoto;;建立网络社区主题通道的核心主题词表(英文)[J];现代图书情报技术;2006年01期

7 熊伟;第五太卓;刘蓉辉;丁磊雷;;高校校本公文主题词表编制问题研究[J];陕西教育学院学报;2006年01期

8 陈志新;;《中国分类主题词表》的两种对应依据[J];国家图书馆学刊;2006年02期

9 陈志新;;《中国分类主题词表》的理论基础[J];图书馆理论与实践;2006年03期

10 赵永莲;;浅谈《中国分类主题词表》电子版的应用[J];科技情报开发与经济;2006年15期

中国重要会议论文全文数据库 前1条

1 雷瑜良;杨应全;吴伟兰;;《高等教育分类主题词表》编制与特点分析[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

中国重要报纸全文数据库 前1条

1 秦秋;中医药主题词表国家标准出台[N];中国医药报;2005年

中国硕士学位论文全文数据库 前4条

1 仲云云;电子政务主题词表的构建及应用研究[D];南京农业大学;2007年

2 牛雅楠;WordNet和《中国分类主题词表》的映射研究[D];山西大学;2011年

3 李力人;基于林业主题词表语义关系网的文献聚类[D];北京林业大学;2010年

4 李艳;分众分类与受控词表的集成研究[D];山西大学;2013年



本文编号:807779

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/807779.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb956***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com