基于主题词表和FCA的网页语义概念树构建研究
本文关键词:基于主题词表和FCA的网页语义概念树构建研究
更多相关文章: 本体 语义概念树 形式概念分析 主题词表 词语相似度
【摘要】:针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的意义,具有一定的应用价值和借鉴意义。
【作者单位】: 中国人民大学信息学院;中国地质调查局发展研究中心信息工程室;
【关键词】: 本体 语义概念树 形式概念分析 主题词表 词语相似度
【基金】:国家自然科学基金资助项目(70871115)
【分类号】:TP393.092;TP391.1
【正文快照】: 随着信息技术的快速发展,特别是互联网的应用及普及,网络信息存储呈爆炸式增加趋势。互联网作为信息的主要生产源,已经从普通的静态文本、图像的存储媒介,转向交互式的网络信息平台发展。对于大多数的交互式产品来说,往往注重对其技术先进性和功能丰富性的设计,而忽视产品使用
【参考文献】
中国期刊全文数据库 前4条
1 石倩;陈荣;鲁明羽;;基于规则归纳的信息抽取系统实现[J];计算机工程与应用;2008年21期
2 欧阳纯萍;胡长军;李扬;刘振宇;;一种基于FCA的面向关系数据库的本体学习方法[J];计算机科学;2011年12期
3 张沙清;刘强;张平;陈新;;基于本体语义的制造网格构建机理研究[J];计算机应用研究;2008年08期
4 黄果;周竹荣;;基于领域本体的概念语义相似度计算研究[J];计算机工程与设计;2007年10期
【共引文献】
中国期刊全文数据库 前10条
1 高炜;梁立;;基于概念匹配的本体映射算法[J];安徽大学学报(自然科学版);2010年06期
2 闻敬谦;李青;;基于本体的语义相似在维修案例推理中应用[J];北京航空航天大学学报;2009年02期
3 张兰芳;;一种基于本体的自然语言语义相似度算法[J];桂林理工大学学报;2012年02期
4 江磊;郑彦;余志虎;;基于概念树的语义相似度计算的研究[J];广东通信技术;2010年08期
5 李从东;高杨;赵映红;;突发事件应急管理中的情景适应度研究[J];电子科技大学学报(社科版);2012年04期
6 向程冠;熊世桓;;基于CSS视觉分块的Web碎片信息抽取算法[J];计算机光盘软件与应用;2013年16期
7 侯丽鑫;郑山红;贺海涛;赵辉;韩冬;;融合概念格约简的中文领域本体学习方法[J];吉林大学学报(信息科学版);2013年06期
8 王堂;曹宝香;芦效峰;杨义先;钮心忻;;基于汉字字段的关系数据库数字水印研究[J];计算机科学;2011年12期
9 张忠平;赵海亮;张志惠;;基于本体的概念相似度计算[J];计算机工程;2009年07期
10 胡金柱;周星;舒江波;熊春秀;;基于启发式规则的网页主题信息精确定位方法[J];计算机应用研究;2010年02期
中国重要会议论文全文数据库 前2条
1 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 左万利;王英;高金;赵静宇;邵慧勇;;基于本体的语义查询优化[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前7条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
3 贺颖;基于科学计量视角的同行评议专家遴选问题研究[D];天津大学;2008年
4 谢晓兰;制造网格若干关键技术研究[D];西安电子科技大学;2009年
5 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年
6 胡燕;基于粗糙集的转炉炼钢知识发现及终点控制模型研究[D];重庆大学;2013年
7 王毅;注塑模改模知识的增量式发现研究[D];广东工业大学;2014年
中国硕士学位论文全文数据库 前10条
1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
2 刘小齐;可复用测试用例的分类与智能检索研究[D];华东理工大学;2011年
3 刘钊;基于映射结果集合的本体映射算法[D];吉林大学;2011年
4 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年
5 蔡开敏;基于本体映射的概念相似性算法研究[D];华中师范大学;2011年
6 塔娜;面向跨语言信息检索的蒙汉语义词典构建[D];内蒙古师范大学;2011年
7 王利鑫;文本自动比对研究与应用[D];南京信息工程大学;2011年
8 孙凯;自动答疑系统中的问句理解与个性化推荐算法研究[D];南京信息工程大学;2011年
9 田竹;基于本体和SWRL推理的知识检索方法研究[D];电子科技大学;2011年
10 江磊;领域词典的构建及其在语法分析中的应用[D];南京邮电大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 林亚平,刘云中,周顺先,陈治平,蔡立军;基于最大熵的隐马尔可夫模型文本信息抽取[J];电子学报;2005年02期
3 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
4 李晶;陈恩红;;Web信息抽取[J];计算机科学;2003年06期
5 黄美丽;刘宗田;;基于形式概念分析的领域本体构建方法研究[J];计算机科学;2006年01期
6 周文;刘宗田;陈慧琼;;FCA与本体结合研究的综述[J];计算机科学;2006年02期
7 王洪伟;伊磊;王洪滨;;面向关系模式的领域本体获取[J];计算机工程;2007年03期
8 潘谦红,王炬,史忠植;基于属性论的文本相似度计算[J];计算机学报;1999年06期
9 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
10 吴健,吴朝晖,李莹,邓水光;基于本体论和词汇语义相似度的Web服务发现[J];计算机学报;2005年04期
中国博士学位论文全文数据库 前1条
1 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前1条
1 韩贵来;基于Agent的语义网格通信研究[D];广东工业大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 蒋林宙,陈红亚;对《中国分类主题词表》修订的特点分析及其建议[J];现代情报;2003年10期
2 ;隆重推出《中国分类主题词表》(第二版,电子版)[J];国家图书馆学刊;2004年04期
3 罗庭芝,郑建民;浅论《中国分类主题词表》的修订[J];图书馆;2004年06期
4 卜书庆;汪东波;;网络时代《中国分类主题词表》的发展与应用[J];图书情报工作;2005年07期
5 秦健;;实践中的主题词表及其应用专辑:都柏林元数据年会论文选登[J];现代图书情报技术;2006年01期
6 Wonsook Lee;Shigeo Sugimoto;;建立网络社区主题通道的核心主题词表(英文)[J];现代图书情报技术;2006年01期
7 熊伟;第五太卓;刘蓉辉;丁磊雷;;高校校本公文主题词表编制问题研究[J];陕西教育学院学报;2006年01期
8 陈志新;;《中国分类主题词表》的两种对应依据[J];国家图书馆学刊;2006年02期
9 陈志新;;《中国分类主题词表》的理论基础[J];图书馆理论与实践;2006年03期
10 赵永莲;;浅谈《中国分类主题词表》电子版的应用[J];科技情报开发与经济;2006年15期
中国重要会议论文全文数据库 前1条
1 雷瑜良;杨应全;吴伟兰;;《高等教育分类主题词表》编制与特点分析[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前1条
1 秦秋;中医药主题词表国家标准出台[N];中国医药报;2005年
中国硕士学位论文全文数据库 前4条
1 仲云云;电子政务主题词表的构建及应用研究[D];南京农业大学;2007年
2 牛雅楠;WordNet和《中国分类主题词表》的映射研究[D];山西大学;2011年
3 李力人;基于林业主题词表语义关系网的文献聚类[D];北京林业大学;2010年
4 李艳;分众分类与受控词表的集成研究[D];山西大学;2013年
,本文编号:807779
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/807779.html