当前位置:主页 > 科技论文 > 搜索引擎论文 >

整合Dmoz和Yahoo标签的BNF文法及其实现

发布时间:2018-03-01 14:20

  本文关键词: 自然语言处理 巴克斯范式 文法 网络挖掘 文档分类 标签 搜索引擎 整合 模式 程序 出处:《计算机工程与设计》2009年19期  论文类型:期刊论文


【摘要】:Dmoz和Yahoo的标签采用不同的文法。为了统一它们的文法以利于搜索引擎的检索,对它们的标签结构进行了分析,统计出了相关的数据,并根据这些数据得出分别用于描述这两种标签结构的BNF(Backus-NaurForm)文法,然后将这两个BNF文法整合成一个,并应用JavaCC(Java Compiler Compiler)实现了对该文法的检测。在这个BNF文法的指导下,程序能够有效地判断一个标签模式是否满足Dmoz和Yahoo标签文法,为Web挖掘提供了良好的检测工具。
[Abstract]:The tags of Dmoz and Yahoo adopt different grammars. In order to unify their grammars to facilitate search engine search, the tag structure of Dmoz and Yahoo is analyzed, and the relevant data are obtained. Based on these data, the BNFN Backus-NaurForm grammar, which is used to describe the two tag structures, is obtained, and then the two BNF grammars are integrated into one, and the JavaCC(Java Compiler Compiler is applied to implement the detection of the grammar. Under the guidance of the BNF grammar, The program can effectively judge whether a tag pattern satisfies Dmoz and Yahoo tag grammar, and provides a good detection tool for Web mining.
【作者单位】: 吉林大学计算机科学与技术学院;
【基金】:国家自然科学基金项目(60673023、10872077) 国家863高技术研究发展计划基金项目(2007AA04Z114) 广东省教育部产学研合作基金项目(2007B090400031) 欧盟国际合作基金项目(TH/AsiaLink/010(111084)) 吉林省科技发展计划基金项目(20080708)
【分类号】:TP391.1

【参考文献】

相关期刊论文 前5条

1 侯国峰;一个自然语言理解系统的设计和实现[J];计算机应用研究;2001年02期

2 李滔,王俊普,徐杨;一种基于粗糙集的网页分类方法[J];小型微型计算机系统;2003年03期

3 马竹根;一种自然语言理解中语法分析的算法设计和实现[J];计算机时代;2005年10期

4 王建涛,胡明玲;基于开放目录的质量受控学科信息门户研究[J];图书情报工作;2005年11期

5 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期

【共引文献】

相关期刊论文 前10条

1 盛晓炜,江铭虎;基于Rough集约简算法的中文文本自动分类系统[J];电子与信息学报;2005年07期

2 孙宏纲,姚景顺,闫国玉;基于自然语言理解的军事自动标图系统[J];火力与指挥控制;2005年S1期

3 陈周娟;续海峰;钮王杰;;基于静态知识库的领域内自然语言理解的语义处理研究[J];机床与液压;2007年07期

4 刘壁松,李春平;一个可扩展的文本分类系统的设计与实现[J];计算机工程与应用;2004年30期

5 赵鹏;蔡庆生;;一种基于《知网》的中文文本聚类算法的研究[J];计算机工程与应用;2007年12期

6 宋枫溪,高林;文本分类器性能评估指标[J];计算机工程;2004年13期

7 马竹根;一种自然语言理解中语法分析的算法设计和实现[J];计算机时代;2005年10期

8 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期

9 郭森,王知衍,吴志成,严和平;基于粗糙集理论的增量式规则获取[J];计算机应用;2005年11期

10 朱宏辉,曾开来,查靓,陈定方;控制系统自动设计中的自然语言理解[J];武汉理工大学学报(交通科学与工程版);2003年02期

相关会议论文 前1条

1 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

相关博士学位论文 前10条

1 彭强;复杂系统远程智能故障诊断技术研究[D];南京理工大学;2004年

2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年

3 谷建军;基于叙词表的中医古籍文献领域本体建模方法研究[D];中国中医科学院;2006年

4 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年

5 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年

6 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年

7 胡静;机器学习及其神经网络分类器优化设计[D];合肥工业大学;2007年

8 王晓嘉;旋转对称三角传感器智能信号处理系统研究[D];合肥工业大学;2007年

9 朱宏辉;基于知识驱动的拟人智能控制系统若干关键技术研究[D];武汉理工大学;2006年

10 裴小兵;粗糙集的知识约简研究[D];华中科技大学;2006年

相关硕士学位论文 前10条

1 贾建华;语音合成及语音处理[D];中南大学;2002年

2 王玉美;基于神经网络的汉语文法分析专家系统的设计与实现[D];北京工业大学;2003年

3 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年

4 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年

5 王书青;基于粗糙集理论的数据挖掘研究[D];河北农业大学;2004年

6 杨晓东;基于贝叶斯网络的配电网可靠性评估[D];华北电力大学(河北);2004年

7 蒋超;轨道交通自动门远程监控系统中的智能故障诊断技术研究[D];南京理工大学;2004年

8 赵银春;用户浏览内容分析与用户兴趣挖掘[D];重庆大学;2004年

9 朱爱华;粗糙集理论在Web信息过滤中的应用研究[D];四川大学;2005年

10 祝翠玲;基于无监督聚类和朴素贝叶斯分类的文本分类方法研究[D];山东大学;2005年

【二级参考文献】

相关期刊论文 前10条

1 沙淑欣;情报检索语言研究综述[J];国家图书馆学刊;2004年03期

2 曹青;检索语言研究综述[J];北京教育学院学报;2000年04期

3 曹青;情报检索中对自然语言的控制[J];北京教育学院学报;2001年01期

4 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期

5 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期

6 张丽;情报检索语言及控制[J];佳木斯大学社会科学学报;2004年04期

7 李克荣;网络信息资源组织中传统分类法的应用[J];新世纪图书馆;2005年06期

8 侯国峰;一个自然语言理解系统的设计和实现[J];计算机应用研究;2001年02期

9 魏振枢;初峰;郭晓玉;吕志远;孙江虹;;旅游专业文献检索教材建设探讨[J];焦作大学学报;2006年04期

10 李庆亮,张彦峰;人工智能的应用及发展前景[J];洛阳师范学院学报;1998年02期

【相似文献】

相关期刊论文 前10条

1 ;日本图书情报大学的课程[J];现代图书情报技术;1981年02期

2 沈迪飞;;一门新兴的实验学科——情报检索[J];情报科学;1981年02期

3 Peter Wegner;饶生忠;;软件技术研究方向[J];计算机科学;1981年02期

4 怡林;中国中文信息研究会召开新春学术座谈会[J];计算机研究与发展;1983年04期

5 耿立大;;自然语言信息加工和人工智能[J];情报科学;1983年04期

6 爱德华·A德格里戈略;叶自健;;适用于潜艇作战指挥环境的基于知识的系统——用自然语言对话的人/机系统指挥控制[J];火力与指挥控制;1983年04期

7 钱锋;;计算机科学与机器翻译的相互影响[J];计算机科学;1983年03期

8 ;《中文信息》已于十月创刊[J];微计算机应用;1984年04期

9 陆玉昌,张再兴;第六届欧洲人工智能会议论文综述[J];机器人;1985年06期

10 丁自;情报检索的未来方向(续)[J];情报杂志;1985年04期

相关会议论文 前10条

1 林耀q,

本文编号:1552309


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1552309.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户40f67***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com