含有不希望出现句子的网页鉴别问题
本文关键词:含有不希望出现句子的网页鉴别问题
更多相关文章: 网页鉴别 句子 可判定问题 不可判定问题 不可识别问题
【摘要】:网页是传递信息的重要载体,以网页作为研究对象是现今信息检索和信息关联研究的必然趋势.鉴于句子既是传递信息的基本单位,又是表述完整意思的语言单位,本文以句子为出发点对网页鉴别问题进行研究.句子的不同变换形式能够表述相同的含义的特点,给网页鉴别带来了困难.为解决该问题,首先定义句子和网页之间的4种关系:属于关系、同义词替换关系、简单语序变换关系、复杂语序变换关系,然后讨论每一种关系的识别问题,证明了:(1)识别句子和网页的属于关系是可判定问题并且是P问题;(2)识别同义词替换关系是不可判定问题;(3)识别简单语序变换关系是不可判定问题;(4)识别复杂语序变换关系是不可识别问题.上述结论勾画出了网页鉴别问题难易程度的谱系.
【作者单位】: 燕山大学信息科学与工程学院;齐齐哈尔大学计算机与控制工程学院;东华大学计算机科学与技术学院;
【基金】:国家自然科学基金项目(61070032)资助 黑龙江省自然科学基金项目(F201204)资助 齐齐哈尔大学青年教师科研启动项目(2010K-M13)资助
【分类号】:TP393.092
【正文快照】: 1引言网页是当今社会信息传递与获取的主要载体,由于Inter-net节点的自治性,网页上的信息处于不可控状态,这为诈骗、暴力、色情、反动等内容的传播提供了可乘之机.如何有效的甄别这些网页,扼制不良信息的传播,保护特定人群免受恶意信息侵扰,是抵制信息获取干扰的关键问题.网页
【参考文献】
中国期刊全文数据库 前2条
1 孙艳;周学广;;基于粗糙集与贝叶斯决策的不良网页过滤研究[J];中文信息学报;2012年01期
2 许红涛;周向东;向宇;施伯乐;;一种自适应的Web图像语义自动标注方法[J];软件学报;2010年09期
【共引文献】
中国期刊全文数据库 前7条
1 陈叶旺;钟必能;王靖;李海波;;一种基于本体与描述文本的网络图像语义标注方法[J];计算机科学;2012年S1期
2 蒋黎星;侯进;;基于集成分类算法的自动图像标注[J];自动化学报;2012年08期
3 俞建松;曹冬林;李绍滋;林达真;;基于互联网搜索与反馈验证的图像自动标注[J];计算机工程;2012年24期
4 冯鹏展;郭程;郑剑夕;张桂平;;一种基于网络的竞争企业名录自动更新方法[J];沈阳航空航天大学学报;2013年05期
5 郭海凤;张盈盈;李广水;韩立新;;基于社会网络的图像语义获取研究综述[J];计算机与现代化;2014年01期
6 段喜萍;刘家锋;王建华;唐降龙;;一种语义级文本协同图像识别方法[J];哈尔滨工业大学学报;2014年03期
7 孙君顶;杜娟;;图像自动语义标注技术综述[J];计算机系统应用;2012年07期
中国博士学位论文全文数据库 前1条
1 雷亮;互联网环境下图像检索若干问题研究[D];重庆大学;2011年
中国硕士学位论文全文数据库 前8条
1 蒋黎星;基于机器学习算法的自动图像标注[D];西南交通大学;2011年
2 孙健;基于内容的敏感网页过滤器的研究与实现[D];吉林大学;2012年
3 南智敏;基于网页兴趣度的用户兴趣模型体系研究[D];复旦大学;2012年
4 李晓勉;网页文本干扰信息预处理方法研究[D];中国地质大学(北京);2013年
5 李静;基于多特征的图像标注研究[D];武汉理工大学;2013年
6 李海洋;基于显著区域的图像语义检索方法研究[D];西北农林科技大学;2013年
7 李阳;基于融合空间信息LDA的视觉对象识别研究[D];哈尔滨工业大学;2013年
8 康莹莹;新闻图像内容与字幕文本协同识别与检索方法研究[D];哈尔滨工业大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 卢娇丽,郑家恒;基于粗糙集的文本分类方法研究[J];中文信息学报;2005年02期
2 张宇,刘挺,文勖;基于改进贝叶斯模型的问题分类[J];中文信息学报;2005年02期
【相似文献】
中国期刊全文数据库 前10条
1 吴鹏飞;马凤娟;;基于Boost.Regex的网页信息抽取[J];电脑编程技巧与维护;2009年15期
2 杜翠茹;;浅析网页布局方法在教学中的优化[J];大众科技;2010年05期
3 孟涛,闫宏飞,王继民;Web网页信息变化的时间局部性规律及其验证[J];情报学报;2005年04期
4 ;和朋友看同一个网页的幸福生活[J];计算机与网络;2005年18期
5 张晓彦;张晓明;;一种基于表格属性的网页信息隐藏算法[J];北京石油化工学院学报;2009年01期
6 胡少荣;孟嗣仪;刘云;张彦超;丁飞;;网页信息自动抽取技术的研究[J];铁路计算机应用;2010年09期
7 张莉,曾致远;Windows下网页信息实时监听程序的设计与实现[J];微计算机信息;2005年03期
8 于满泉,陈铁睿,许洪波;基于分块的网页信息解析器的研究与设计[J];计算机应用;2005年04期
9 王少宇,杜娟,秦前清;基于内容的网页信息处理方法[J];计算机应用;2005年04期
10 丁艳;曹倩;王超;潘金贵;;基于Ontology和EM方法的网页分类研究[J];计算机科学;2003年11期
中国重要会议论文全文数据库 前10条
1 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年
3 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 何平;李锦;;基于Web挖掘技术的用户模糊偏好分析[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 黄华军;王保卫;孙星明;;基于CSS类选择符重复引入的网页信息隐藏算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
6 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
8 杨高峰;杨岳湘;;基于RSS的个性化科技信息聚合门户的设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 黄锦辉;任永杰;孟小锋;;Chiql在因特网上的应用[A];第十五届全国数据库学术会议论文集[C];1998年
10 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 壮壮;批量保存网页信息[N];电脑报;2004年
2 路人甲;请个专家来贴图[N];电脑报;2005年
3 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
4 湖北 文武;详解缓存[N];中国电脑教育报;2001年
5 劲风;你的电子邮件需要保密吗[N];中国电脑教育报;2003年
6 江苏 肖敏浩;IE中缓存的设置[N];电脑报;2001年
7 于发修;寻找搜索的技巧[N];中国计算机报;2001年
8 张;英汉双向翻译[N];中国计算机报;2001年
9 中国科学院研究生院信息安全国家重点实验室 刘亮 徐海波 中软股份有限公司 尚铭;互联网的“海岸警卫队”[N];计算机世界;2004年
10 ;263客服中心五种方式同时接入[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
2 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
3 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
4 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年
5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
6 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
7 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年
8 余伟;基于用户个性挖掘的Web社区营销研究[D];武汉大学;2011年
9 宋鑫莹;网络信息自动化高效抽取技术研究[D];哈尔滨工业大学;2013年
10 王永;在线广告网络的评估与优化[D];电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
2 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
3 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
4 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
5 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
6 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年
7 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
8 买买提依明·哈斯木;基于后缀树的维吾尔文网页聚类算法的设计与实现[D];新疆大学;2011年
9 张晓彦;网页信息隐藏算法研究及应用[D];北京化工大学;2010年
10 李莎莎;增量式Web信息采集与信息提取系统的研究与实现[D];武汉理工大学;2011年
,本文编号:1226443
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1226443.html