基于搜索引擎的模糊字频统计
本文选题:中文信息处理 切入点:模糊字频统计 出处:《计算机工程与设计》2010年02期 论文类型:期刊论文
【摘要】:针对传统字频统计方法周期长、代价高的弱点,提出了一种利用互联网内容并借助搜索引擎检索进行汉字模糊字频统计的全新方法,有效利用了网络时代的相关技术和发展成果,在一定程度上缓解了字频统计需求频繁的和传统统计方法的低效且代价高昂之间的矛盾,同时对该方法进行了实例化的分析、验证和改进。
[Abstract]:Aiming at the weakness of traditional Chinese character frequency statistics method, which has long period and high cost, a new method of Chinese character fuzzy character frequency statistics based on Internet content and search engine retrieval is proposed. It makes effective use of the related technologies and development achievements of the network age, and to some extent alleviates the contradiction between the frequent demand for word frequency statistics and the low efficiency and high cost of the traditional statistical methods. At the same time, the instantiation of this method is analyzed. Verification and improvement.
【作者单位】: 中国石油化工股份有限公司催化剂分公司;一零二四互动营销顾问(北京)有限公司;北京化工大学信息科学与技术学院;
【分类号】:TP391.3
【参考文献】
相关期刊论文 前3条
1 山岚,吕俊,江毅铭,欧歌,王坚,李世明;具有扩充检索功能的石油化工专业信息搜索引擎的设计与开发[J];计算机与应用化学;2005年10期
2 司玉英;;从四种汉字频度的比较看汉字的性质[J];内蒙古大学学报(人文社会科学版);2006年03期
3 李世明;赵恒永;李世友;;专题搜索引擎中信息过滤的研究与实现[J];计算机工程与设计;2006年08期
【共引文献】
相关期刊论文 前10条
1 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期
2 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
3 尚冬娟;张敏;;信息过滤系统中的混合式过滤算法[J];重庆工学院学报(自然科学版);2008年01期
4 李艳红;庞小平;李海亭;;地名分词搜索的词典设计与匹配方法研究[J];测绘信息与工程;2011年02期
5 杜友福;程彩凤;赵鸣;;搜索引擎中智能代理技术及启发式搜索策略研究[J];长江大学学报(自然科学版)理工卷;2009年02期
6 刘双印;徐龙琴;沈玉利;;改进小生境遗传算法在元搜索引擎调度优化中的研究[J];重庆师范大学学报(自然科学版);2008年03期
7 李跃民;王浩;赵生慧;;有词典中文分词算法研究[J];滁州学院学报;2008年03期
8 张玉连;张敏;张波;;一种扩展的向量空间模型-隐含语义索引模型研究[J];燕山大学学报;2006年01期
9 景虹;詹海生;;基于Web Services的个性化学习资源获取[J];中国远程教育;2006年08期
10 孟祥增;;基于内容的图像网络教学资源检索研究[J];中国远程教育;2008年04期
相关会议论文 前8条
1 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
2 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
3 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
4 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;基于Web的民文信息检索中维、哈、柯文关键词的预处理[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
5 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 张峧军;刘祥瑞;李军;黄红梅;;基于本体的语义检索技术研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
8 张峧军;黄红梅;王晨熙;李军;;构建智能信息检索系统[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
相关博士学位论文 前10条
1 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
2 温有奎;基于语义挖掘的文本知识元模型与应用研究[D];武汉大学;2010年
3 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
4 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年
5 李培峰;基于语义的多文种信息处理平台SMIPP的研究[D];苏州大学;2006年
6 朱婕;网络环境下个体信息获取行为研究[D];吉林大学;2007年
7 王辉;基于质心具有增量性质的主题爬行[D];吉林大学;2007年
8 梁添才;基于认知机理的汉字智能造字研究[D];华南理工大学;2008年
9 吴茗;现代汉语常用语素项属性研究[D];中国传媒大学;2008年
10 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
相关硕士学位论文 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
3 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
4 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
5 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年
6 杨芹;基于最大熵模型的中文网页分类器设计和实现[D];苏州大学;2010年
7 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
8 毛敏芹;对搜索引擎扩充语义信息功能方法研究[D];华东师范大学;2010年
9 姜晓伟;粒子群算法在查询优化中的应用[D];哈尔滨理工大学;2010年
10 黄亮;知识产权预警机制在服务外包平台中的应用研究[D];南昌大学;2010年
【二级参考文献】
相关期刊论文 前5条
1 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
2 徐德智,吴敏,陆文彦;基于Agent的专业搜索引擎的研究和构造[J];计算机工程;2002年10期
3 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
4 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
5 胡红霞,王振兴,李申堂;搜索引擎技术的现状及发展趋势[J];信息工程大学学报;2001年04期
【相似文献】
相关期刊论文 前10条
1 滕伟,王永成;智能代理技术在搜索引擎中的应用[J];高技术通讯;2001年10期
2 许嘉璐;朱小健;;中文信息处理研究工作的新进展[J];云南师范大学学报(哲学社会科学版);2010年04期
3 许璐蕾;;面向搜索引擎的文本自动分类系统实现[J];苏州市职业大学学报;2007年04期
4 滕伟,王永成;智能代理技术在新一代搜索引擎中的应用[J];计算机工程;2000年S1期
5 柳佳刚;曾利军;;基于PAT-tree的中文搜索引擎结果聚类算法[J];情报杂志;2009年12期
6 陈磊;刘奕群;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[J];中文信息学报;2008年06期
7 岑荣伟;刘奕群;张敏;茹立云;马少平;;基于日志挖掘的搜索引擎用户行为分析[J];中文信息学报;2010年03期
8 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
9 薛万新;中文搜索引擎的现状与发展[J];科技情报开发与经济;2005年03期
10 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的搜索引擎用户行为分析[J];中文信息学报;2007年01期
相关会议论文 前10条
1 李斌;卢俊之;章成志;陈小荷;;基于聚类引擎的话题褒贬度计算[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
相关重要报纸文章 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
8 本报记者 赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
5 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
6 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
2 孔祥凤;企业网搜索引擎的设计与实现[D];辽宁科技大学;2007年
3 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
4 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
5 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
6 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
7 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
8 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
9 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
10 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
本文编号:1613002
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1613002.html