基于Solr和Mahout在线资讯自动分类与全文搜索引擎的实现
本文关键词:基于Solr和Mahout在线资讯自动分类与全文搜索引擎的实现
更多相关文章: 文本自动分类 分类器 资讯 信息服务方式 分类算法 全文检索系统 检索界面 全文索引 业务需求 用户要求
【摘要】:正在当前信息爆炸式增长的时代,用户对信息服务的需求已经从信息汇聚为主的广播式服务逐渐过渡到要求提供按需、定制化、定向的集成化信息服务。用户要求能按照其特定的业务需求,对信息进行预加工、过滤后,提供给他们精品化的"干货"。这对我们通讯社的信息服务方式也提出了新的要求。在大数据时代,信息量呈几何方式增长,同时我们也积累了大量的历史资讯数据,如果不能对
【作者单位】: 新华社技术局;
【关键词】: 文本自动分类 分类器 资讯 信息服务方式 分类算法 全文检索系统 检索界面 全文索引 业务需求 用户要求
【分类号】:TP391.3
【正文快照】: 在当前信息爆炸式增长的时代,用户对信息服务的需求已经从信息汇聚为主的广播式服务逐渐过渡到要求提供按需、定制化、定向的集成化信息服务。用户要求能按照其特定的业务需求,对信息进行预加工、过滤后,提供给他们精品化的“干货”。这对我们通讯社的信息服务方式也提出了新
【相似文献】
中国期刊全文数据库 前10条
1 刘苗;谢邦昌;;基于概率潜在语义分析和Adaboost算法的文本分类技术研究[J];统计与决策;2010年19期
2 许璐蕾;;面向搜索引擎的文本自动分类系统实现[J];苏州市职业大学学报;2007年04期
3 郭少友;;基于词语上下文关系的文本自动分类方法研究[J];现代图书情报技术;2008年05期
4 刘冬梅;王俊义;;HTML文本自动分类预处理方法的研究应用[J];内蒙古大学学报(自然科学版);2007年01期
5 夏火松;刘建;;基于VSM的文本分类挖掘算法综述[J];情报探索;2010年09期
6 牟尧;李曦;;关于文本自动分类算法的研究——以档案自动归类的应用为例[J];中国西部科技;2011年24期
7 张婷慧,耿焕同,蔡庆生;基于CBR的文本自动分类研究[J];计算机应用;2005年09期
8 张婷慧;耿焕同;蔡庆生;;一种改进的VSM及其在文本自动分类中的应用[J];微电子学与计算机;2005年12期
9 胡燕;熊浩勇;付香英;;线性可分文本的SVM算法研究与改进[J];计算机与数字工程;2008年03期
10 付香英;王春丽;王芳;;非线性可分文本的SVM算法研究与改进[J];九江学院学报;2008年03期
中国重要会议论文全文数据库 前10条
1 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
2 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
4 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
6 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
7 王先梅;林子钰;;基于HMM的脱机手写大写金额识别中的单分类器性能分析[A];2006中国控制与决策学术年会论文集[C];2006年
8 王颖;毋立芳;关媛;王涓涓;;基于LBP的SVM人脸姿势估计方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 龚妙昆;万福永;许建强;袁震东;;心电图小波压缩特征提取及SVM分类分析[A];2005中国控制与决策学术年会论文集(下)[C];2005年
10 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
中国重要报纸全文数据库 前10条
1 本报记者 许继楠;博科资讯:Yigo语言助用户快速响应市场[N];中国计算机报;2011年
2 南方;博科资讯业务矩阵引发行业聚焦[N];中国企业报;2009年
3 本报记者 邱燕娜;新加坡:先流程化,后电子化构建整合政府[N];中国计算机报;2010年
4 王;博科资讯2009年“加速度”战略发布[N];国际商报;2009年
5 莱阳农学院教育技术中心 徐鹏民;用MSSQL Serve 建立Internet上的全文检索系统[N];计算机世界;2000年
6 记者 吕好问;博科资讯帮助全球亿万家企业挖掘新财源[N];中国国门时报;2008年
7 计世资讯 CCW Research;社保:向软件和服务倾斜[N];计算机世界;2009年
8 姜靖;有道阅读开启资讯阅读新模式[N];科技日报;2008年
9 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
10 山东省交通厅科技处副处长 王其峰;六种出行信息方式 服务山东百姓[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
2 王U,
本文编号:901198
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/901198.html