当前位置:主页 > 社科论文 > 民族史志论文 >

地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例

发布时间:2017-09-21 04:08

  本文关键词:地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例


  更多相关文章: 地方历史文献 数字人文 文本挖掘 元数据


【摘要】:历史文献数据库可区分为数字化、数据化、文本挖掘三种不同形态,迄今多数中文历史文献数据库实现了数字化功能,部分地实现数据化功能,而能够实现文本挖掘功能的则十分少见。数字化是将文献的物理形态转化为电子形态,数据化是将文献转化为可量化分析的数据,编制元数据是主要方法。文本发掘是在此基础上开发文本分析工具。《中国地方历史文献数据库》以文献学研究为基础,建立特定的元数据结构,提供交叉导航、数据统计等多种功能,这些功能不仅可以帮助研究者找到自己的所需文献,更可能帮助研究者发现新的研究议题。史学研究中,数据库有必要被视作一种新的文献形态,建立针对性的文献学方法论。
【作者单位】: 上海交通大学人文学院历史系;
【关键词】地方历史文献 数字人文 文本挖掘 元数据
【基金】:上海市晨光计划“十九世纪徽州乡村的土地市场与社会关系网络”(项目编号:14CGA013)阶段性成果
【分类号】:G256;K29
【正文快照】: 引言 数字化(digitalization)、数据化(datalization)、文本挖掘(text mining)是历史文献数据库的三种不同形态。数字化是将文献从物理形态转化为电子形态,数据化是将电子形态进一步转换为可识别的文本与可分析的数据,文本挖掘则是针对文本、数据做进一步的计量、相关性、GIS

【相似文献】

中国期刊全文数据库 前2条

1 张辉,薛贵荣;基于文本挖掘的搭配词典自动架构探讨[J];上海工程技术大学学报;2004年04期

2 ;[J];;年期

中国重要会议论文全文数据库 前10条

1 陈林;王晓华;李殿峗;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年

2 王巍;杨武;张乐君;郑军;;支持网络话题管理的文本挖掘算法分析[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年

3 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年

4 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年

5 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年

6 钱程扬;龙毅;徐震;孙昊;;基于Web文本挖掘的地理位置信息重建技术[A];中国地理学会2007年学术年会论文摘要集[C];2007年

7 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年

8 邱晓蕾;张聪超;;基于SVD和部分聚集分类的文本挖掘算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

9 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

10 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年

中国重要报纸全文数据库 前4条

1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年

2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年

3 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年

4 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年

中国博士学位论文全文数据库 前10条

1 曹奇敏;网络信息文本挖掘若干问题研究[D];北京理工大学;2015年

2 陈虹枢;基于主题模型的专利文本挖掘方法及应用研究[D];北京理工大学;2015年

3 李梅;文本挖掘中若干关键技术研究[D];西北农林科技大学;2016年

4 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年

5 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年

6 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年

7 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年

8 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年

9 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年

10 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年

中国硕士学位论文全文数据库 前10条

1 任振宇;基于网络新闻文本挖掘的英语写作训练应用[D];华南理工大学;2015年

2 刘超;基于文本挖掘的轻量级搜索引擎[D];西南大学;2015年

3 张磊;基于文本挖掘的项目风险分析方法研究[D];山东大学;2015年

4 梁楠;基于文本挖掘的律师推荐方法研究与应用[D];电子科技大学;2015年

5 滕家雨;云框架下的文本挖掘算法并行化研究[D];中国矿业大学;2015年

6 唐东;基于XML和SVM的Web文本挖掘系统研究[D];电子科技大学;2014年

7 秦辉;基于文本挖掘的分布式网络监控系统的研究与实现[D];电子科技大学;2014年

8 谌语;文本挖掘关键技术的研究及模拟实现[D];电子科技大学;2014年

9 靳旭东;基于社会网络分析下文本挖掘的微博营销[D];兰州财经大学;2015年

10 何敏;基于MapReduce的文本挖掘研究[D];电子科技大学;2015年



本文编号:892268

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/zgmzsz/892268.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户88431***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com