18世纪德语历史文献的数据挖掘:以主题模型为例
本文关键词: 数字史学 主题模型 德意志 启蒙运动 远距离阅读 出处:《学海》2017年01期 论文类型:期刊论文
【摘要】:主题模型是新近开发出来的研究方法,对于拓展数字人文的研究路径非常有价值。LDA是主题模型算法之一,将它运用到"德语文献档案"收录的1700-1800年间的文献,在归纳、分析文本的主题后,对主题模型方法的有效性进行评判。主题模型的演算结果让我们对18世纪德意志精神世界有了更加立体的认知:18世纪的作者具有强烈的历史意识,对知识体系的构建异常积极,小说受追捧与公共领域的兴起密切相关,宗教启蒙是时代主题。这些结果表明,启蒙运动具备多重面相。在历史研究中需要将以主题模型为代表的远距离阅读与细读有机结合起来,才能够得到更具说服力的研究成果。主题模型作为一种文本挖掘的方法,仍然存在改进的空间,而这种进步需要人文学者与计算专家的通力合作。这也是数字人文继续发展的必由之路。
[Abstract]:Topic model is a newly developed research method. LDA is one of the algorithms of topic model, which is very valuable to expand the research path of digital humanities. After analyzing the theme of the text, the validity of the thematic model method is evaluated. The result of the thematic model gives us a more solid understanding of the German spiritual world in 18th century, and the author of the 18th century has a strong sense of history. The construction of knowledge system is extremely positive, the popularity of novels is closely related to the rise of the public sphere, and religious enlightenment is the theme of the times. The Enlightenment has many facets. In historical research, it is necessary to combine long distance reading represented by topic model with close reading to get more convincing research results. Topic model is a method of text mining. There is still room for improvement, and this progress requires the cooperation of humanists and computational experts, which is the only way for the continued development of digital humanities.
【作者单位】: 南京大学历史学院;
【基金】:国家社科基金青年项目“18世纪德意志的民众启蒙”(项目号:11 CSS011)的阶段性成果
【分类号】:K06
【相似文献】
相关期刊论文 前9条
1 陈芳;;诊断分类模型:测试领域的新工具[J];外语教学理论与实践;2011年02期
2 王开发,樊爱军,余小平;带吸收项的学习记忆模型分析[J];西南师范大学学报(自然科学版);1999年06期
3 朱峰玉;;音乐生产的经济模型分析[J];四川戏剧;2008年04期
4 陈艳君;;多层面Rasch模型在语言评估中的应用研究述评[J];教育测量与评价(理论版);2014年06期
5 荣小雪;赵江波;;产褥热病原发现的方法论模型研究[J];科学文化评论;2011年04期
6 彭康洲;;竞教比赛的多层面Rasch模型分析[J];重庆邮电大学学报(社会科学版);2011年06期
7 滕雪慧;;从谷仓模型看魏晋南朝江东地区的粮储与经济发展[J];农业考古;2010年01期
8 张力为;哪些研究问题需要用结构公式模型回答[J];天津体育学院学报;2002年01期
9 ;[J];;年期
相关会议论文 前10条
1 钱林晓;王一涛;;对应试教育条件下学生学习行为的模型分析[A];2005年中国教育经济学年会会议论文集[C];2005年
2 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
3 朱萍;刘伟泽;万立滨;;基于实证研究的知识管理路线、方法和模型分析[A];航空工业档案学会七届四次理事会暨2013年度优秀论文交流会论文集[C];2013年
4 潘洁;周宗放;;全流通下KMV模型中的违约点修正及实证研究[A];中国企业运筹学[C];2009年
5 肖田元;;仿真是基于模型的活动[A];新观点新学说学术沙龙文集37:仿真是基于模型的实验吗[C];2009年
6 毛曹珏;曹锐;;两种缺陷接地结构的模型分析[A];2007年全国微波毫米波会议论文集(下册)[C];2007年
7 吴义忠;陈立平;张昌杰;;基于多领域模型分析的参数优化研究[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
8 董维中;;气体模型对钝体高超声速流动数值计算影响的分析[A];第十届全国计算流体力学会议论文集[C];2000年
9 侯建荣;黄培清;;基于Ito随机微分方程的客户群变动模型分析[A];2004年中国管理科学学术会议论文集[C];2004年
10 肖婷婷;;经典的逃税模型及其两周期扩展[A];第四届中国不确定系统年会论文集[C];2006年
相关重要报纸文章 前3条
1 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
2 媛萍;用模型分析企业战略要素[N];中国高新技术产业导报;2002年
3 牛津大学博士 阿姆斯(RMS)风险管理公司亚太地区代表 高航;由近期亚太地区地震看巨灾风险[N];中国保险报;2012年
相关博士学位论文 前10条
1 李瑜;多选题认知诊断测验编制及多策略的多选题认知诊断模型的开发[D];江西师范大学;2014年
2 康慧燕;复杂网络上带有潜伏期的传染病动力学模型研究[D];上海大学;2015年
3 郭玮;基于多因素集成的疏散场模型研究[D];北京化工大学;2015年
4 张天蛟;产漂流性卵小型鱼类的生态位建模及分析[D];中国农业大学;2016年
5 张会敏;基于小域估计的贫困指标测度方法与模型研究[D];天津财经大学;2015年
6 宋泽芳;基于投资者情绪效应的均值—方差关系模型研究[D];广州大学;2016年
7 徐帆;笼养食蟹猴自发抑郁模型的创建与验证[D];重庆医科大学;2015年
8 毕仁贵;考虑相关性的不确定凸集模型与非概率可靠性分析方法[D];湖南大学;2015年
9 卢伟;小时步长森林碳循环模型(BEPS)参数优化及应用研究[D];东北林业大学;2016年
10 周作建;移动云环境下服务推荐模型及关键技术研究[D];南京大学;2016年
相关硕士学位论文 前10条
1 朱嘉蕊;基于科技接受模型的云出版服务模式研究[D];武汉理工大学;2014年
2 李昂;BIM技术在工程建设项目中模型创建和碰撞检测的应用研究[D];东北林业大学;2015年
3 顾慧燕;预测有机碳-水分配系数pp-LFERs模型的改进研究[D];中国地质大学(北京);2015年
4 马豪;卫生管理决策支持系统的模型构建研究[D];北京协和医学院;2015年
5 王海波;基于GARCH模型的沪深300指数收益率的波动性研究[D];西安建筑科技大学;2015年
6 郭滨;基于Kriging与改进灰色组合模型的边坡变形分析研究[D];江西理工大学;2015年
7 邢立雯;CEV模型最优参数的实证研究[D];山东大学;2015年
8 王泽森;基于Ⅳ级动态逸度模型京津冀地区硫的多介质迁移转化[D];华北电力大学;2015年
9 李欢;大规模网络零模型的高效量化评估策略研究[D];北京化工大学;2015年
10 薛文旅;小学数学《方程》单元教学中渗透模型思想的研究[D];南京师范大学;2015年
,本文编号:1545464
本文链接:https://www.wllwen.com/shekelunwen/sxll/1545464.html