Delicious中文标签与汉语主题词表的结合研究
发布时间:2020-03-22 08:12
【摘要】:随着Delicious、Flickr、Technorati、Connotea等系列社会网络工具的出现,标签成为组织、管理和发现个人网络信息资源的重要方式迅速流行,这种以标签的形式对信息进行标注的方法就是分众分类法。分众分类系统有两个突出的特征:信息使用者积极参与信息组织和管理过程;多个人的共同标记的共享。但是,与传统的信息组织方式相比较,这种分众分类法缺乏词汇控制,容易引起同义词和同形异义字等问题。 本研究首先定性讨论了分众分类法的起源、概念、特点及Delicious分众分类法的运行机制,然后,在构建Delicious中文标签数据库的基础上,定量地统计分析、整理、描绘出其中的某种规律性特征及用户标签间的相关关系。进而通过Delicious中文标签与《汉语主题词表》数据库的覆盖率检测,探讨用户标签在多大程度上与《汉语主题词表》主题词重叠。并通过分析标签在《汉语主题词表》中的分布形式,探讨其分布规律及用户标签表述的主题范围。最后,在分析分众分类法与《汉语主题词表》各自优势与不足的基础上,探讨了Delicious分众分类法与汉语主题词表的结合的必要性与可能性,以及两者结合的可能障碍。并提出了一种基于汉语主题词表的用户标签优化模型及基于标签的《汉语主题词表》主题词的更新的方法。
【图文】:
2.2.2.1标签:资源与用户的桥梁Delicious允许用户保存和标记他们自己的网站标签,这样他们就可以从任何联网的电脑上获取他们的标签。DeliciouS的标签是公共信息。每个标签都有与其对应的元数据:用户选择的标签名、保存该标签的用户名、标签创建的时间、标签对应的资源。其中中文标签也很丰富,每个用户使用自己的语一言词汇,选择他们认为最有意义的最重要的词汇作为标签,来描述表达自己感兴趣的领域及资源。例如,在Del.icio.uS的流行标签列表上点击标签“新闻”,就会显示所有被Del.icio.uS用户标记为“新闻”的网页。其中有10483个网页被标记为“新闻”,新浪新闻中心网在Del.icio.uS中被693个不同的用户标一记。当一个用户创造一个新标签的时候,系统自动出现推荐标签、你的标签(这个用户之前使用的所有标签),以及该网页的流行标签。在Delicfous中,用户可以为感兴趣的资源添加标签,然后可以通过标签界面对资源内容进行导航,这就建立了用户与资源间的关系,这种关系是分众分类标注系统运行的基础。图2一1是DeliciouS中某一用户对某个资源的标签使用XML语言描
呢红咙湘熟全O。派杂鑫丫扛l叭Q拼3:图2一 2DelieiouS中“标签云”2.3分众分类法与受控词表在信息组织方式上的差异主题词表与分类法是传统情报检索领域的两种主要的受控语言,分类法主要是根据资源的学科特征,对其进行分类和聚类,从而建立一整套类目体系,其广泛用于图书馆文献的排架和分类导航等检索工具。以《汉语主题词表))为代表的主题法主要是通过主题词汇来标识资源,其主要用于对文献进行编制主题目录、主题标引。这两种受控语言的共同点都是由专业人士编写和使用的,用户经过一定的培训才能进行检索使用,因此,其编写与使用的成本非常高。作为传统情报界常用的资源识别和分类检索方法,主题词表与分类法的语言都使用规范化的语启一,从而消除了可能产生的岐义,保证了语义上的准确性和可靠性,,而且这种专家建立的受控语言的体系结构
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:G254.2
本文编号:2594774
【图文】:
2.2.2.1标签:资源与用户的桥梁Delicious允许用户保存和标记他们自己的网站标签,这样他们就可以从任何联网的电脑上获取他们的标签。DeliciouS的标签是公共信息。每个标签都有与其对应的元数据:用户选择的标签名、保存该标签的用户名、标签创建的时间、标签对应的资源。其中中文标签也很丰富,每个用户使用自己的语一言词汇,选择他们认为最有意义的最重要的词汇作为标签,来描述表达自己感兴趣的领域及资源。例如,在Del.icio.uS的流行标签列表上点击标签“新闻”,就会显示所有被Del.icio.uS用户标记为“新闻”的网页。其中有10483个网页被标记为“新闻”,新浪新闻中心网在Del.icio.uS中被693个不同的用户标一记。当一个用户创造一个新标签的时候,系统自动出现推荐标签、你的标签(这个用户之前使用的所有标签),以及该网页的流行标签。在Delicfous中,用户可以为感兴趣的资源添加标签,然后可以通过标签界面对资源内容进行导航,这就建立了用户与资源间的关系,这种关系是分众分类标注系统运行的基础。图2一1是DeliciouS中某一用户对某个资源的标签使用XML语言描
呢红咙湘熟全O。派杂鑫丫扛l叭Q拼3:图2一 2DelieiouS中“标签云”2.3分众分类法与受控词表在信息组织方式上的差异主题词表与分类法是传统情报检索领域的两种主要的受控语言,分类法主要是根据资源的学科特征,对其进行分类和聚类,从而建立一整套类目体系,其广泛用于图书馆文献的排架和分类导航等检索工具。以《汉语主题词表))为代表的主题法主要是通过主题词汇来标识资源,其主要用于对文献进行编制主题目录、主题标引。这两种受控语言的共同点都是由专业人士编写和使用的,用户经过一定的培训才能进行检索使用,因此,其编写与使用的成本非常高。作为传统情报界常用的资源识别和分类检索方法,主题词表与分类法的语言都使用规范化的语启一,从而消除了可能产生的岐义,保证了语义上的准确性和可靠性,,而且这种专家建立的受控语言的体系结构
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:G254.2
【参考文献】
相关期刊论文 前6条
1 范旭;;Web2.0及Librarything对图书馆的启示[J];贵图学刊;2009年01期
2 贾君枝;王东元;王永芳;;基于Delicious中文标签特征分析[J];情报科学;2010年10期
3 常唯;;标签在数字学术资源内容揭示中的作用研究[J];图书馆杂志;2007年01期
4 丁金龙;;高校图书采购招标的质量控制研究[J];图书馆;2009年05期
5 刘丹;;近年来国外Folksonomy的改进研究进展[J];图书情报工作;2010年08期
6 姚晓锋;;用户标签和图书馆主题分类的比较研究——以Librarything为例[J];图书馆学研究;2010年08期
相关硕士学位论文 前2条
1 苏美文;基于分众分类法的数字信息资源组织研究[D];吉林大学;2007年
2 隆捷;基于标签的互联网自由分类法研究[D];北京大学;2007年
本文编号:2594774
本文链接:https://www.wllwen.com/tushudanganlunwen/2594774.html
教材专著