夸张性语言风格对众筹项目融资的影响:文本挖掘方法
发布时间:2021-03-07 13:05
众筹作为一种新型的互联网金融模式,已经成为众多个人创业者和初创企业获取外部融资和进行创新项目向创业企业转变的有效方式之一。众筹模式的迅速发展使得研究人员开始关注影响其项目成功的要素,当前研究主要集中于揭示众筹项目成功融资的可直接量化的影响因素方面。文本作为展示众筹项目的载体,其表达方式对信息的整体表达产生重要影响,故文本表达是影响投资决策的重要依据。但是,众筹项目的文本描述作为典型的用户生成内容,目前缺乏对其语言特征的深入研究,针对众筹项目的文本分析是一个亟待研究、兼具理论意义和现实意义的领域。本文以夸张性作为研究的文本指标,分析文本信息披露中的夸张性语言风格对众筹模式信息不对称情况的缓解作用。夸张性语言风格作为信息不对称环境中的常见信息披露方式之一,其在在线融资领域中的效用尚未见系统性研究。本文采集了国外知名众筹平台Kickstarter共123,872个项目、国内知名众筹平台“众筹网”共5,112个项目为研究样本。通过选择和拓展初始关键词,形成众筹专业领域夸张性词典,从而对文本整体进行夸张性程度指标构建。利用程度指标值与众筹项目融资结果建立计量模型,分析融资者在文本信息披露过程使用...
【文章来源】:华侨大学福建省
【文章页数】:137 页
【学位级别】:硕士
【部分图文】:
夸张性语言风格效用图
35由于众筹平台的网站页面构成及数据获取难度不同,因此我们将根据实际情况在基础采集流程上添加更多操作细节,用以更好的获取项目信息。Kickstarter平台的数据采集主要分为两大部分,一是采集成功融资以及正在融资的项目,二是通过URL对融资失败项目信息进行采集。具体采集流程为:(1)对成功融资与正在融资的项目进行采集,抓取其数据和文本信息形成项目内容列表;(2)从项目内容列表中提取项目支持者信息,形成项目支持者列表;(3)采集支持者曾支持项目,并将其中的失败项目列为新项目列表;(4)根据新项目列表采集数据和文本信息;(5)循环以上步骤直到所有项目信息和支持者列表数据采集完整。众筹网平台的数据采集流程为:(1)根据项目类别对平台项目进行采集,形成项目列表;(2)根据项目列表抓取数据和文本信息;(3)循环以上步骤直到所有类别项目数据信息采集完整。图4.1英文数据采集流程图4.2中文数据采集流程4.1.3数据概况(1)英文数据由于正在融资项目的结果不确定性会在一定程度上影响研究结论,本次采集仅采用已结束的融资项目作为研究对象。研究要求所采集项目必须同时包含标题、简介、详情这三种文本信息,因此需对不符合要求的数据进行剔除。经过数据清理、去除重复项以及去除文本空缺项,最终采集到Kickstarter众筹平台包含全15种项目类型的有效样本数据共123,872条。英文数据项目信息包括:项目名称、项目简介、项目详情的文本型信息;项目类别、项目中含有影片情况、项目最终状态的分类型变量;以及评论次数、更新次数、持续时间、支持人数、项目进度、融资金额等有效数值型指标。表4.2及图4.3展示了数据样本分类别汇总结果,从项目成功率来看,在所有类别中最高的为戏剧类,高达71.66%,
35由于众筹平台的网站页面构成及数据获取难度不同,因此我们将根据实际情况在基础采集流程上添加更多操作细节,用以更好的获取项目信息。Kickstarter平台的数据采集主要分为两大部分,一是采集成功融资以及正在融资的项目,二是通过URL对融资失败项目信息进行采集。具体采集流程为:(1)对成功融资与正在融资的项目进行采集,抓取其数据和文本信息形成项目内容列表;(2)从项目内容列表中提取项目支持者信息,形成项目支持者列表;(3)采集支持者曾支持项目,并将其中的失败项目列为新项目列表;(4)根据新项目列表采集数据和文本信息;(5)循环以上步骤直到所有项目信息和支持者列表数据采集完整。众筹网平台的数据采集流程为:(1)根据项目类别对平台项目进行采集,形成项目列表;(2)根据项目列表抓取数据和文本信息;(3)循环以上步骤直到所有类别项目数据信息采集完整。图4.1英文数据采集流程图4.2中文数据采集流程4.1.3数据概况(1)英文数据由于正在融资项目的结果不确定性会在一定程度上影响研究结论,本次采集仅采用已结束的融资项目作为研究对象。研究要求所采集项目必须同时包含标题、简介、详情这三种文本信息,因此需对不符合要求的数据进行剔除。经过数据清理、去除重复项以及去除文本空缺项,最终采集到Kickstarter众筹平台包含全15种项目类型的有效样本数据共123,872条。英文数据项目信息包括:项目名称、项目简介、项目详情的文本型信息;项目类别、项目中含有影片情况、项目最终状态的分类型变量;以及评论次数、更新次数、持续时间、支持人数、项目进度、融资金额等有效数值型指标。表4.2及图4.3展示了数据样本分类别汇总结果,从项目成功率来看,在所有类别中最高的为戏剧类,高达71.66%,
【参考文献】:
期刊论文
[1]项目不确定性、信息披露与股权众筹融资绩效——基于科技型项目的证据[J]. 董育军,杨梦银,付芮. 会计之友. 2019(16)
[2]产品市场竞争、竞争地位与智力资本信息披露——基于我国上市公司智力资本信息披露指数(ICDI)的大样本研究[J]. 傅传锐,杨文辉. 中国社会科学院研究生院学报. 2019(04)
[3]预售众筹产品质量夸大行为及其预防措施分析[J]. 曾燕,邱国盛,黄守军. 管理科学学报. 2019(07)
[4]知识型微信公众号的内容特征对个人使用行为的影响研究[J]. 秦芬,严建援,李凯. 情报理论与实践. 2019(07)
[5]电商平台商品标题优化的有效性及其杠杆机制[J]. 袁海霞,陈俊,白琳. 北京理工大学学报(社会科学版). 2019(02)
[6]基于信息不对称理论的众筹投资风险研究[J]. 刘宇,金升平. 管理现代化. 2018(05)
[7]企业异质性、管理者过度自信与内部控制信息披露[J]. 路媛媛. 财会月刊. 2018(06)
[8]竞争环境下众筹产品的定价策略研究[J]. 薛巍立,王杰,申飞阳. 管理工程学报. 2017(04)
[9]众筹项目融资成功的影响因素及预测模型研究[J]. 黄健青,黄晓凤,殷国鹏. 中国软科学. 2017(07)
[10]预售众筹与股权众筹的选择:基于众筹平台与企业家声誉的视角[J]. 刘波,刘彦,赵洪江,冷梦玥. 金融研究. 2017(07)
硕士论文
[1]广告语言的修辞研究[D]. 雷鑫.贵州师范大学 2018
[2]微信公众号“标题党”现象分析[D]. 程英华.东北师范大学 2018
[3]在退货条件下网络零售商的产品夸大描述策略研究[D]. 熊伟.中国科学技术大学 2015
[4]电子商务中针对产品的摘要挖掘技术研究[D]. 季知祥.哈尔滨工业大学 2011
本文编号:3069148
【文章来源】:华侨大学福建省
【文章页数】:137 页
【学位级别】:硕士
【部分图文】:
夸张性语言风格效用图
35由于众筹平台的网站页面构成及数据获取难度不同,因此我们将根据实际情况在基础采集流程上添加更多操作细节,用以更好的获取项目信息。Kickstarter平台的数据采集主要分为两大部分,一是采集成功融资以及正在融资的项目,二是通过URL对融资失败项目信息进行采集。具体采集流程为:(1)对成功融资与正在融资的项目进行采集,抓取其数据和文本信息形成项目内容列表;(2)从项目内容列表中提取项目支持者信息,形成项目支持者列表;(3)采集支持者曾支持项目,并将其中的失败项目列为新项目列表;(4)根据新项目列表采集数据和文本信息;(5)循环以上步骤直到所有项目信息和支持者列表数据采集完整。众筹网平台的数据采集流程为:(1)根据项目类别对平台项目进行采集,形成项目列表;(2)根据项目列表抓取数据和文本信息;(3)循环以上步骤直到所有类别项目数据信息采集完整。图4.1英文数据采集流程图4.2中文数据采集流程4.1.3数据概况(1)英文数据由于正在融资项目的结果不确定性会在一定程度上影响研究结论,本次采集仅采用已结束的融资项目作为研究对象。研究要求所采集项目必须同时包含标题、简介、详情这三种文本信息,因此需对不符合要求的数据进行剔除。经过数据清理、去除重复项以及去除文本空缺项,最终采集到Kickstarter众筹平台包含全15种项目类型的有效样本数据共123,872条。英文数据项目信息包括:项目名称、项目简介、项目详情的文本型信息;项目类别、项目中含有影片情况、项目最终状态的分类型变量;以及评论次数、更新次数、持续时间、支持人数、项目进度、融资金额等有效数值型指标。表4.2及图4.3展示了数据样本分类别汇总结果,从项目成功率来看,在所有类别中最高的为戏剧类,高达71.66%,
35由于众筹平台的网站页面构成及数据获取难度不同,因此我们将根据实际情况在基础采集流程上添加更多操作细节,用以更好的获取项目信息。Kickstarter平台的数据采集主要分为两大部分,一是采集成功融资以及正在融资的项目,二是通过URL对融资失败项目信息进行采集。具体采集流程为:(1)对成功融资与正在融资的项目进行采集,抓取其数据和文本信息形成项目内容列表;(2)从项目内容列表中提取项目支持者信息,形成项目支持者列表;(3)采集支持者曾支持项目,并将其中的失败项目列为新项目列表;(4)根据新项目列表采集数据和文本信息;(5)循环以上步骤直到所有项目信息和支持者列表数据采集完整。众筹网平台的数据采集流程为:(1)根据项目类别对平台项目进行采集,形成项目列表;(2)根据项目列表抓取数据和文本信息;(3)循环以上步骤直到所有类别项目数据信息采集完整。图4.1英文数据采集流程图4.2中文数据采集流程4.1.3数据概况(1)英文数据由于正在融资项目的结果不确定性会在一定程度上影响研究结论,本次采集仅采用已结束的融资项目作为研究对象。研究要求所采集项目必须同时包含标题、简介、详情这三种文本信息,因此需对不符合要求的数据进行剔除。经过数据清理、去除重复项以及去除文本空缺项,最终采集到Kickstarter众筹平台包含全15种项目类型的有效样本数据共123,872条。英文数据项目信息包括:项目名称、项目简介、项目详情的文本型信息;项目类别、项目中含有影片情况、项目最终状态的分类型变量;以及评论次数、更新次数、持续时间、支持人数、项目进度、融资金额等有效数值型指标。表4.2及图4.3展示了数据样本分类别汇总结果,从项目成功率来看,在所有类别中最高的为戏剧类,高达71.66%,
【参考文献】:
期刊论文
[1]项目不确定性、信息披露与股权众筹融资绩效——基于科技型项目的证据[J]. 董育军,杨梦银,付芮. 会计之友. 2019(16)
[2]产品市场竞争、竞争地位与智力资本信息披露——基于我国上市公司智力资本信息披露指数(ICDI)的大样本研究[J]. 傅传锐,杨文辉. 中国社会科学院研究生院学报. 2019(04)
[3]预售众筹产品质量夸大行为及其预防措施分析[J]. 曾燕,邱国盛,黄守军. 管理科学学报. 2019(07)
[4]知识型微信公众号的内容特征对个人使用行为的影响研究[J]. 秦芬,严建援,李凯. 情报理论与实践. 2019(07)
[5]电商平台商品标题优化的有效性及其杠杆机制[J]. 袁海霞,陈俊,白琳. 北京理工大学学报(社会科学版). 2019(02)
[6]基于信息不对称理论的众筹投资风险研究[J]. 刘宇,金升平. 管理现代化. 2018(05)
[7]企业异质性、管理者过度自信与内部控制信息披露[J]. 路媛媛. 财会月刊. 2018(06)
[8]竞争环境下众筹产品的定价策略研究[J]. 薛巍立,王杰,申飞阳. 管理工程学报. 2017(04)
[9]众筹项目融资成功的影响因素及预测模型研究[J]. 黄健青,黄晓凤,殷国鹏. 中国软科学. 2017(07)
[10]预售众筹与股权众筹的选择:基于众筹平台与企业家声誉的视角[J]. 刘波,刘彦,赵洪江,冷梦玥. 金融研究. 2017(07)
硕士论文
[1]广告语言的修辞研究[D]. 雷鑫.贵州师范大学 2018
[2]微信公众号“标题党”现象分析[D]. 程英华.东北师范大学 2018
[3]在退货条件下网络零售商的产品夸大描述策略研究[D]. 熊伟.中国科学技术大学 2015
[4]电子商务中针对产品的摘要挖掘技术研究[D]. 季知祥.哈尔滨工业大学 2011
本文编号:3069148
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3069148.html
最近更新
教材专著