社交媒体大数据与资本市场——综述外文翻译资料

 2022-08-15 16:47:55

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


社交媒体大数据与资本市场——综述

0. 介绍

社交媒体在我们社会当前的现象中的分类毫无争议。社交媒体将来自世界各地的人连接到一个虚拟社区。最主要的是社交媒体的所有功能是促进沟通和内容分享。然而,就本文的目的而言,还有一个事实是:社交媒体是一个很好的社会行为数据库。社交媒体提供的数据,即所谓的“大数据”,非常受欢迎,在这一领域已经完成了许多实际应用和学术研究。目标是明确的、更好地理解一个社会的行为。

本文的目的是概述资本市场领域与社交媒体大数据就业相关的研究的现状。主要重点是提供纳入这一日益增长的研究,总结主要发现,并概述了进一步研究的挑战。本文的贡献是从社会网络到资本市场的传播机制的理论建议。尽管有越来越多的研究,这种关系还没有明确的定义。论文的其余部分结构如下。下一节让读者了解社交媒体的形式和功能。此外,它还描述了大数据情绪分析。虽然这两个部分深入技术细节,但它们对于理解通过社交媒体收集数据所涉及的挑战至关重要。第二节介绍从经济角度看,社交媒体与资本市场之间的联系以传播机制的形式存在,第三节概述了若干重要文件的贡献和结论,第四节提出了进一步研究的潜在前景,最后一节总结。

1. 了解社交媒体

1.1 大数据

大数据网络最初被构造为一个“只读”工具。今天,它已经转变为“读和写”(Cambria等人,2013年)。根据这一思想,前一部分介绍了社交媒体作为一个平台,使用户可以创建和共享网络内容。然而,在本文的背景下,社交媒体必须被理解为一种媒介-仅仅是大数据和大数据的来源。 用户输入是实际应用和学术研究最感兴趣的组成部分。

一般来说,大数据的特征可以如下。Halevi and Moed(2012)将大数据定义为大数据集,由于其大小和复杂性,传统的管理工具无法对其进行处理。大数据是海量、高速、高多样性的信息,一种具有成本效益和创新的数据处理方法,为增强洞察力、决策和过程自动化提供了机会(Beyer和Laney,2012年;Gartner,2015年)。以前的定义需要根据本文的思想加以扩充,特别是大数据是与个人和社会行为相关的大数据集。由于它的复杂性,它必须经过计算处理。在资本市场领域,应用社交媒体数据来揭示社会和资本市场之间更深层次的洞察力、趋势和关联。

金融领域并不是第一个采用社交媒体大数据的领域。它以前被广泛用于研究各种显著的社会事件,如预测政治选举(Yu等人,2008年;Tumasjane) 在实时情况下检测自然灾害(Sakaki等人,2010年)或疾病流行病(Ginsberg等人,2008年;Lamb等人,2013年)。在商业领域,社交媒体大数据作为 早期的“经济指标”或口碑营销的电子工具。特别是Gruhl(2005年)和Mishne和Rijke(2006年)证明了社交媒体活动可以分别预测图书和电影销售的肯定证据。崔和瓦里安(2012)基于Google查询对汽车销售、失业索赔、旅游目的地规划和消费者信心进行了预测。 Jansen等人(2009)讨论社交媒体在企业营销策略中的影响,.甚至政策制定者和市场监管者也开始对大数据的“力量”感兴趣,以反映一个社会的行为。来自英格兰银行的迈凯轮和Shanbhogue(2011年)、意大利银行的DAmuri和Marcucci(2012年)或捷克国家银行的Saxa(2014年)讨论了Google的就业问题作为劳动力和住房市场的实时指标。

上一段介绍了社交媒体大数据在各个研究领域的具体应用,第三节在金融领域也是如此。但是,要适当地评价现存的实证结果,并在论文中进行比较,必须介绍情绪分析方法。

1.1.1 情感分析

上述每一个大数据的定义都包含了大数据处理中的困难问题。大数据处理,在情感分析中,可以被认为是大数据研究中最重要的一点。情感分析或观点挖掘描述各种各种计算技术,专注于发现、提取和提炼人类情感、感觉或观点,从网络内容中的文本信息中向某些实体传播(方和詹,2015年;上帝) 啊,2015年)。今天,情感分析已经发展成为一个自主的、目前流行的研究领域。一般来说,情感分析有两种方法:1.机器学习方法可以被认为是一个从数据中学习的程序。这个程序工作在预定义的模型(分类器)上,它包含文本的示例(标记文本、特征值向量-例如。肯定或否定 我的情感),后来被用来分类一个没有标记的文本语料库。特征值的初始定义对于机器学习方法的最终成功至关重要。机器学习方法的优势在于它能够为特定的上下文详细定义。相反,一个缺点是它对新数据的适用性较低,这是由于昂贵的文本标记或不使用。机器学习计划可以学习的足够例子的性质(Annett和Kondrak,2008年;Goncalves等人,2013年;Godsay,2015年)。2.词法使用预定义(预先标记) 每个单词或短语传达特定情感的单词、词汇或字典列表。然后将研究过的文本语料库与通常采用算法的单词列表进行比较。这种方法的一个优势是不需要预先标记,但当需要分析特定的上下文时,这是一个缺点,因为唯一的字典是不可用的(例如,如果俚语在研究文本中很常见)(Annett和Kondrak,2008年;Goncalves等人,2013年)。情感分析的过程包括几个步骤:1.社交媒体大数据必须下载。2.网页内容只转换为文本内容。3.数据从定性转化为基于机器学习或词汇方法的定量性质。庞和李(2008)、鲁塞尔(2011)、刘(2012)或Godsay(2015)的研究中提供了情绪分析过程的进一步技术细节。

在本文中,当人们使用Twitter(推特)或Face book(评论)的数据时,从定性的性质(情感、观点)转变为定量的是基于上述方法。然而,通过已经转型的社交媒体大数据,可以避免复杂情绪分析的表现。尤其是谷歌公司提供上面介绍的谷歌查询的数据和Face book创建的国民幸福总值指数(FGNHI)。由于公共可用性,Google查询的使用在上一节中介绍的各个领域都很受欢迎。然而,这种信息只是数量上、定性上的区别,不管人们是寻找正面信息还是负面信息,都是缺失的。FGNHI提供了定性的区别,它提供了20个国家的每日情绪数据。这个索引包括一些匿名的积极和消极的词在人们的评论中使用。

前几段简要介绍了大数据和情感分析背后的技术。在接下来的章节中,作者展示了它在金融领域的理论基础。

2. 社交媒体大数据应用的经济原理

2.1 信息需求

第一个想法是基于信息投资者的需求,所谓投资者的关注。特别是,散户投资者利用社交媒体或谷歌搜索引擎的投资论坛作为公开的资本市场信息来源,因为它们的来源有限制访问专业数据库,如彭博或汤森路透。这一想法在Da等人的论文中提出(2011年),Vlastakis和Markel 洛斯(2012)和丁和侯(2015)在分析中使用谷歌查询。信息需求也在Sprenger等人中提出。(2014a,b),他提议将Twitter的投资论坛作为零售投资者的替代信息来源。社交媒体上的投资论坛将散户投资者与关于证券、市场及其基本面的讨论联系起来。显示了一个简单的传输机制。

传导机制始于资本市场,散户投资者是其中的一部分。零售投资者由于资源有限,使用社交媒体投资论坛或谷歌搜索引擎作为主要信息来源。然而,我们只能假定这只是信息需求的部分反映。社交媒体数据,因为社交媒体不是散户投资者的唯一信息来源。从散户投资者到社交媒体的虚线箭头。此外,核心市场总活动,也包括散户的交易,“定义”股票价格或股票指数的价值。这是由实心箭头显示的。后来,在这方面的研究 该领域利用资本市场和社交媒体的数据,更好地了解散户投资者对股票价格/市场形成及其波动性的行为中重要的部分 离子机制在圆圈中。“研究”在矩形中,以区分它与传输机制的主要部分。

2.2 社会情绪

第二种观点是基于社会对现有信息的反应。具体而言,社交媒体使我们能够创造、分享和回应现有的信息上。这种反应的组合是一个有价值的数据来源,主要是关于社交媒体受众分享的意见、情绪或社会情绪的数据。这种观众特别是普通的体育观众,分享他们对具体信息的观点、情绪或情感的人。一个很好的例子是Face book上的一个公司网站,普通人分享他们与个人公司有关的观点。

在它的开始,有社会和散户投资者是它的一部分。在社会上,由于许多不可预测的因素,感情是随机形成的。零售投资者作为社会的一部分,至少可以部分地受到情绪的影响。他们意识到基本面(信号),但情绪(噪音)也可能是决定因素。In 图它是由一支虚线箭头呈现的,因为我们不能单独承担情绪的影响。同样,我们只能假设社会情绪在社交媒体上的部分反映。

本章最重要的贡献是理解社交媒体只是一个工具,如何在技术上捕捉关于社会行为的数据。不过,到底是什么原因 是一个社会的行为,零售投资者的存在及其对资本市场的影响。此外,使用正确的传输机制,当一个人描述之间的联系时, 研究人员通过搜索股票代码来研究散户投资者的兴趣,而不受情绪的影响。相反,推特上的Face book评论对研究人员来说是一个更好的选择 评估信息的定性价值及其对股票价格或资本市场的影响。

3. 主要经验结论概述

3.1 Face book

Karabulut(2013年)的论文将Face book的国民幸福总值(FGNH I)作为投资者情绪的直接指标,其结果显示了FGNHI预测美国市场每日总回报和交易量变化的能力。这一结果是显著的,即使是在控制过去的股票市场波动,每日经济状况或年关效应。卡拉布卢特(2013)认为,这些结果与噪声交易者模型是一致的,因为情绪的积极影响在接下来的两个交易周完全逆转。Siganos等人(2014年) 根据FGNHI的数据,在每日情绪和交易之间的20个市场内提供国际证据。他们的主要发现显示了股票市场回报的正同期关系。此外,他们还提出了从情绪到股票市场的因果关系,因为周日的情绪会影响周一的股票回报。Siganos等人(2014年)根据DeLong等人提出的行为金融学理论解释他们的结果。(1990年)当散户投资者充裕,套利存在限制时,情绪就会产生影响。Karabulut(2013年)和Siganos等人。(2014)关注投资者情绪的影响 总市场。布科维纳(2015)专注于微观层面,因为他研究了情绪对美国蓝筹公司样本的影响。他使用的数据来自IND的Face book页面 个人公司。Bukovina(2015年)使用大量数据,没有定性区分为正面或负面。然而,他认为这些数据是一种情绪,因为公司简介在脸书“总结”普通人的行为,他们讨论他们对公司及其产品或服务的意见、情感或期望。此类信息不能被视为莱凡特的基本原理。然而,根据主要调查结果,Bukovina(2015)能够根据面板回归分析的结果和重新评估情绪的定性性质。特别是,他表示Face book人气偶尔出现高峰,对股票回报率产生负面影响。基于损失厌恶理论,Bukovina(2015)提供了关于更大胆的消极情绪和积极情绪相比的解释(Kahneman和Tversky,1979年)。

3.2 Twitter

这一领域最著名的论文之一是Bollen等人。(2011)谁从Twitter中衍生出社会情绪,并在股市中找到格兰杰意义上的相关性和因果关系。 公众情绪是从270万用户发布的约1000万条推文中提取出来的。道琼斯工业平均指数(DJIA)在他们的研究中代表了市场。此外,BolleN等人(2011)定义社会情绪的6个维度和“平静”维度显著改善了DJIA的预测。毛等人(2011)利用几个情感来源来模拟酒吧 利奇和投资者的情绪。推特提要就是其中之一。特别是,他们构建了两个情绪指标。1.推特投资者情绪(T IS)是一个看涨和看跌的推特比率。2.Tweet Vo 金融搜索术语(TV-FST)是一个tweet卷,用于搜索各种金融术语的查询。这两个指标都是每日市场回报的重要预测指标。这两个指标都优于传统的情绪工具,如情绪调查(投资者情报或每日情绪指数)和新闻媒体情绪。而且,与之相比,TV-FST指标的效率更高。 该指标基于谷歌查询在他们的研究中。Sprenger等人(2014a,b)研究与股票市场有关的推特微博论坛。Sprenger等人(2014a)辩称这些论坛包含新的 这只是关于股票价格和市场,没有噪音,这很可能包括在一般的Twitter饲料,就像Bollen等人的情况一样。Sprenger等人(2014a)重点关注单个股票的水平,因为他们每天分析大约250000条股票相关推文。他们的发现显示了推特情绪、股票回报率和交易量之间的关联。此外他们表明,微博社区可以识别“非凡”的用户,他们始终分享高质量的投资建议。同样,Sprenger等人。(2014b)研究公司活动推特微博论坛。他们在40多万条股票相关推文的样本中发现了好消息和坏消息。因此,他们能够捕捉到市场对新闻的反应,以及对由于新闻的定性区别而产生的情感。他们的研究结果显示了资本市场按公司事件类别的不同行为。特别是lsquo;Mergrsquo;等类别 与“合资企业”或“发展”等很少移动价格的类别相比,ERS和收购lsquo;或lsquo;收益rsquo;过去对市场参与者来说是一个惊喜。此外,结果表明,在正式宣布之前,积极的消息往往被泄露并纳入股票价格。相反,负面消息主要是令人惊讶的,与发生的事情有关事件发生之日内的行政长官。

3.3 Google

第一批研究谷歌数据的论文之一是Da等人。(2011年),谁提出的谷歌搜索查询股票号码24J.Bukovina/行为和实验金融杂志1 1(2016)18-26作为投资者关注的新的直接衡量标准。他们在罗素3000指数股票的样本中完成了分析。根据他们的调查结果,搜索量增加 研究样本的股票预测更高的股票价格在未来2周,最终价格逆转跟随在年内。此外,它还预测一家公司IPO首日高回报 以及长期表现不佳。Da等人根据Barber和Odean(2008年)的观点,解释他们的结果,即散户投资者的高度关注增加了购买压力。毛等人上一节提到的(2011年)也使用谷歌查询。他们的调查结果表明,谷歌的查询在格兰杰意义上是因果关系,市场指数收盘值和它的体积。此外,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[412752],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。