英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
农业和资源部
经济学,UCB
加州大学伯克利分校
同行评审
题目:
大数据中的企业和金融调查
作者:
Villas-Boas, Sofia B, UC Berkeley
发行时间:
2014年秋
系列:
CUDARE工作底稿
固定链接:
http://escholarship.org/uc/item/23n9h86m
版权信息:
除另有说明外请联系作者或原发行商来获取必要的权限。eScholarship不是存放作品的著作权人。要了解更多请登录http://www.escholarship.org/help_copyright.html#reuse
大数据中的企业和金融调查[1]
索非亚博阿斯
本文讨论了企业如何使用“大数据”和经济学家在大的观测数据面板建模和识别因果关系中的作用。这在显示公司如何利用大数据来提高利润以及数据共享协议对学术界和企业界都有怎样的好处,还有经济学家面对的挑战——在计算,出版,复制时使用的专有大数据。
大数据已成为行业、媒体和学术界的一个共同术语。自20世纪90年代以来,所谓的三伏是用体积、速度和品种来定义大数据,随着越来越多的数据被创建,来源于各种途径,如虚拟数据,使这些数据已经扩张。截至2012年,根据IBM,数据生成的速度是每天2.5艾字节,这速度预计大约每三年将增加一倍。一个艾字节(EB)等于1018bt,这相当于10亿千兆字节。这生成了一个想法,这个数字是指在使用方面的含义,根据IBM,大多数64位计算机可以“解决”16艾字节,并且一个艾字节是在所有的国会图书馆内容的500倍和3000倍之间(约翰斯顿,2012)。
企业和消费者在做出决定前都面临着数据的扩张。企业必须运用自己的权利决定向消费者发布多少信息;因为信息处理的成本,如果提供过多的信息,消费者可以决定不处理信息,并可能最终选择不购买(例如,布兰科等人,2013)。这里有不同的观点,消费者和公司是否已成功地处理来自大数据的相关信息来做决策。一个悬而未决的问题是是否或者如何将大数据融入企业的决策,这将影响组织内的绩效或效率是否能够显著提高。另一个重要问题是,是否有一个净值报酬率来回报大数据的中心举措。
本文以成功的例子开始,大数据帮助企业了解他们的客户——高端消费者和中间公司——并把这些知识利用在他们的战略上,以获得竞争的优势。这个成功的事例已经充分利用了最大的数据库,使用最佳的提取工具,并使用最快的算法进行数据分析和管理。
这之后,它使得经济学家应该开始涉足大数据的研究,而目前的数据分析师主要是统计人员和计算机科学家。经济学家的一个优点是,他们可以模拟大的观测数据板的模型框架,以及由一个模型框架来开发有经验的设计和策略,在这种方式,经济学家可以引导大规模的大数据实验,找出因果关系,而不只是相关性。
然后本文转向成功的例子,学术研究已经使用了来自企业大数据的例子。它讨论了由此产生研究的可能性,以及如何进行已经演变成创造独特的数据和经验设置来回答研究问题的经济学的数据共享协议。它突出了使用来源于企业数据集的局限性,然后讨论了开放性的挑战,这些挑战包括研究人员使用专有的大数据时的计算,出版和复制。
一 企业的大数据已经如何被使用以及接下来会被如何使用
使用数据管理是不是一个新的管理洞察力。什么是新的,当使用大数据来获得有用的并且有关数据大小的见解管理问题时,在任何时间内,新的数据成为可用的,以及在任何时间内各种可用数据在该公司的处理问题。公司的目标是整合来自内部信息技术(IT)部门或者他们的团队与建立或启动它的公司的大数据,(见例如,华尔街日报“大数据”系列,2013),以帮助有效地收集、合并、处理、提取和使用大数据。
随着大数据的兴起,它在制作评估现有的和过去的管理决策报告中的传统作用已经发生了巨大的变化。现在,管理者在决定之前它的部门可以是非常有价值的。方法和挑战取决于什么样的数据被收集,然后将他们用于决策。如果数据是结构化的(例如,数据,以行和列存储或其他标准管理格式),大数据分析需要掌握最佳提取工具和发展最快的算法进行数据分析,以帮助管理者在作出战略决策之前能够洞察大数据。如果数据是非结构化的(例如,来自视频,或消费者反馈,或评论),就会生成大型非结构化数据管理出现的其他挑战,这些数据可以用来获取有用的策略,以获得有益的见解。
大数据的使用
有多行业的证据(TCS、2013和拉马斯瓦米,2013)显示大数据的使用仍然很低。根据亚洲一千二百强企业高管调查拉丁美洲的美国、美国北部和欧洲,结果是47%的企业没有大数据倡议[2],40%表示他们仍然用预感或“直觉”的感觉来做出决定。在那些从事大数据活动的人中,对2012的大数据的平均回报率(投资回报率)是46%。有趣的是,公司的高管们说,他们最大的投资回报率表示,转向大数据倡议的最大好处,包括获得更好的了解他们的消费基础,能够更好地预测消费者的忠诚度,并评估产品性能。总的说来,核心利益不在于转向大数据,而在于主动寻找新的方法来使用大数据在商业策略设计中的应用。另一项研究发现,有分析技能的工人和那些能够根据现有数据做出决策的劳动力也有短缺(麦肯锡全球研究所,2012)。
大数据的成功使用
现在讨论这些举出的几个例子,这些都不是通过任何手段做详尽的案件但已经能够成功地分析和使用大数据。在这些例子中,在实施之前企业使用大数据来获得消费者的忠诚度,发现新产品的需求模式,并实施大数据市场实验,以测试策略。此外,一些公司的成功案例是结合了他们自己的大数据与额外的第三方大数据,以获得竞争对手的管理优势或提供创新服务。
了解消费者,获得市场份额:大多数讨论的情况下,亚马逊的案例可能是一个公司战略使用大数据的最出名的案例(例如,马登盖尔,2012).在线图书销售记录,以及浏览和点击模式为每个个人电脑访问Amazon.com,使亚马逊比竞争对手能够更好的理解需求。亚马逊是通过跟踪来了解,顾客不仅买了什么,而且还看了什么;他们如何登陆网站;受促销、评论和页面布局的影响是多少;个体和群体间的相似性。亚马逊还使用了大数据为基础的工具,为消费者提出建议,这些工具包括对建议的回答 以改善未来的个人建议。
保留消费者:据估计,沃尔玛从客户交易和其他零售商的大规模数据集中每小时收集超过2.5拍字节的数据。一个大的服装实体店和在线零售商,像梅西,使用三分之一已开发的软件,通过合并来自多个来源的数据公司以预测客户的路径,如过去的购买数据,在线购买和搜索数据,网上银行系统,返回系统,或与服务呼叫中心的接触,与来自外部的数据,如推特和谷歌趋势。软件背后的想法是使用所有可用的数据(例如,一个特定的好),然后对某一特定类型的消费者的结果进行预测。这一大数据倡议增加了收入,通过预测的基础,消费者有可能购买什么,一旦当消费者有可能购买,就可以保证产品的购买或装运的相关性。通过相关性,它也预测并提出了一种策略,当一个消费者不太可能购买一个特别好的商品时,例如通过有针对性的促销电子邮件以诱导该客户购买。
提高消费者的忠诚度:最近实施的忠诚计划的零售商Safeway,名为“只为你”,在个性化折扣的基础上,通过俱乐部卡收集每个消费者的历史购买记录。在这项计划里,跟踪一个消费者的迹象,并在购买点提供个性化的报价,以及制造商的优惠券,为了消费者购买的产品能有规律。根据2013的第一季度盈利报告,这一大数据倡议已经成功地增加了消费者的忠诚度和每一个购物的消费场合。
提高客户满意度:迅速地用大数据创新整合来自全国各地渠道的数据,网上商店,砖和砂浆的零售、目录和电话销售,以改善客户对所提供的服务不快乐的画面。鉴于这些见解,进行了必要的改变,其业务从去年上升为美国客户满意度指数第一的运营商,同时也减少了其呼叫中心预算的一半。
项目/崩溃大数据的预测:Opera是一个提供基于“信号”可管理的数据公司的应用程序,这是在大数据集上可以找到重复的模式。Opera已经建立了一个信号库,如客户价格敏感度。利用这些信号,它有助于公司做出关于利益结果的预测。信号分为不同行业的。信号背后的想法是非常聪明的:它将一个大的数据放在一个公司大数据上的一个小的管理数据集。例如,Opera使一家主要的日本汽车公司增加了在租赁期结束时的汽车销售价格。它是通过将汽车的属性分解成组件,然后根据来自相关信号的信息设置一个值。
新产品的推出和议价能力:网络公司Netflix最近投资的内容是利用内部大数据选择哪个节目来制作,以及如何促进视频流和DVD。据业内人士分析,这一转变成内容生产不仅展示了大数据增加订阅的一个成功战略,也说明了Netflix可以相对于传统的内容生产者增加其议价能力——一个类似于零售商显示自己的商店品牌与民族品牌的策略。
结合第三方实时数据:Mayer-Schonberger和库克(2013)讨论了一个例子,基于谷歌使用相关大数据来帮助机构如疾病控制中心(CDC)去跟踪流感季节。基于人的位置寻找流感或流感症状的相关信息,谷歌CDC流感趋势给出了瞬时的想法,所以它可以设计人生病了的策略。另一个例子,利用来自梅西停车场外部的手机GPS定位数据,来自麻省理工学院媒体实验室的分析师能够预测,在真正的时间,黑色星期五有多少人会在梅西商店(McAfee 和Brynjolfsson,2012)。这使得估计关键一天零售商的销售成为可能,据此来分配销售代表。
供应链中的企业间关系:公司采用零售解决的方案是大数据跟踪技术,以帮助供应商(上游企业)和零售商(下游企业)企业提高交易的效率。作为一个例子,金佰利克拉克能够使用一半的时间用这些工具来推出一个新产品,它通常需要具体到产品股票的所有分销商(华尔街日报,2011)并获得分销商和零售商店的实时销售数据。
非结构化数据,社交网络,和人力资源:数据——现实是企业招聘的驱动方式——想想电影点球成金。基于大数据的发展,在人力资源招聘已经由LinkedIn负责。LinkedIn利用数据之间的匹配工作转移模式、特点和企业成员,成员的特点和企业的特点,他们做什么和已经做了什么,凭借招聘人员自身的属性推荐潜在员工和潜在招聘者(安德斯,2013)。对于电子邮件征求我们加入个人X公司的网络这种事我们都很熟悉。公司收到类似的建议条款“候选人为你。“一些模式识别的LinkedIn是结构化的数据,如个人信息,而其他模式源于非结构化数据,如LinkedIn和脸谱网在成员的社交网络页面的照片和视频。
二 大数据和学术研究
大多数负有盛名的大学,尤其是它们的商学院,都致力于研究和教授有关公司如何利用大数据的知识。其重点是:1、如何从内部和外部收集某公司的实时信息,2、如何从这些信息中开发新的见解,例如,找出客户忠诚程度的规律,3、利用这些见解来改善成果,例如,接着上一个例子,公司可以使用战略营销策略来确定哪些消费者即将离开,这些教研活动使得IT和实证分析在企业的产业组织和内部组织中发挥关键作用,在各种各样的行业,如零售业、银行和健康方面。
成为成功的大数据分析师的大学毕业生大都是计算机科学和统计专业的学生,需要的技能包括计算一个主题,然后对主题的结果做出预测,也包括能使用所有可用的数据的能力,也能基于大数据发现相关性,而不是基于一个小的、可管理的数据集(迈耶 - 舍恩伯格和库克,2013)。更多的数据分析人员要拥有更强的相关性,以及更准确的格局和关于特定主题的预测。然而,相关并不意味着一件事导致了另一件事,此外,一个人可以找到各种各样的相关性,因为有许多可能的组合,但大都是以迷路来代替有效的见解。
经济学家案例
经济学家可以并且应该跟上大数据趋势,经济学家们接受培训,发展理论见解,引导数据分析师在哪里寻找大数据。无论是使用大数据面板数据集或实验大数据,经济学家们都适合开发模型框架来得到假设检验的预测分析中的因果关系,而不是简单的相关性。这些技能在研究生经济学课程中得到很好的发展,经济学本科生对这些技能也有初步的学习。
经济学家可以通过基于模型的问题提出有助于分析师了解的调查结果,最终得到好处。在大数据中,很容易导致迷失方向或者是停在对给出的一些感兴趣的变量里寻找有趣的相关性上。我相信大学应该找出一种方法,以获得最优秀的经济学本科和硕士研究生参与大数据分析。从研究的角度来看,一个很大的优势是,给定大量的数据,模型可能需要更少的假设并且一次研究问题由更多的数据来驱动。这一直吸引着研究者。
虽然学术研究人员一直能够访问和直接从公司购买小数据集来回答特定的研究问题,但研究人员现在的目标是访问超出了单个企业传统小数据集的大数据。这可以通过发展互惠的伙伴关系与专有的大数据所有者进行创新的研究来完成。在最新的统计和数据分析方法的前沿,经济学家们在理论模型的基础上进行了研究,从而为企业和分析大数据提供了独特的定位方法。基于现有的零售数据协议中成功的例子,发起这样的学习型企业的伙伴关系的一个优点就是,数据所有者还允许合作者研究人员使用大数据,并且研究问题的利益超越了企业的管理目标。
有领导努力的成果而带来的大数据研究——基于经济学的研究,例如,通过Athey等人。(2013.焦尔斯基和西格尔)。另一方面,这一研究的作者们揭露了它所使用的专业方法,他们用自己基于大数据来实证研究,如机器学习,(ITO,2013)。另一方面,可能更重要的是,这项研究说明了如何应用精心设计的
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[150526],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。