旅游管理中的大数据:文献综述外文翻译资料

 2022-08-13 16:14:31

英语原文共 23 页,剩余内容已隐藏,支付完成后下载完整资料


旅游管理中的大数据:文献综述

摘要

在很早以前,各种大数据已被引用在旅游业的研究中,并取得了惊人的进步。本文将在旅游研究中不同类型的大数据这一领域中,进行可能是首次的全面的文献综述。从数据来源来看,与旅游业相关的大数据可分为三大类:UGC数据(由用户生成),包括在线文本数据和在线照片数据;设备数据(由设备生成),包括GPS数据,移动漫游数据,蓝牙数据等;交易数据(由操作生成),包括网络搜索数据,网页访问数据,在线预订数据等。不同的数据类型包含着不同的信息,可以解决不同的旅游问题。本文将对于每种类型的数据从研究重点,数据特征,分析技术,主要挑战和进一步方向的五个角度进行系统分析。本文的调查有助于透彻了解这一蓬勃发展的研究,并提供对其未来前景的提供有价值的见解。

1 综述

随着计算机科学和互联网技术的飞速发展,结构化和非结构化样式的海量数据被大量地生成,记录,存储和积累,由此形成了大数据,并开启了一个新时代(Kambatla,Kollias,Kumar amp; Grama,2014年)。在这样的大数据时代,各种各样的大数据以及概念和技术创新已被广泛用于科学,工程,医疗保健,管理,商业,旅游等领域(Hashem 等,2015)。但是,大数据还没有一个统一的定义。不同的研究人员给出了各种各样的定义:一个著名的原始定义是3V,其将大数据表征为体积大,种类多样和速度快(Laney,2001)。Gantz 和 Reinsel(2011)通过引入“价值高”突出大数据的有效性和实用性,将大数据的概念由3 V扩展到4 V。尽管定义上存在争议,但大数据和大数据技术为改善科学研究做出了巨大贡献,其中旅游研究就是一个新兴的典型例子。

在早期,从用户,设备和运营这三个主要来源已经生成了大量与旅游相关的大数据。首先,互联网促进了社交媒体的快速崛起,提供了一个强大的平台来传播用户生成的内容(UGC)数据(在文本,照片等方面)(Xiang,Du,Ma amp; Fan,2017年) 。其次,由于物联网(IoT)的蓬勃发展,多种传感器设备出现了,并可用于跟踪游客的活动和环境状况,从而提供了可观的时空大数据(例如全球定位系统(GPS)数据,漫游数据,蓝牙数据等)(Shoval amp; Ahas,2016年)。第三,旅游是一个复杂的系统,涵盖了一系列的操作(即旅游市场中的交易,活动或事件),例如网页搜索,网页访问,在线预订和购买等,从而产生了网页搜索数据的相应交易数据,网页访问数据,在线预订数据等。通过这些数据,可以使我们了解游客的行为并用于扩大旅游市场。基于这三个主要来源的大数据,学术界和行业都可以更好地探索和理解游客行为和旅游市场。

利用前面提到的宝贵大数据,旅游业研究进入了大数据时代,并有了惊人的进步。例如,Yang,Pan,Evans amp; Lv(2015)认为大规模海量数据可以很好地弥补在调查数据时所面临的用户样本规模局限,提供了一种了解游客行为的新途径。同样,Li,Pan,Law amp; Huang(2017)认为大数据分析可以提供足够的数据而不会产生抽样偏差,从而有助于学术界和行业更好地了解游客行为。Xiang,Schwartz,Gerdes amp; Uysal(2015)认为,大数据分析可以发展新知识,重塑人们对酒店业的理解,且可以帮助人们做出相应的市场决策。由上述的优点易知,大数据可以使人们更好地了解旅游需求、游客行为、游客满意度和其他旅游业的问题。

鉴于大数据已经大大改变了基于传统数据的传统旅游研究,因此,我们有必要对这种新兴研究进行一个全面的回顾,即如何在旅游研究中使用大数据。一方面,尽管这方面的研究成果越来越多,但潜在的研究人员不能很好地认识这个新兴研究领域。 例如,对于在旅游业中使用了哪些特定类型的大数据以及如何利用这些新数据仍不明确。另一方面,在将大数据与传统数据进行比较时,前者的信息量和结构可能会复杂得多。因此针对不同研究问题,这些大数据有不同的数据特​​征,需要用不同的分析技术来进行研究。因此,我们迫切需要从研究重点,数据特征和分析技术等方面对旅游研究中的各种类型的大数据进行全面的综述,以便整理学术界利用大数据来进行旅游研究的发展历程,并希望为今后的研究指明方向。

但是,学术界仍然缺乏基于大数据的旅游研究的系统文献综述。现有的有关旅游研究的文献综述主要集中在以下几个方面:在某个国家的旅游(例如,Bao,Chen amp; Ma,2014; Huang amp; Chen,2016; Sun,Wei amp; Zhang,2017; Zhang ,Lan Qi, amp; Wu,2017);特定类型如公事旅游和志愿旅游等类型的旅游(Getz amp; Page,2016; Wearing amp; McGehee,2013);旅游需求(Goh amp; Law,2011; Song amp; Li,2008);游客行为(Bhati amp; Pearce,2016; Pomfret amp; Bramwell,2016);旅游胜地(Leask,2016);旅游风险(Yang,Khoo-Lattimore amp; Arcodia,2017)。

然而据我们所知,将大数据应用于旅游业研究仅有三篇相关文献:Rashidi,Abbasi,Maghrebi,Hasan amp; Waller(2017)研究了利用社交媒体数据对旅行轨迹进行建模的能力; Schuckert,Liu amp; Law(2015b)回顾了有关旅游业和酒店业在线评论的研究; Shoval amp; Ahas(2016)对旅游研究中的旅游轨迹数据进行了文献综述。显然,这三项研究集中于某种类型的大数据(社交媒体数据,在线评论或轨迹数据),而没有对完整类型的大数据进行整体分析。此外,这三项研究主要是从各自的研究领域的角度进行的,没有充分考虑数据特征和分析技术。但是,就研究重点(针对不同的旅游业问题),数据特征和数据处理技术而言,不同类型的大数据(来自不同的数据源并具有不同的信息)与其他任何类型的数据大有不同。因此,本文试图填补这样的文献空白,以对旅游研究中不同类型的大数据进行全面的文献综述,并从研究重点(针对不同的旅游问题)、数据特征、分析技术,研究挑战和未来研究方向的角度对每种类型的数据进行系统的分析。

本文的主要目的是就大数据在旅游业研究中的应用进行全面的文献综述。

相对于现有研究,本文的主要贡献可归纳为三个方面:(1)据我们所知,这可能是首次对在旅游业研究中使用的大数据的完整类型进行回顾; (2)因为不同类型的大数据(包含不同信息)可能会解决不同的旅游问题、不同的数据特征并需要不同的分析技术,所以需要从研究重点(针对不同的旅游问题)、数据特征和分析技术三个角度对每种类型的数据进行系统的分析;(3)在详尽的研究基础上,本文认真研究了基于大数据的旅游研究的当前的主要挑战和未来的前景。

本文的其余章节可以分别概括为:第2节介绍了综述文献的一般发现(或统计数据)以及本文的分析框架。接下来,第3-5节详细研究了旅游研究中的大数据,这些数据分别来自三个主要来源,即用户,设备和操作。 第6节总结了本篇综述的主要结论,并指出了将大数据应用于旅游研究的未来方向。

2 已有研究

2.1 数据库

本文整理的基于大数据的旅游研究的文章来自以下学术数据库:Web of Science,ScienceDirect,SAGE Journals Online,Emerald Insight,Springer和Wiley Online Library。此外,还使用了功能强大的搜索引擎 GoogleScholar。为了获得全面的结果,我们不仅将旅游和大数据作为了关键字,还使用其他与旅游研究相关的词(如旅游、旅行、游客、游玩、住宿、目的地或酒店等)以及与大数据相关的术语(如大数据、大量数据、海量数据、数据挖掘、UGC、文本挖掘、情感分析、消费者评论或带有地理标签的照片等)。本研究未考虑出版物的时间限制。同时样本中仅包含完整的文章,因此不包括书评、报告、观点、研究笔记和短文。检索得到的文章将被单独重新检查相关性。最后,在研究中我们共选择了165篇文献。对于每篇文章,我们都记录了重要的属性,例如作者、标题、出版年份、关键字、来源标题、国家/地区和数据类型。

2.2描述性统计分析

在描述性统计分析的基础上,使用大数据进行的现有旅游研究可以得出有关整体增长,出版物来源,研究区域和数据类型等方面的一些有趣的发现。

2.2.1. (研究数目)总体增长

图1 年度发表文章数量

图1说明了现已发表的基于大数据的旅游业研究的年度文章数量,容易得出两个重要的结论。一方面,就时间短(自2007年开始)和年度文献少(至多30篇)而言,基于大数据的旅游业研究仍处于早期阶段。另一方面,在2007年至2016年期间,每年的发表文章数量总体上呈增长趋势,这表明人们越来越关注这种新兴研究。有趣的是,2015年出现了一个明显的增长点,此后每年的文章数量上升到一个更高的水平,并在2016年达到峰值,数量为30篇。

2.2.2. 出版物来源

图2 不同出版物来源中的文章数量

图2展示了发表于不同出版物来源中的文章数。 基于大数据的旅游业研究的文章大多数是期刊论文(144种出版物,约占87%),只有21篇是会议论文。这项结果表明,各种期刊已经开始关注这种新兴领域,并将大数据应用于旅游业研究。文章发表数目排名前四的主要期刊是《旅游管理》(38篇文章),《旅行研究期刊》(9篇),《国际酒店管理杂志》(8篇)和《旅游地理》(8篇)。

2.2.3. 研究区域

图3 不同区域的研究数量

图3显示了该研究的所属区域范围(确定为第一作者的隶属地区)。可以发现,至少有33个国家或地区发表过基于大数据的旅游业研究领域的论文,其中,来自亚洲、欧洲和北美的已发表研究最多。在所有国家中,美国排名第一(被确认为41篇文献),其次是中国和澳大利亚(分别为35篇和11篇)。 这些结果与大数据技术(尤其是社交媒体)的发展水平以及其在不同国家和地区的用户规模相符合。

2.2.4. 数据类型

图4 研究中的数据源和数据类型

图4表明了现有的旅游业研究中使用的大数据的类型。可以明显看出,旅游研究中使用的大数据主要来自于三种数据源:用户(约占47%),设备(36%)和操作(17%)。使用不同数据源的隐藏原因在于数据可得性。具体而言,将UGC数据应用于旅游研究的蓬勃发展可能是由于数据低成本且易于获取;相反,交易数据使用率较低的主要原因是其大多数是私人信息,仅属于旅游公司或政府部门。在数据类型方面,在线文本数据在UGC数据中所占比例最大(55%),在各种大数据中所占比例最高(26%)。 GPS数据在旅游研究中排名第一,在大数据中排名第一(占21%),在设备数据中排名第一(占58%)。

2.3 分析框架

根据现有文献,各种大数据已广泛应用于旅游研究。从图4可以看出,这些大数据可以根据数据源分为三类。(1) UGC数据(由用户产生):用户主动上传的在线文字数据和在线图片数据。(2)设备数据(由设备产生):通过设备采集的GPS数据、移动漫游数据、蓝牙数据、RFID数据、WIFI数据等。(3)操作数据(由操作产生):网页搜索数据、网页访问数据、在线预订数据等,记录所有与用户相关的在线操作,如网页搜索、预订与购买、网页访问等。根据数据来源及其对应的数据类型,我们的文献综述分析框架如图5所示。

根据各数据类型的特点,并结合已有的大数据调研,可以推导出本文的分析框架。首先,随着web 2.0和社交媒体的发展,用户拥有一个广阔的平台来通过在线文本数据(包括产品评论和博客)和在线照片数据来分享他们的旅游体验。已有的相关研究大都认为这些用户主动发布的这些数据就是UGC数据(Hu, Chen, amp; Chou, 2017; Lu, Wu, amp; Sang, 2017; Shi, Serdyukov, Hanjalic, amp; Larson, 2011; Xiang et al., 2017)。其次,随着loT的发展,各种各样的设备(如GPS记录器、电信基站、蓝牙传感器、电子阅读器和WIFI扫描仪)可以用来追踪记录游客的旅游轨迹。由不同设备记录的相关特定时间的大数据可视为同一类数据,即设备数据(或跟踪数据) (Hardy et al., 2017; Shoval amp; Ahas, 2016)。第三,旅游是一个复杂的系统,它包括一系列的操作(例如:旅游市场中的交易、活动或事件),如网上搜寻、网上预订及购买等。因此,相应的数据,如网络搜索数据、网页访问数据、在线预订数据等都是操作数据的典型例子 (Pan, Xiang, Law, amp; Fesenmaier, 2011)。

图5 文献综述的分析框架

基于图5的分析框架,第3-5节进一步研究了旅游研究中分别来自用户、设备和操作三个数据源的大数据,。针对每个数据源和其对应的不同类型的大数据,本文将从研究重点(针对不同的旅游问题)、数据特征、分析技术、主要挑战和进一步研究方向等方面进行系统分析。

3. UGC 数据

在数字时代,网络和社交媒体的蓬勃发展极大地改变了人们的出行方式,为用户原创和共享内容提供了一个广阔的平台。UGC数据作为大数据的一个主要类别,可以用于促进旅游研究、它包括两种类型:(1)在社交媒体上发布的产品评论、博客等在线文本数据;(2)照片分享网站发布的在线照片数据。

3.1. 在线文本数据

随着互联网和社交媒体蓬勃发展,游客可以通过丰富的平台来传播各种旅游相关信息,如旅游时的评论和体验等。例如,人们可以表达他们对

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[235865],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。