英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
第21届欧洲信息系统会议记录
心满意足,垂头丧气:
对网络消费者评论情感的文本挖掘
Madlberger, Maria, Webster University Vienna, Berchtoldgasse 1, A-1220 Vienna, Austria, madlberger@webster.ac.at
Nakayama, Makoto, DePaul University, 243 South Wabash Avenue, Chicago, IL 60604, United States, MNakayama@CDm.depaul.edu
摘要
在线评论的情感可以揭示很多关于产品认知和流行度的知识。然而,目前对网络评论的情感分析主要集中在情感和价值分析。基于离散情绪理论,我们将情绪划分为六种情绪(愤怒、厌恶、恐惧、喜悦、悲伤、惊讶),并假定它们在不同产品类型上的表现各不相同。为了评估情绪,我们引入了两个关键的测量维度:情绪广度(词汇多样性)和情感深度(总字数)。
我们假设快乐商品的情感广度和深度高于实用商品,同时这六种情绪的密度在这些产品类型之间是不同的。为了验证这些假设,我们收集了亚马逊网站上30台打印机和30张音乐CD的1087条评论。对此进行的文本挖掘分析结果显示,音乐CD上的评论比打印机上的更情绪化。快乐是两个产品之间占主导地位的情感。然而,厌恶的情绪(情绪广度)——打印机的悲伤(情感深度)与音乐CD相比,更为突出。本文讨论了文本关键字分析对离散情绪的影响和未来的研究方向。
关键词:文本挖掘,在线消费者评论,离散情绪理论,情绪广度,情感深度,情感密度,实用商品,娱乐商品
1.介绍
理解在线评论中的情绪可以在很大程度上加强对机制的理解,这些机制让某些产品比其他产品更受欢迎。这对于确定不同产品或产品类别的“情感负荷”有帮助。在在线评论的背景下,情感术语的分析使调查一种产品类型是否确实与更强烈的情感相关成为可能。此外,集体情感的知识有助于更好地理解产品如何被评价,什么因素增加或减少产品的受欢迎程度,以及他们的感知属性(Garcia和Schweitzer 2011)。
到目前为止,对网上消费者产品评价的文本挖掘主要集中在区分肯定和否定的评语的感情和效价分析(Das和陈2007;2008年)。然而,与口碑相似的是,网上的评论也也具有情绪化的特征(Kim and Gupta 2012)。评论者会寻找文本或符号表达来替代空白,用非语言表达情感(Provine et al. 2007;Xu等人,2007)。一些研究人员认为,情感产品评估不如理性产品评估有用,因为前者是主观的,而后者是客观的(Park and Lee 2008)。然而,这并没有明确的证据。相比之下,Li和Zhan(2011)的实证研究表明,消费者喜欢强烈的正面情绪评价。这一发现与通常认为客观意见更受欢迎的预期相矛盾。
由于对同一效价的离散情感会以不同的方式影响判断,情感比积极或消极的效价提供更多不同见解(Lerner和Keltner 2000)。对网络评论中的情绪和影响的研究是最近才开始的,还远远不够全面。Kim和Gupta(2012)、Park和Lee(2008)以及Sen、Lerman(2007)研究了在线评论中情感表达对产品评价的影响,这是一个例外。然而,所有的研究都是以效价为基础来考虑情感的。Kim和Gupta(2012)考虑了评价的积极和消极效价,而Park和Lee(2008)分析了特定的情感评价选择,即,简短,高度主观的文本。类似地,Sen和Lerman(2007)调查了正面或负面的评论是否被认为更有用,并揭示了实用主义和娱乐主义产品之间的显著差异。此外,Pollach(2006)分析了情绪诉求、理性诉求和在线评论中经验报告的数量,以便对单一情绪进行更精细的颗粒分析,而不是区分正面或负面。
在网络评论中,我们借鉴了离散情绪理论(Izard 1977;(Izard和Malatesta 1987),这是一种理论方法,用来区分几种相互独立的基本情感。在此过程中,我们对产品评论中出现的情绪术语进行了精细化分析,以补充现有的情绪分析和积极/消极影响方面的研究。在方法上,我们的方法是基于文本挖掘的,类似于Garcia和Schweitzer(2011)的方法,但是它是在一个更精细的尺度上进行的,因为它是基于将情感术语划分为六种独立的情感,而不是效价。因此,我们的研究面临着超越价态识别的挑战,最大的挑战是是将模棱两可的术语(例如“获得”)与相应“正确”的情绪对应起来。因此我们的分析提供了一种基于词典的精细情感文本挖掘方法,开发一套规则来处理在现有词典中没有得到充分处理的模棱两可的术语。为了证明应用环境的有效性,我们将文本挖掘方法应用于不同产品类别背景下网络评论情感强度的分析。在我们的研究工具开发的初始阶段,我们关注的是两种产品类型,它们在文献中被认为具有不同的情感特征,即实用的和娱乐的。
本文组织如下:在下一节中,我们将对消费者行为中的情绪进行文献综述,并对情绪进行文本挖掘。第三部分论述假设的发展。第四部分介绍了文本挖掘方法。本节还提出了识别情感术语的挑战性问题。第5节给出了假设检验的结果,第6节讨论了这些发现的含义。
2.理论背景
2.1消费者行为中的情绪研究
自20世纪70年代以来,大量的研究表明,情绪在消费者行为的许多方面起着关键作用(参见Laros和Steenkamp 2005年的概述)。在产品评价的语境中,情绪的作用是双重的:首先,消费者对产品的判断受到当前情绪的影响(Gorn et al. 1993;Kim等人2010;)特别负面的感觉会导致更多负面的产品评价。其次,产品本身以及产品的情感诉求能够唤起产品评价中所表达的情感。研究表明,产品的宣传越多,人们对产品的评价越积极(Martin et al. 1997)。产品评估本身可以在不同的情绪水平上进行(Kim和Gupta 2012;2008年;Pollach 2006)。在产品评价的背景下,Kim等人(2010)研究了产品的情感吸引力(如冒险性)与个人对产品的感受之间的一致性作用。同样,产品考虑的突出目标和特定情绪之间的一致性影响产品评估。因此,如果产品评估以成就目标为主导,则成就相关的情感信息更丰富;这同样适用于相关情绪和目标之间的一致性 (Bosmans 和 Baumgartner 2005 ).此外,产品信息的表达影响了情绪与产品评价的关系。产品信息的文字导致了从娱乐性或实用性因素出发的情感对评价的影响。然而,如果在给出口头信息之前就看到了产品,那么就会根据视觉印象做出判断,而不是根据娱乐或实用标准(Yeung和Wyer 2004)。Wood和Moreau(2006)的研究表明,情绪也是采用和评价创新产品的重要因素。他们的实证研究表明,创新的学习过程中出现的情绪会影响产品评价。
2.2情绪的分类
研究人员反复提出了情绪分类的问题,并讨论了情绪应该如何广泛地定义(Laros和Steenkamp 2005)。因此,根据该问题,有几个互补的方法。一些学者从总体上把情绪分为积极影响和消极影响两种,从而关注影响的极性(例如,Oliver 1993)。为了分析情绪,情绪被认为是一个连续的维度,从积极的影响到消极的影响(Tellegen和Watson 1999)。离散情绪理论(Izard and Malatesta 1987)是基于Ekman等人(1969)对情绪面部表情的研究。它区分了几种不同的情绪,从而识别出更多相互独立的情绪。2003 g,先知)。自从Izard(1977)讨论了十种基本情绪以来,大量的研究调查了离散情绪在不同情境中的作用。。消费者行为研究的例子有Lerner和Keltner (2000), Richins (1997), Nyer (1997), 以及 Ruth et al.(2002)。Dobele等人(2007)研究了电子商务环境下的离散情绪规则,即病毒式营销。许多研究人员区分基本的或主要的情绪,这些情绪被认为是进一步的、非基本情绪的基础(Ortony和Turner 1990)。尽管在基本情绪分类上存在很大的争议(参见Ortony和Turner 1990年的综述),六种情绪被广泛接受为基本情绪。这些情绪是愤怒、厌恶、恐惧、喜悦、悲伤和惊讶(奥特利和詹金斯1996;Parrot 2001;Plutchik 1980)。离散情绪在以言语方式表达情绪的研究中尤其相关,这一研究试图阐述情感词汇的词汇语义方法(Ortony et al. 1987;Clore et al. 1987)。情绪的言语表达是对非言语表达的补充,尤其能洞察个人的情绪状态(Fussell 2003)。
2.3情感词识别的文本挖掘方法
文本挖掘是一个重要的应用领域,它可以在许多上下文中产生有用的分析结果。因此,各种研究使用文本挖掘来进行情绪分析、意见挖掘(Baccianella et al. 2009),或识别文本中的情感术语(Strapparava和Mihalcea 2007;Strapparava和Mihalcea 2008;Strapparava et al. 2006)。文本挖掘建立在情感的口头表达之上。随着文本挖掘的重要性日益增加,需要对情感进行分析,使其比价或唤起更细微的区别(Valitutti等,2004;Strapparava和Valitutti 2004)。获取文本的情感表达,不仅自己的情绪状态,主要的情绪,需要考虑的还有与情感相关联的方面,如原因或情感行为(Ortony et al . 1987年)被称为直接和间接情感词(Strapparava et al . 2006年)。基于文本挖掘的在线评论情感研究目前主要集中在情感效价和情感分析上。Garcia和Schweitzer(2011)基于两个词汇(SentiStrength和new)收集在线评论中的情感词汇,但是只根据它们的积极/消极的效价来衡量情感。Xia和Bechwati(2008)的研究调查了情感强度作为一种个人特质的作用,以及评价的情绪性对总体评价影响和购买意愿的影响。然而,目前还没有一项实证研究对网络评论中单一情绪的发生进行深入分析,而这与评论的长度、结构和效价无关。
3.假设
不同产品的性质差别很大。实用主义和娱乐主义物品之间有一个被广泛接受的区别(赫希曼和霍尔布鲁克1982年;Strahilevitz和Myers 1998)。这种区别的根源在于不同类型的消费。实用性消费是指满足一种需要或完成一项任务,从而追求实用的目标和满足生活的需要。另一方面,娱乐消费是以快乐为导向,由乐趣、幻想和体验感官愉悦的欲望所驱动的(Strahilevitz和Myers 1998)。由于每种产品都包含不同程度的实用主义和娱乐主义特征,因此可以对实用主义和娱乐主义产品进行分类(Hirschman和Holbrook, 1982年)。虽然产品很难被归类为纯粹的实用主义或娱乐主义(例如,汽车),但可以假定每一个产品都有一个方面占主导地位(Dhar和Wertenbroch 2000;冈田克也2005)。产品评价在很大程度上受产品性质的驱动(Batra和Ahtola 1990)。对于实用主义商品,评估主要是认知驱动, 目标导向,和 工具性 (Strahilevitz Myers 1998 ) 。而对于娱乐产品,评价标准与消费体验密切相关(Batra和Ahtola 1990)。产品的性质不仅影响产品的评价标准,而且影响情感在产品评价中的有用性。对于实用性的产品,负面的评论被认为是更有用的,因为负面的表达更多的是归因于产品本身,而不是评论者。对于娱乐产品,则相反。在美国,负面评论更多地被归因于评论者,因此被认为用处不大(Sen和Lerman 2007)。因此,我们认为实用主义和娱乐主义产品的产品评价在数量(情感术语的数量)和质量(与基本情感相关的术语数量)上存在差异。为了衡量这些维度的情感,我们考虑了产品评论中的情感广度、深度和密度。广度和深度的概念基于De Luca和Atuahene-Gima(2007)的工作,他们在知识的背景下引入了广度和深度的维度。与这种知识的概念化类似,情感的广度衡量了评论中使用的情感词汇的多样性。情感的深度被定义为评论中使用的情感词汇的总数。最后,我们将情绪密度定义为评论中情绪词占所有词的比例,以标准化评论长度变化的结果。密度的概念是很重要的,因为情感词汇是嵌入在所有其他词汇中的。一个情绪词的影响在10个词的评论和100个单词的评论(如果还有其他感情用字的话)间应该被直观认为是不一样的。因此,情绪广度密度是指情绪词的种类相对于总字数的变化,而情绪深度密度是指情绪词的总数相对于总字数的变化。基于文本挖掘的情感分析表明,情感需要在不同产品特性的背景下考虑。因此,在网络评论中进行情绪分析的研究人员通常分几个步骤进行分析,从提取产品特征开始,识别这些特征的积极或消极情绪,并分析结果(Hu和Liu 2004a;胡、刘2004b;金达尔和刘2006;Popescu和Etzioni 2005;Wei等人,2010)。这种方法强调需要考虑产品之间的个体差异。在我们的研究中,我们通过假设娱乐主义和实用主义产品的评价存在差异来承认产品本质的差异。考虑到情感维度在娱乐消费中的较大相关性(Hirschman和Holbrook, 1982年),我们假设情感问题在娱乐产品的评论中更多出现。Bickart和Schindler(2002)表明娱乐产品评论比实用产品的评论包含更多的情感词汇。
因此,我们假设:
假设1:娱乐主义商品比实用主义商品在产品评论中的情感词密度更高。
在区分广度和深度密度时,我们指定:
假设1a:产品评论中情感的广度密度,娱乐类商品高于非娱乐类商品商品。
假设1b:娱乐主义商品比实用主义商品在产品评价中的情绪深度密度更高。消费者研究显示,不同类型的目标与实用主义和娱乐主义产品有关。对于实用主义的商品,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[236520],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。