英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
附录 A 译文
Facebook语言预测病历中的抑郁症
摘要:抑郁症是最常见的精神疾病,它无法被诊断和治疗,突显了目前扩大筛查方法范围的必要性。本文使用Facebook上个人公开帖子中的语言来预测记录在电子病历中的抑郁症。我们访问了683名前往城市里一家大型学术急诊室就诊的患者所发布的Facebook历史状态,其中114人的医疗记录中有抑郁症的诊断。只使用第一份抑郁症诊断文件之前的语言,我们就可以相当准确地识别抑郁症患者[曲线下面积(AUC)=0.69],大致与以医疗记录为基准的筛查调查的准确性相匹配。对于那些有足够多的Facebook数据的用户来说,将Facebook数据限制在第一次有抑郁症诊断记录之前的6个月可以产生更高的预测准确率(AUC=0.72)。在第一份记录的前3个月就有可能实现对未来抑郁状态的重要预测。我们发现抑郁语言的预测因素包括情绪(悲伤)、人际(孤独、敌意)和认知(专注自我、沉思)过程。通过社交媒体对同意的个人进行低调的抑郁症评估,作为现有筛查和监测程序的可扩展补充可能变得可行。
关键词:大数据;抑郁症;社交媒体;Facebook;筛查
引言
每年,有7%-26%的美国人得抑郁症(1,2),其中只有13%-49%的人接受了最低程度的充分治疗(3)。到2030年,单相抑郁障碍预计将成为高收入国家残障的主要原因(4)。美国预防服务工作组建议在能提供准确诊断、治疗和随访的情况下对成年人进行抑郁症筛查(5)。如此高的漏诊率和未充分治疗率表明,现有的筛查和识别抑郁症患者的程序是不够的。这需要新的方法来识别和治疗抑郁症患者。
通过使用一位自愿到急诊科就诊的患者的Facebook语言数据,我们建立了一种方法来预测电子病历(EMR)中诊断抑郁症的第一个文档。以前的研究已经证明了使用Twitter(6,7)和Facebook语言以及活动数据来预测抑郁症(8)、产后抑郁症(9)、自杀(10)和创伤后应激障碍(11)的可行性。这依靠Twitter(12,13)上的自我诊断报告或被试对筛查调查(6,7,9)的反应来确定被试的心理健康状况。与这项先前依赖自我报告的工作不同,我们通过使用电子病历中的医疗代码实现了抑郁症诊断。
正如Padrez等人所言(14),单一城市学术急诊室(ED)的患者被要求分享他们的医疗记录和Facebook时间表中的状态。我们使用患者病历中与抑郁症相关的国际疾病分类(ICD)代码作为抑郁症诊断的替代,这在先前的研究中表明是可行的,且有适当的准确性(15)。在参与这项研究的患者中,有114人在其医疗记录中被诊断为抑郁症。对于这些患者,我们确定了第一份抑郁症诊断文件被记录在医院系统的电子病历中的日期,分析了每个用户在此日期之前生成的Facebook数据。我们试图模拟一个真实的筛查场景,因此在这114名患者中随机确定了5位电子病历中没有抑郁症诊断的对照患者,只检查了他们在对应的抑郁症患者第一次有记录在案的抑郁症诊断的日期前创建的Facebook数据。这使得我们可以在相同的时间跨度内比较抑郁症患者和对照患者的数据,并对更大的人群中的抑郁症患病率进行建模(约为16.7%)。
意义
抑郁症是一种失能和可治疗的疾病,但被低估了。在这项研究中,我们认为Facebook上用户同意分享的内容可以预测以后出现在他们的医疗记录中的抑郁症。预测抑郁的语言包括提到典型的症状,如悲伤、孤独、敌意、沉思和更多的自我参照。这项研究表明对社交媒体数据的分析可以用来筛查同意的个人是否患有抑郁症。此外,社交媒体内容可能会就抑郁症的具体症状为临床医生指明方向。
结果
抑郁症的预测
为了预测未来病历中抑郁症的诊断,我们利用Facebook中帖子的文本内容、长度、频率、发布时间和人口统计学(材料和方法)建立了预测模型。然后,我们通过将我们的算法估计的抑郁概率与病历中每个患者实际存在或不存在抑郁进行比较来评估该模型的性能(使用10倍交叉验证以避免过度拟合)。改变该概率唯一用于诊断的阈值以确定形成接收者操作特征曲线(ROC)的点的真阳性率和假阳性率的组合;总体预测性能可以概括为接收者操作特征曲线下的面积。为了产生可解释和细粒度的语言变量,我们通过使用隐狄利克雷分配模型(LDA;ref 16)提取了200个主题。LDA是一种类似于因子分析但适用于词频的方法。我们根据患者表达这些话题的相对频率以及一个词和两个词的短语训练了一个预测模型,得到的曲线下面积(AUC)为0.69,略低于良好辨别能力的惯常阈值(0.70)。如图1所示,语言特征的表现优于其他发布功能和人口统计特征,当添加到基于语言的模型中时,这些特征并不能提高预测准确性。
所有预测因子
Facebook语言
发帖长度amp;活跃度
人口统计资料
时间模式
图1.电子病历中基于人口统计学和Facebook发帖活跃度对诊断抑郁症的预测表现报告为交叉验证的样本外ROC曲线下方的面积大小
相较于其他抑郁症筛查方法,这些预测性能表现如何?Noyes等人(17)评估筛查调查与本研究中电子病历所记录的抑郁症诊断的一致性[1];结果与我们的Facebook模型一起显示在图2中。结果表明,Facebook预测模型得出的预测精度与经过验证的自我报告抑郁量表相当。
之前的研究发现,抑郁的用户更有可能在夜间发Twitter(6)。然而,在我们的研究中,被诊断为抑郁症的患者和未被诊断为抑郁症的患者在他们的发布时间上只有轻微的差异(每天和一周中的每一天;AUC=0.54)。发帖长度和发帖频率(元特征)为0.59 AUC,人口统计学特征为0.57 AUC。在医疗记录中对抑郁症的预测大致相同,最终被确诊为抑郁症的用户发帖的年平均字数高出1,424个单词(Wilcoxon W=26,594,P=0.002)。将时间模式特征和元特征添加到基于语言的预测模型中并没有显著提高预测性能,这表明语言内容捕获了其他特征组中与抑郁相关的方差。
与以往预测研究的比较
在我们的样本中,病历中被诊断为抑郁症和没有抑郁症的患者按1:5的比例进行平衡,以模拟真实的抑郁症患病率。在以前的工作中,这一平衡更接近1:1(例如参考文献7中的0.94:1;参考文献6中的1.78:1)。当我们的样本限制在平衡(1:1)时,可得AUC=0.68,F1=0.66(准确度和召回率的调和平均值)。这与基于Twitter数据和抑郁症调查报告的参考文献7中的F1分数0.65,以及参考文献6中的F1分数0.68相当。语言内容捕获了其他特征组中与抑郁相关的差异,这一事实与之前的研究(6,7,18)中看到的一致。然而,本研究表明社交媒体可以预测医疗记录中的诊断结果,而非自我报告的调查结果。
确诊前的抑郁症预测
我们试图调查Facebook能提前多长时间预测会得抑郁症。为此,我们研究了抑郁患者的语言数据,这些数据来自7个6个月的窗口,然后为307名在所有7个窗口中至少有20个单词的用户提供了第一份抑郁症文件(或其匹配的对照时间)的记录。图3所示的结果表明,Facebook上的数据越接近抑郁症的记录,它们的预测能力就越好,在记录抑郁症前的6个月内的数据产生了0.72的准确率(即AUC),超过了良好辨别的习惯阈值(0.70)。因为它可以预料到这样一种短暂的的趋势,这些结果为判断预测能力提供了可信的证据。对会得抑郁的最小预测(AUC0.62)高于概率(P=0.002)可以提前大约3个月(3-9个月窗口)获得。尽管这种预测准确度相对较低,但它表明如果与其他形式的不引人注意的数字筛查相结合,有可能在获得抑郁症的医疗记录(通常会被推迟)前开发出无负担的精神疾病指标。因此,这可能会减轻抑郁发作期间经历的总体功能损害的程度。
真阳性率
假阳性率
图2.基于Facebook活动的预测模型的ROC曲线(所有预测者加在一起;蓝色),
以及Noyes等人报告的真阳性率和假阳性率的组合得分
对于抑郁症调查的不同组合(a和b,9个项目的小型国际神经精神病学访谈-主要抑郁发作模块;c和d,15个项目的老年抑郁量表,截止点gt;6)和医疗保险索赔数据中的时间窗口 (a和c,调查前和调查后6个月内;b和d,12个月内)
确诊抑郁症前的月份 抑郁症的第一次记录
图3.在病历中记录抑郁症前,未来抑郁症状态随时间变化的AUC预测准确度
蓝色显示的是用于预测的Facebook数据的6个月时间窗口;蓝点表示这些窗口获得的AUC。错误条表示SE(基于10个交叉验证折叠)。对数趋势线用以引导
抑郁症的语言标志
为了更好地理解哪些特定的语言可以作为判断抑郁症的标志,并支持上述机器学习模型的预测性能,我们选出了有抑郁症诊断的和没有抑郁症诊断的用户,并从文本[2]派生出200个数据驱动的LDA主题的表达方式差异。在图4中,我们展示了在控制年龄、性别和种族时,与未来抑郁状态最相关的10个主题:在多次比较中,有7个主题(共200个)在Plt;0.05的情况下具有独立显著性。
为了完善这种数据驱动的方法,我们还检查了语言查询和字数统计(LIWC)软件(参考文献19,2015)中73个预先指定的词典(词汇表)的使用情况。它们在心理学研究中被广泛使用。九本LIWC词典预测了本杰米尼-霍奇伯格校正后的人口统计学控制显著性水平的未来抑郁状态(表1)。
我们发现抑郁情绪(主题:泪、哭、痛;标准化回归系数beta;=0.15;Plt;0.001)、孤独感(主题:想念、多、宝贝;beta;=0.14;P=0.001)、敌意(话题:怨恨、哼、该死;beta;=0.12;P=0.012)的情绪语言标记物。LIWC负面情绪词典(beta;=0.14,P=0.002;最常使用的词:摇头,该死,怨恨)和悲伤词典(beta;=0.17,Plt;0.001;思念,迷失,孤独)也包含了类似的信息。
我们发现最终被诊断为抑郁症的用户更多地使用第一人称单数代词(LIWC字典:beta;=0.19,Plt;0.001;I,My,Me),这表明他们专注于自我。最近的一项元分析(20)发现,第一人称单数代词是典型抑郁症最有力的语言标记之一(元分析r=0.13)。而本研究观察到的初步纵向研究发现,第一人称单数代词是预测抑郁症的一个标记(21)。虽然有大量证据表明第一人称单数代词的使用与个人写作中的抑郁有关(22),但这项研究将这种联系的证据扩展到了社交媒体的半公开环境中。
在认知上,抑郁被认为与坚持不懈和沉思有关,特别是在自我相关的信息上(23),当指向未来时,这种信息表现为担忧和焦虑(21)。与这些概念一致的是我们观察到语言标记暗示着更多的沉思(主题:心灵,非常,很多;beta;=0.11;P=0.009)和焦虑(LIWC词典:beta;=0.08;P=0.043;惊恐、不安、担忧),尽管没有达到本贾米尼-霍奇伯格校正的显著性阈值。
抑郁症通常在初级保健环境中表现为躯体症状(24,25)。在我们的样本中,我们观察到最终被诊断为抑郁症的用户的文本包含躯体主诉的标记(主题:受伤,头部,糟糕;beta;=0.15;Plt;0.001;LIWC字典,健康:beta;=0.11;P=0.004;生活,疲惫,生病)。我们还观察到医学参考文献的增加(主题:医院、疼痛、手术;beta;=0.2;Plt;0.001),与“没有抑郁症的人比已知有抑郁症的人更频繁地去急诊室”的发现是一致的(26)[3]。
讨论
结果表明,当使用电子病历中的诊断代码来识别抑郁症的诊断时,基于Facebook语言的预测模型在识别抑郁症患者方面的表现类似于筛查调查。抑郁症相关语言标记物的特征是有细微差别的,包括情感(悲伤、抑郁情绪)、人际(敌意、孤独)和认知(自我聚焦、沉思)过程,先前的研究已经证实这些过程与抑郁症的决定因素和后果是一致的。社交媒体的增长和机器学习算法的不断改进表明,基于社交媒体的抑郁症筛查方法可能会变得越来越可行和更准确。
研究之所以选择核查抑郁症,是因为它很普遍,会使人丧失能力,诊断不足,而且是可治疗的。作为医疗发病率和死亡率的主要驱动力,在整个人群中更彻底地诊断和治疗抑郁症是很重要的。抑郁症患者在急性住院治疗后表现出较差的医疗结果,增加了急诊护理资源的利用率,且增加了全因死亡率。(25-28)。通过新的检测手段能
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[590117],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。