JMIRgydF4y2B一个 J医学网络杂志gydF4y2B一个 医学互联网研究杂志gydF4y2B一个 1438 - 8871gydF4y2B一个 卡塔尔世界杯8强波胆分析 加拿大多伦多gydF4y2B一个 v24i8e30634gydF4y2B一个 36044266gydF4y2B一个 10.2196/30634gydF4y2B一个 原始论文gydF4y2B一个 原始论文gydF4y2B一个 识别在线医疗社区中患者决策过程的影响:数据科学方法gydF4y2B一个 KukafkagydF4y2B一个 丽塔gydF4y2B一个 刘gydF4y2B一个 SongxianggydF4y2B一个 LimgydF4y2B一个 吉尔伯特gydF4y2B一个 李gydF4y2B一个 明达gydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0003-0692-7598gydF4y2B一个 史gydF4y2B一个 金gydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0002-4043-4212gydF4y2B一个 程ydF4y2B一个 易gydF4y2B一个 博士学位gydF4y2B一个 2gydF4y2B一个
马丁塔奇曼管理学院gydF4y2B一个 新泽西理工学院gydF4y2B一个 184 - 198年中央大街gydF4y2B一个 新泽西纽瓦克,07102年gydF4y2B一个 美国gydF4y2B一个 1 973 596 6302gydF4y2B一个 yi.chen@njit.edugydF4y2B一个
https://orcid.org/0000-0003-3669-1643gydF4y2B一个
英武计算机学院“,gydF4y2B一个 新泽西理工学院gydF4y2B一个 新泽西纽瓦克gydF4y2B一个 美国gydF4y2B一个 马丁塔奇曼管理学院gydF4y2B一个 新泽西理工学院gydF4y2B一个 新泽西纽瓦克gydF4y2B一个 美国gydF4y2B一个 通讯作者:Yi ChengydF4y2B一个 yi.chen@njit.edugydF4y2B一个 8gydF4y2B一个 2022gydF4y2B一个 31gydF4y2B一个 8gydF4y2B一个 2022gydF4y2B一个 24gydF4y2B一个 8gydF4y2B一个 e30634gydF4y2B一个 3.gydF4y2B一个 6gydF4y2B一个 2021gydF4y2B一个 2gydF4y2B一个 8gydF4y2B一个 2021gydF4y2B一个 5gydF4y2B一个 10gydF4y2B一个 2021gydF4y2B一个 21gydF4y2B一个 3.gydF4y2B一个 2022gydF4y2B一个 ©李明达,石金河,陈毅。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年8月31日。gydF4y2B一个 2022gydF4y2B一个

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。gydF4y2B一个

背景gydF4y2B一个

近年来,越来越多的用户加入在线保健社区以获取信息和寻求支持。病人经常寻求信息和建议来支持他们的医疗保健决策。重要的是要了解患者的决策过程并确定患者从OHCs中受到的影响。gydF4y2B一个

客观的gydF4y2B一个

我们的目标是确定讨论线程中对在决策中寻求帮助的用户有影响的帖子。gydF4y2B一个

方法gydF4y2B一个

我们提出了讨论区帖子影响关系的定义。然后我们开发了一个框架和一个深度学习模型来识别影响关系。我们利用最先进的文本相关性度量方法生成稀疏特征向量来表示文本相关性。我们将问题和动作在帖子中出现的概率建模为密集特征。然后,我们使用深度学习技术将稀疏和密集特征结合起来学习影响关系。gydF4y2B一个

结果gydF4y2B一个

我们在一位受欢迎的癌症幸存者OHC的讨论线程上评估了所提议的技术。实证评价证明了该方法的有效性。gydF4y2B一个

结论gydF4y2B一个

确定OHCs中的影响关系是可行的。利用所提议的技术,确定大量关于一项职业健康问题的讨论产生了影响。这种讨论更有可能影响用户的决策过程,并促使用户参与人力资源安全。对这些讨论的研究有助于提高信息质量、用户粘性和用户体验。gydF4y2B一个

影响关系gydF4y2B一个 决策的线程gydF4y2B一个 在线健康社区gydF4y2B一个 病人接触gydF4y2B一个 深度学习gydF4y2B一个 文本相关性度量gydF4y2B一个
简介gydF4y2B一个 背景gydF4y2B一个

近年来,在线健康社区(OHCs),如癌症幸存者网络(CSN)、MedHelp、DoctorLounge、WebMD和健康公告板留言板,已成为患者利用的最重要资源之一[gydF4y2B一个 1gydF4y2B一个].OHC被定义为一个异步的基于web的病人留言板系统,它包含多个留言板,每个留言板通常关注一种疾病。职业健康中心提供基于网络的渠道,以促进信息交流,促进沟通,并为患者和护理人员提供支持[gydF4y2B一个 2gydF4y2B一个-gydF4y2B一个 4gydF4y2B一个].对于慢性疾病患者了解自己的病情和寻求社会支持尤其有价值[gydF4y2B一个 5gydF4y2B一个,gydF4y2B一个 6gydF4y2B一个].gydF4y2B一个

增强和支持患者作出知情的卫生保健决定是以患者为中心的卫生保健的一个关键组成部分,是社会、经济和技术上的必要条件[gydF4y2B一个 7gydF4y2B一个,gydF4y2B一个 8gydF4y2B一个].许多患者寻求有关OHCs的信息和建议。已有的研究发现,乳腺癌论坛中近一半的帖子[gydF4y2B一个 9gydF4y2B一个与病人的决策有关[gydF4y2B一个 1gydF4y2B一个].研究还表明,患者在作出医疗决策时往往受到网络资源和社交媒体的影响[gydF4y2B一个 10gydF4y2B一个,gydF4y2B一个 11gydF4y2B一个].gydF4y2B一个

目标gydF4y2B一个

本研究的目的是确定与医疗保健决策相关的讨论线程中的帖子的影响关系。具体来说,我们定义了影响关系并确定了影响最初作者的帖子回复,他在OHCs上发布了问题。gydF4y2B一个

这项研究的结果对于卫生保健专业人员帮助患者做出明智的决定是很重要的,原因有几个。首先,分析具有影响力的帖子的写作风格和模式可能有助于解释它们具有影响力的原因,并为医疗保健专业人员与患者的有效沟通提供见解。第二,如果有影响力的岗位提供的信息不准确,就会误导患者。要提高影响力的质量,就必须检查这些职位的信息质量。此外,有问题但没有收到任何有影响的答复的患者可能需要进一步的帮助。gydF4y2B一个

文献综述gydF4y2B一个

虽然对确定职位的影响关系的研究有限,但对职业热含量分析进行了大量研究。已有几项研究分析了论坛用户回复之间的互惠模式[gydF4y2B一个 12gydF4y2B一个-gydF4y2B一个 14gydF4y2B一个].也有人在分析帖子浏览量和帖子回复之间的模式[gydF4y2B一个 15gydF4y2B一个].已经进行了许多关于确定社区中有影响力的用户的研究[gydF4y2B一个 16gydF4y2B一个-gydF4y2B一个 20.gydF4y2B一个].在这些应用程序中,一篇文章、博客或tweet通常表达了作者的观点,而回复被认为是受原文章观点影响的一种迹象。也就是说,回复关系被视为影响关系。重点是根据文章的活跃度来判断一个作者的影响力[gydF4y2B一个 21gydF4y2B一个]和社交网络功能[gydF4y2B一个 17gydF4y2B一个,gydF4y2B一个 18gydF4y2B一个,例如类似pagerank的算法或聚类算法。gydF4y2B一个

寻找论坛帖子之间的影响力关系不同于寻找有影响力的用户,需要不同的技术。在OHC中,一个线程的最初作者通常表达的是一个问题,而不是一个观点。当对问题的答复影响到最初的作者时,就会产生影响。目前只有两项研究考虑了回复者对原作者的影响[gydF4y2B一个 21gydF4y2B一个,gydF4y2B一个 22gydF4y2B一个].当最初作者的情绪与回复者的情绪相似时,这种影响就会被识别出来。然而,这个定义可能并不准确。gydF4y2B一个

让我们看一个与病人决策相关的讨论线程的例子,如图所示gydF4y2B一个 图1gydF4y2B一个.一位OHC用户在帖子中为她母亲的治疗计划初始化了一个线程,询问是否在手术前进行化疗的建议gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 .gydF4y2B一个

讨论线程的示例。gydF4y2B一个

在gydF4y2B一个 图1gydF4y2B一个A,一位用户在帖子中安慰了她gydF4y2B一个 pgydF4y2B一个B1gydF4y2B一个 .答复的内容并不丰富。尽管最初的作者表达了对文章作者的感谢gydF4y2B一个 pgydF4y2B一个B1gydF4y2B一个 后,情绪转为积极gydF4y2B一个 pgydF4y2B一个C1gydF4y2B一个 在美国,她不受邮件的影响gydF4y2B一个 pgydF4y2B一个B1gydF4y2B一个 .事实上,研究表明,75%至85%的CSN论坛参与者通过与其他社区成员在网络上的互动,将他们的情绪向积极的方向转变[gydF4y2B一个 23gydF4y2B一个].情绪的变化不一定表明你受到了影响。gydF4y2B一个

相比之下,在gydF4y2B一个 图1gydF4y2B一个B,一位用户分享了她在类似情况下的经验,建议手术前进行化疗gydF4y2B一个 pgydF4y2B一个B2gydF4y2B一个 .最初的作者表达了她的感激之情,并表示她将在确定她母亲的治疗方案时考虑这一建议(斜体的句子)gydF4y2B一个 pgydF4y2B一个C2gydF4y2B一个 这表明她受到了影响。gydF4y2B一个

贡献gydF4y2B一个

我们不考虑情绪的变化,而是建议使用相关回答的问题或未来行动作为受影响的指标,如前面的例子所示。在确定影响关系方面有两个主要挑战。首先,我们需要定义帖子的影响力关系。我们检查了帖子内容的语义,以定义影响关系。与有影响力的用户不同,有影响力的用户是由现有工作中的网络特征定义的[gydF4y2B一个 16gydF4y2B一个-gydF4y2B一个 20.gydF4y2B一个],文本内容是判断帖子是否有影响力的关键。其次,很难确定影响关系。与典型的文本分类问题不同,影响关系涉及多个带有回复关系的帖子,而不是单个文本段落。此外,影响力是一个抽象的概念。同时考虑到内容和回复关系,提取相关特征以获取影响模式是一项挑战。gydF4y2B一个

本研究为确定与患者决策相关的OHCs讨论线索中的影响关系做出了新的贡献。具体而言,(1)根据岗位内容的语义定义了岗位之间的影响关系;(2)提出了一种提取并结合稀疏和密集特征的可扩展深度学习模型,用于识别人力资源含量决策线程中的影响关系;(3)所提模型在实证评价中识别影响关系方面取得了良好的效果。gydF4y2B一个

方法gydF4y2B一个

在本节中,我们首先对热含量数据建模,并在讨论线程中定义影响关系。然后,我们提出了一个基于深度学习的模型来识别影响关系。gydF4y2B一个

问题定义gydF4y2B一个 讨论线程的定义gydF4y2B一个

图2gydF4y2B一个概述了热含量数据结构。我们将OHC建模为一组讨论线程gydF4y2B一个 TgydF4y2B一个= {gydF4y2B一个 tgydF4y2B一个1gydF4y2B一个tgydF4y2B一个2gydF4y2B一个、……tgydF4y2B一个ngydF4y2B一个 }。每个线程gydF4y2B一个 tgydF4y2B一个我gydF4y2B一个 是由一组职位和一个功能组成的吗gydF4y2B一个 RgydF4y2B一个它表示应答关系。例如,gydF4y2B一个 图2gydF4y2B一个说明了一个包含5个帖子的线程{gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个pgydF4y2B一个B”gydF4y2B一个pgydF4y2B一个C 'gydF4y2B一个 }。其中一个回复关系,gydF4y2B一个 RgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ) =gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,表示该职位gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 回复帖子gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 .每个帖子gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 由一系列的句子组成gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 = {gydF4y2B一个 年代gydF4y2B一个1gydF4y2B一个 ,gydF4y2B一个 年代gydF4y2B一个2gydF4y2B一个 、……gydF4y2B一个 年代gydF4y2B一个lgydF4y2B一个 }。每个帖子都有一个作者。我们使用函数来表示作者关系gydF4y2B一个 UgydF4y2B一个.gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 )代表文章的作者gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 .注意,一个帖子只有一个作者;然而,一个作者可以在一个线程中写≥0篇文章。我们使用gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 呈现一个线程的第一个帖子,并将其命名为gydF4y2B一个 最初的发布gydF4y2B一个.的作者gydF4y2B一个 最初的发布gydF4y2B一个,gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ),称为gydF4y2B一个 最初的作者gydF4y2B一个的线程。gydF4y2B一个

在线健康社区的数据结构。gydF4y2B一个

现有的工作(gydF4y2B一个 1gydF4y2B一个]研究了OHCs中的线程讨论,并确定了线程的一个子集与gydF4y2B一个 病人的决策gydF4y2B一个.这种帖子的特点是在最初的帖子中提出问题,然后在回复中给出选择的建议。已开发出技术来确定OHCs中的决策线索。gydF4y2B一个

在本文中,我们研究如何识别决策线程的初始作者受回复帖子影响的情况。注意,我们的研究适用于任何与决策相关的线程讨论。决策线程的定义和识别可使用现有工作中开发的方法进行处理[gydF4y2B一个 1gydF4y2B一个或其他方法。在本文的其余部分,我们使用gydF4y2B一个 线程gydF4y2B一个为了简单起见,参考决策线程。定义的影响关系可能不适用于与决策无关的讨论线程,例如用于随意交流的讨论线程或提供社会支持的经验分享线程。gydF4y2B一个

人际关系的定义gydF4y2B一个 概述gydF4y2B一个

在介绍定义之前gydF4y2B一个 影响人际关系gydF4y2B一个,我们首先介绍关系。关系定义在具有回复关系的线程中的三个帖子上:初始帖子、对初始帖子的回复和初始作者的后续回复。gydF4y2B一个

定义1(关系)gydF4y2B一个

我们定义三个职位之间的关系gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ,在一个线程中gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ),后gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 线程的初始帖子是post吗gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 回复gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,后gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 回复gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 的作者gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 都是同一个人。也就是说,gydF4y2B一个 RgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ) =gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个, RgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ) =gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个,gydF4y2B一个而且gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ) =gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ).gydF4y2B一个

我们使用gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 )来表示之间的关系gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个,gydF4y2B一个而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .注意,在一个线程中有许多这样的关系,我们考虑了所有这样的三元组。例如,gydF4y2B一个 图2gydF4y2B一个显示有两个关系的线程,gydF4y2B一个 rgydF4y2B一个1gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 ),gydF4y2B一个 rgydF4y2B一个2gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B”gydF4y2B一个pgydF4y2B一个C 'gydF4y2B一个 ).gydF4y2B一个

此外,请注意现有的识别有影响力用户的工作[gydF4y2B一个 16gydF4y2B一个-gydF4y2B一个 20.gydF4y2B一个]不考虑帖子三元组之间的关系,只考虑两个帖子之间的回复关系。gydF4y2B一个

影响关系的定义gydF4y2B一个 直觉gydF4y2B一个

现在,我们讨论如何定义gydF4y2B一个 影响人际关系gydF4y2B一个关系(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 ),后gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 对原作者有影响吗gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ).gydF4y2B一个

首先,直觉上,如果postgydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 影响最初的作者gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ),那么这3篇文章的内容一定是相关的。gydF4y2B一个

第二,我们参考了的定义gydF4y2B一个 影响gydF4y2B一个在《韦氏大词典》(gydF4y2B一个 24gydF4y2B一个——“通过间接或无形的手段影响或改变”——以及……的反应gydF4y2B一个 被影响了gydF4y2B一个是gydF4y2B一个 影响gydF4y2B一个而不是被说服。如果最初的作者考虑了帖子中给出的建议gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 即使她最终不接受这个建议,她也会被认为受到了邮件的影响gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个.gydF4y2B一个在这个定义的基础上,我们观察到最初的作者,gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ),受到gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 .gydF4y2B一个

一种被影响的观察是,最初的作者可能会问问题gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 根据文章中的建议gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 .好奇心是学习的动力,对决策也有影响。gydF4y2B一个 25gydF4y2B一个].现有的一项研究[gydF4y2B一个 26gydF4y2B一个]使用统计上的大样本学习论坛帖子来调查学生参与论坛是否会受到影响。他们观察到,受他人有趣答案影响的学生更有可能提出后续问题。这表明问更多的问题是受影响的迹象。同样的模式也存在于OHCs中。让我们看看中的例子gydF4y2B一个 图1gydF4y2B一个C.最初的作者表达了对脱发的担忧gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 .另一位用户在帖子中回复道gydF4y2B一个 pgydF4y2B一个B3gydF4y2B一个 建议使用假发。最初的作者随后在帖子中回复gydF4y2B一个 pgydF4y2B一个C3gydF4y2B一个 用问题(斜体的句子)来了解更多关于帖子中给出的建议的细节gydF4y2B一个 pgydF4y2B一个B3gydF4y2B一个 .这些问题表明,最初的作者在考虑帖子中给出的建议gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ;那就是,被影响。gydF4y2B一个

第二个迹象表明,最初的作者受到了一篇文章的影响gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 她是在邮件中表达了采取行动的意图吗gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .Adjei等人[gydF4y2B一个 27gydF4y2B一个的研究发现,基于网络的品牌社区中的成员间交流极大地影响了成员未来的购买行为。同样,在OHCs中通过讨论线程进行的交流也可能影响初始作者未来的行动。让我们看看中的例子gydF4y2B一个 图1gydF4y2B一个B。关于治疗的问题gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,一位论坛用户分享了她的经历,并在帖子中讨论了这种待遇gydF4y2B一个 pgydF4y2B一个B2gydF4y2B一个 .然后,最初的作者用计划好的行动(斜体的句子)在gydF4y2B一个 pgydF4y2B一个C2gydF4y2B一个 .基于线程中的通信的未来行动意图是影响关系的指示器。gydF4y2B一个

在这些观察的基础上,我们在下一节中定义决策线程中的影响关系。gydF4y2B一个

定义2(影响关系)gydF4y2B一个

一段关系gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 )被认为是影响关系,也就是说,gydF4y2B一个 UgydF4y2B一个(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 )受gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 -当且仅当满足以下条件gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 与职位相关gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 (2)内容gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 与职位相关gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 , (3)gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 包含问题或指示未来的行动。gydF4y2B一个

为了识别影响关系,我们将其建模为一个分类任务。给定一组关系gydF4y2B一个 RgydF4y2B一个= {gydF4y2B一个 rgydF4y2B一个1gydF4y2B一个, rgydF4y2B一个2gydF4y2B一个、……rgydF4y2B一个ngydF4y2B一个 },对于每个关系gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 ,我们预测它的标签是1或−1,其中标签1表明gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 影响关系和标签-1是否表明了这一点gydF4y2B一个 rgydF4y2B一个我gydF4y2B一个 不是影响关系。目标是从已知关系的标签中学习一个模型,并预测未标记关系的标签。gydF4y2B一个

模型设计gydF4y2B一个 概述gydF4y2B一个

在本节中,我们提出了确定OHCs决策线程中的影响关系的方法。gydF4y2B一个 图3gydF4y2B一个给出了该方法的框架。gydF4y2B一个

给定一组讨论线程作为输入,我们首先使用关系提取模块提取三元关系。然后分别使用文本相关性度量模块、问题概率计算模块和动作概率计算模块计算文本相关性特征、问题概率特征和动作概率特征。最后,利用特征组合模块中的深度学习模型对所有特征进行组合,生成关系为影响关系的概率。gydF4y2B一个

影响关系识别工作流程。gydF4y2B一个

关系抽取模块gydF4y2B一个

在本节中,我们将介绍关系提取模块,该模块提取定义1中定义的所有关系。gydF4y2B一个

在第一步关系提取中,我们基于html文件的缩进格式构建了回复树结构。对于每个相邻的帖子对,之前发布的帖子被视为后一个帖子的父帖子。一个职位和初始职位之间的祖先-后裔距离用制表符的数量表示。线程的回复结构说明在gydF4y2B一个 图2gydF4y2B一个.每个帖子都是线程树中的一个节点,每条边代表一个回复关系。线程树的根是初始的帖子(即,gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 )在定义1。gydF4y2B一个

现有工作观察到,在一些论坛中,讨论线程中的回复结构可能不是完全可用的,并提出了构建完整回复结构的技术[gydF4y2B一个 28gydF4y2B一个].实验中所使用的ohc具有完整的应答结构。如果其他论坛需要,可以利用现有的技术。gydF4y2B一个

然后我们导航线程树以提取所有关系三元组,如定义1中所定义的那样。每个三元组都从初始的帖子开始,接着是另一个作者对初始帖子的回复,然后是初始作者的后续回复,所有这些都位于线程树中的同一路径上。例如,gydF4y2B一个 rgydF4y2B一个1gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 ),gydF4y2B一个 rgydF4y2B一个2gydF4y2B一个 = (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B”gydF4y2B一个pgydF4y2B一个C 'gydF4y2B一个 中的线程树中的2个关系gydF4y2B一个 图2gydF4y2B一个.gydF4y2B一个

文本相关性测量模块gydF4y2B一个

文本相关性度量模块使用0到1之间的相关性评分来度量两个帖子的内容相关性或文本语义相似性。gydF4y2B一个

文献中主要有两种基于深度学习的方法来衡量文本相关性。第一类方法提取2个输入文本的内容特征向量,然后将其组合起来进行预测,如深度结构化语义模型(Deep Structured Semantic Models, DSSM) [gydF4y2B一个 29gydF4y2B一个],卷积DSSM [gydF4y2B一个 30.gydF4y2B一个建筑- i (ARC-I) [gydF4y2B一个 31gydF4y2B一个].这种方法的直觉是突出显示原始文本的重要信息,以便在特征组合阶段之前删除不相关的内容。然而,这类方法的缺点是它有丢失细节的风险[gydF4y2B一个 32gydF4y2B一个].gydF4y2B一个

第二种类型首先生成词级相关性,然后使用神经网络学习内容级相关性的分层交互模式,如DeepMatch [gydF4y2B一个 33gydF4y2B一个,建筑- ii (ARC-II) [gydF4y2B一个 31gydF4y2B一个]和MatchPyramid [gydF4y2B一个 34gydF4y2B一个].其动机是,做好相关性判断需要考虑文本相关性度量过程中的相互作用,从单词之间的相互作用到短语中的模式,再到整个句子中的模式[gydF4y2B一个 34gydF4y2B一个].然而,第二种类型的训练过程比第一种类型要昂贵得多。gydF4y2B一个

我们在实验中评估了两种测量文本相关性的方法。在评价中,我们选择了两种具有代表性的方法作为文本相关性度量模块。对于第一种类型,我们选择ARC-I [gydF4y2B一个 31gydF4y2B一个],该算法使用多层感知器组合相关特征向量。它表现出比DSSM更好的性能[gydF4y2B一个 29gydF4y2B一个]和卷积DSSM [gydF4y2B一个 30.gydF4y2B一个],两者都使用余弦相似度[gydF4y2B一个 34gydF4y2B一个].我们选择了MatchPyramid [gydF4y2B一个 34gydF4y2B一个]表示第二类方法,因为它表现出比其他两种方法更好的性能(DeepMatch [gydF4y2B一个 33gydF4y2B一个]和ARC-II [gydF4y2B一个 31gydF4y2B一个])在多个数据集上的实验[gydF4y2B一个 34gydF4y2B一个].gydF4y2B一个

我们进一步提出从变压器(BERT)改编双向编码器表示[gydF4y2B一个 35gydF4y2B一个]作为ARC-I和MatchPyramid模型中的嵌入层。BERT是一种在许多自然语言理解任务中用于单词表示的最先进的嵌入方法,在BookCorpus和英文Wikipedia上进行了培训。我们考虑BERT(在维基百科上训练)和word2vec(在训练数据集上训练)作为ARC-I和MatchPyramid的嵌入方法。对文本相关性度量模块的不同变体进行了评估gydF4y2B一个 文本相关性评价gydF4y2B一个部分。gydF4y2B一个

问题概率计算模块gydF4y2B一个

我们现在讨论如何使用问题概率计算模块计算包含问题的帖子的概率。gydF4y2B一个

在论坛中识别问题句有两种方法:基于规则的方法和基于学习的方法。在基于规则的方法中,问号和5W1H单词(what, who, when, where, why, how)被用来识别疑问句[gydF4y2B一个 36gydF4y2B一个].一种基于学习的方法使用顺序问题模式在标记数据上训练二进制分类器[gydF4y2B一个 37gydF4y2B一个-gydF4y2B一个 40gydF4y2B一个].刘和詹森[gydF4y2B一个 37gydF4y2B一个)使用问号从新浪微博上提取问题帖子。在Ranganath等人的研究[gydF4y2B一个 38gydF4y2B一个,gydF4y2B一个 39gydF4y2B一个,提出了通过建模用户发布反问的动机来识别反问的框架。Ojokoh等人的研究[gydF4y2B一个 40gydF4y2B一个,基于带有词性标签特征的naïve贝叶斯分类的最大概率值来识别来自ResearchGate的问题。gydF4y2B一个

基于规则的方法和基于学习的方法都可以实现出色的性能。一项研究表明,基于规则的方法可以优于复杂的基于学习的方法[gydF4y2B一个 36gydF4y2B一个].因此,我们采用了基于规则的方法[gydF4y2B一个 36gydF4y2B一个],以识别贴子中存在的问题。总共考虑了两种类型的规则:问号和5W1H单词。我们对OHCs的这种方法进行了调整。由于问号是问题最显著的标志,我们给带有问号的句子一个更高的置信度分数。我们还对5W1H词设置了一些约束条件来模拟问题句的模式。首先,5W1H必须出现在句子的开头。其次,在原词的基础上添加助词,以获得更具体的模式。例如,我们考虑gydF4y2Ba 是什么gydF4y2B一个,gydF4y2B一个 是什么gydF4y2B一个,gydF4y2B一个 什么gydF4y2B一个,gydF4y2B一个 是什么gydF4y2B一个而不是gydF4y2B一个 什么gydF4y2B一个.gydF4y2B一个

问题后每句话的概率在一个帖子中gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 计算时,用最大概率作为后gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 包含至少一个问题的,记为gydF4y2B一个 问gydF4y2B一个(gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 ).gydF4y2B一个

动作概率计算模块gydF4y2B一个

本节介绍了动作概率计算模块,该模块生成了一个帖子中动作出现的概率。gydF4y2B一个

未来动作的指示可以通过动词和适当的句子时态来捕捉。自然语言工具包(NLTK) [gydF4y2B一个 41gydF4y2B一个tagger模块定义了一个标准接口,用于用补充信息(如词性或WordNet synset标记)来扩充文本的每个标记,并为该接口提供了几种不同的实现。我们利用NLTK标记器模块,通过检查带有将来时动词标记的单词的存在,来评估包含将来动作的帖子的可能性(例如,gydF4y2B一个 将考虑gydF4y2B一个在gydF4y2B一个 图1gydF4y2B一个B)或情态助动词标签(例如,gydF4y2B一个 可以gydF4y2B一个,gydF4y2B一个 可以gydF4y2B一个,gydF4y2B一个 五月gydF4y2B一个,gydF4y2B一个 必须gydF4y2B一个).为了计算由于论坛用户的拼写错误或非正式写作而无法识别将来时态的情况,当规则未能识别未来动作时,我们将未来动作的概率设置为0.5。公式1为生成岗位动作概率的计算公式gydF4y2B一个 pgydF4y2B一个我gydF4y2B一个 .gydF4y2B一个

注意,我们没有在动作概率计算模块中考虑否定。例如,in postgydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ,第一作者不同意文中提出的建议gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 决定做点不一样的事。对于这些情况,整体意义gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 将是相反的,因此将由文本相关性度量模块中生成的相关向量捕获。因此,我们在这一阶段不考虑否定,以避免重复计算。gydF4y2B一个

功能模块组合gydF4y2B一个 概述gydF4y2B一个

指的是gydF4y2B一个 图4gydF4y2B一个,对文本相关性度量模块进行计算gydF4y2B一个 PgydF4y2B一个ABgydF4y2B一个 -相关性得分gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ——gydF4y2B一个 PgydF4y2B一个公元前gydF4y2B一个 -相关性得分gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .问题概率计算模块和动作概率计算模块对问题概率进行计算gydF4y2B一个 问gydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 )或者gydF4y2B一个 问gydF4y2B一个简而言之,就是行动概率gydF4y2B一个 一个gydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 )或者gydF4y2B一个 一个gydF4y2B一个简而言之,基于文本gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .gydF4y2B一个

现在我们讨论基于这些特征度量影响得分的特征组合模块。我们讨论了两种替代方法:gydF4y2B一个 一个基线的方法gydF4y2B一个而且gydF4y2B一个 深度学习模型gydF4y2B一个.gydF4y2B一个

特性组合模块的体系结构。gydF4y2B一个

基线的方法gydF4y2B一个

回顾一下,根据定义2,影响力关系的存在需要职位之间的相关性gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 和发布gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ,帖子之间的相关性gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 和发布gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ,以及在帖子中出现问题或行动gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .我们从一个直观的方法开始,根据使用方程2的定义来检测影响关系。gydF4y2B一个

PgydF4y2B一个基线gydF4y2B一个 =gydF4y2B一个 PgydF4y2B一个ABgydF4y2B一个 ×gydF4y2B一个 PgydF4y2B一个公元前gydF4y2B一个 ×马克斯(gydF4y2B一个 问gydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ),gydF4y2B一个 一个gydF4y2B一个(gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 )]gydF4y2B一个 (2)gydF4y2B一个

我们将每个组件的阈值设置为0.5、0.5和0.9。gydF4y2B一个

深度学习的方法gydF4y2B一个

我们进一步提出了一个深度学习模型,该模型结合了文本相关性、问题出现的可能性和未来行动出现的可能性来识别影响关系。该模型的体系结构显示在gydF4y2B一个 图4gydF4y2B一个.gydF4y2B一个

相比gydF4y2B一个 基线gydF4y2B一个方法,使用深度学习模型有三个主要好处。首先,使用基于规则的方法(如gydF4y2B一个 基线gydF4y2B一个的方法。对一个数据集有效的阈值可能并不适合另一个数据集。基于规则的方法和深度学习模型对于不同的数据集都需要不同的阈值。基于规则的方法需要对每个数据集进行手动参数调优。相比之下,深度学习方法从基本事实中学习阈值,因此可以在最少的人为干预下轻松适应新的数据集[gydF4y2B一个 42gydF4y2B一个].第二,问题和动作特征可能与关联特征有不同的交互作用。我们注意到,问题往往是相关的,但行动不一定。人们通常会在帖子中表达感谢gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 有时甚至会提到与帖子完全无关的行为gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ,例如旅行或购物的计划。与存在问题相比,在存在行动时考虑相关性更重要。然而,在gydF4y2B一个 基线gydF4y2B一个方法中,问题特征和动作特征在与关联特征结合之前被合并,导致重要信息的丢失。此外,我们使用相关向量作为深度学习模型的输入,计算影响得分。相比gydF4y2B一个 基线gydF4y2B一个该方法以相关性分数作为衡量影响程度的输入,相关性向量提供了更丰富的信息。当讨论中涉及到几个主题时,这尤其有用。在将相关性特征与问题或行动特征相结合的阶段中,还利用了相关性信息。gydF4y2B一个

让gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 之间的关联向量gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 之间的关联向量gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .我们生成的gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个, VgydF4y2B一个公元前gydF4y2B一个 从gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 和计算gydF4y2B一个 问gydF4y2B一个而且gydF4y2B一个 一个gydF4y2B一个从gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 .gydF4y2B一个

然后这些特征被连接起来。问题或将来的行动gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 一定是与内容有关的吗gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 .因此,我们结合gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 而且gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 与gydF4y2B一个 问gydF4y2B一个而且gydF4y2B一个 一个gydF4y2B一个使用以下两个运算符之一:(1)gydF4y2B一个 猫gydF4y2B一个(将每个关联向量与问题或行动概率连接起来)和(2)gydF4y2B一个 点gydF4y2B一个(每个相关向量乘以问题或行动概率)。gydF4y2B一个

这两个操作符在连接特征时有两个主要的区别:gydF4y2B一个 猫gydF4y2B一个而且gydF4y2B一个 点gydF4y2B一个.首先,gydF4y2B一个 点gydF4y2B一个确保gydF4y2B一个 问gydF4y2B一个而且gydF4y2B一个 一个gydF4y2B一个影响关联向量中的每个维度,而gydF4y2B一个 猫gydF4y2B一个不能保证这一点,因为一些神经元或节点被删除了。问题或动作与文本相关性之间的一些交互作用可能会被忽略gydF4y2B一个 猫gydF4y2B一个操作符。第二,培训过程gydF4y2B一个 猫gydF4y2B一个比的贵吗gydF4y2B一个 点gydF4y2B一个因为,对于每个密集层1到4,都有一个额外的维度gydF4y2B一个 猫gydF4y2B一个相比之下gydF4y2B一个 点gydF4y2B一个.gydF4y2B一个

在gydF4y2B一个 图4gydF4y2B一个,我们使用⊗来表示组合操作符,组合操作符可以是gydF4y2B一个 猫gydF4y2B一个或gydF4y2B一个 点gydF4y2B一个.组合步骤产生4个特征向量:gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 ⊗gydF4y2B一个 问gydF4y2B一个,gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 ⊗gydF4y2B一个 一个gydF4y2B一个,gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 ⊗gydF4y2B一个 问gydF4y2B一个,gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 ⊗gydF4y2B一个 一个gydF4y2B一个.为了从这些组合的特征向量中提取关键信息,使用4个密集(完全连接)层来填充汇总的特征向量(gydF4y2B一个 年代gydF4y2B一个1gydF4y2B一个,年代gydF4y2B一个2gydF4y2B一个,年代gydF4y2B一个3.gydF4y2B一个,年代gydF4y2B一个4gydF4y2B一个 ).这4个总结的特征向量的拼接经过2个密集层。第一个用于进一步合并总结的特征向量。第二种方法旨在生成标签上的概率分布。避免渐变消失和爆炸[gydF4y2B一个 43gydF4y2B一个,我们选择了gydF4y2B一个 线性整流函数(Rectified Linear Unit)gydF4y2B一个函数作为所有密集层的激活函数,除了输出层,输出层使用gydF4y2B一个 softmaxgydF4y2B一个函数来填充概率。gydF4y2B一个

我们使用公式3中定义的二元交叉熵损失函数来训练模型,使基础真理的概率分布与预测得分的概率分布之间的距离最小。gydF4y2B一个

在哪里gydF4y2B一个 ygydF4y2B一个我gydF4y2B一个 是地面真理的标签吗gydF4y2B一个 我gydF4y2B一个训练样本和gydF4y2B一个 年代gydF4y2B一个我gydF4y2B一个 是模型预测的分数。亚当优化器[gydF4y2B一个 43gydF4y2B一个]被用于优化,因为与常规的带动量随机梯度下降相比,它在处理稀疏特征方面具有更快的收敛速度。gydF4y2B一个

伦理批准gydF4y2B一个

所有材料都来自匿名的开源数据。因此,不需要伦理批准。gydF4y2B一个

结果gydF4y2B一个 实验设置与评价指标gydF4y2B一个

我们实现了一个基于讨论线程的影响关系识别原型系统。用于评估的原型系统和数据集可在GitHub公开获取[gydF4y2B一个 44gydF4y2B一个].gydF4y2B一个

为了进行实证评估,我们收集了CSN乳腺癌论坛上公开的25,208篇文章[gydF4y2B一个 9gydF4y2B一个].网页由我们利用Spider crawler库开发的网络爬虫收集和处理。gydF4y2B一个 45gydF4y2B一个].共有32.1万个帖子,190万句话。我们采用Li等人提出的分类器[gydF4y2B一个 1gydF4y2B一个],以确定与患者决策相关的线程,得到11,815个(46.87%)这样的线程。注意,还可以插入用于分类决策线程的其他模型。gydF4y2B一个

然后使用关系提取模块从决策线程中提取关系,得到9053个关系。我们随机选取了其中的853个(9.42%)进行标记。共有4名博士生参与了手工标注工作。所有的关系三元组和post对首先被独立标记。如果有分歧,经过讨论就能达成共识。共有261个关系被标记为影响关系。回想一下,根据定义1,每个关系都被表示为三元关系(gydF4y2Ba pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 ).我们还标记是否发帖gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 是有关(即gydF4y2B一个 PgydF4y2B一个ABgydF4y2B一个 )及职位是否gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 是有关(即gydF4y2B一个 PgydF4y2B一个公元前gydF4y2B一个 ).我们观察到一些回复的内容只表达了安慰或愿望。虽然它们表达了对最初作者的状况的关心,看起来也很相关,但它们是通用的。经过讨论,我们达成共识,当初始帖子和回复帖子使用相似的医学术语(如gydF4y2B一个 化疗gydF4y2B一个而且gydF4y2B一个 化疗gydF4y2B一个),我们会把它们标记为相关的。所有1706个职位配对(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个BgydF4y2B一个 )和(gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个pgydF4y2B一个CgydF4y2B一个 )对853对关系进行了标记。1706对中,相关配对1210对(70.93%),不相关配对496对(29.07%)。我们将关系集分为训练集(90%)和测试集(10%)。上述训练集和测试集中的岗位对分别用于文本相关性训练和测试。gydF4y2B一个

用于评价的指标包括精度、召回率、FgydF4y2B一个1gydF4y2B一个评分、准确性、受试者工作特征曲线下面积(ROC AUC)和精度-召回曲线下面积(PR AUC)。他们从不同的方面来评估一个系统的有效性:(1)gydF4y2B一个 精度gydF4y2B一个,又称正预测值,是检索到的实例中相关实例的比例;(2)gydF4y2B一个 回忆gydF4y2B一个,也称为灵敏度,是在所有相关实例中检索到的相关实例的百分比;(3)gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个通过计算精度和召回率的调和平均值来衡量模型的性能,如下式所示:gydF4y2B一个 (4)gydF4y2B一个;(4)gydF4y2B一个 精度gydF4y2B一个是一种常用的二元分类问题的评价指标,定义为预测准确率占预测总数的百分比;(5)gydF4y2B一个 中华民国AUCgydF4y2B一个是二元分类问题的常用评估指标,通过绘制在不同阈值设置下的真阳性率与假阳性率;(6)gydF4y2B一个 公关AUCgydF4y2B一个通常用于在具有不平衡标签的数据集上评估模型的性能。gydF4y2B一个

文本相关性评价gydF4y2B一个

表1gydF4y2B一个给出了文本相关性度量模块的分类结果。总共进行了两次观察。首先观察到BERT模型的查全率较高,查全率较低,而在OHC数据上训练词嵌入向量的模型则获得了查全率和查全率的平衡。这些结果有两个原因。首先,OHC数据是领域敏感的,可以从领域特定的单词表示中受益。第二,BERT转换器倾向于错误地将单词连接到相邻的句子中。在文本相关性度量模块中,由于影响关系识别的准确性依赖于相关性分类的精度,因此精度比查全率更为重要。因此,我们在接下来的实验中使用对OHC数据训练的词向量代替BERT。gydF4y2Ba

文本相关性测量模块结果。gydF4y2B一个

精度gydF4y2B一个 回忆gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个 精度gydF4y2B一个 中华民国AUCgydF4y2B一个一个gydF4y2B一个 公关AUCgydF4y2B一个bgydF4y2B一个
MatchPyramid与伯特gydF4y2B一个cgydF4y2B一个在维基百科上(训练)gydF4y2B一个 0.578gydF4y2B一个 0.992gydF4y2B一个dgydF4y2B一个 0.730gydF4y2B一个 0.512gydF4y2B一个 0.502gydF4y2B一个 0.583gydF4y2B一个
使用word2vec匹配金字塔(在训练数据集上训练)gydF4y2B一个 0.781gydF4y2B一个 0.820gydF4y2B一个dgydF4y2B一个 0.806gydF4y2B一个 0.692gydF4y2B一个 0.763gydF4y2B一个 0.854gydF4y2B一个
ARC-IgydF4y2B一个egydF4y2B一个与BERT(接受过维基百科训练)gydF4y2B一个 0.523gydF4y2B一个 0.890gydF4y2B一个dgydF4y2B一个 0.659gydF4y2B一个 0.503gydF4y2B一个 0.493gydF4y2B一个 0.554gydF4y2B一个
ARC-I和word2vec(在训练数据集上训练)gydF4y2B一个 0.832gydF4y2B一个 0.747gydF4y2B一个dgydF4y2B一个 0.785gydF4y2B一个 0.784gydF4y2B一个 0.848gydF4y2B一个 0.903gydF4y2B一个

一个gydF4y2B一个ROC AUC:受试者工作特征曲线下的面积。gydF4y2B一个

bgydF4y2B一个PR AUC:精确召回曲线下的面积。gydF4y2B一个

cgydF4y2B一个来自变压器的双向编码器表示。gydF4y2B一个

dgydF4y2B一个的gydF4y2B一个 PgydF4y2B一个值在统计上显著gydF4y2B一个 PgydF4y2B一个= . 05。gydF4y2B一个

egydF4y2B一个ARC-I:建筑i。gydF4y2B一个

第二个观察结果是,使用词向量嵌入,ARC-I在大多数评价指标上取得了比MatchPyramid更好的性能。在ARC-I模型中,每个输入文本经过一个嵌入层、一个卷积层和一个最大池化层,然后将提取的特征向量连接在一起作为输入到一个完全连接层,该层计算预测的相关性得分。MatchPyramid首先填充局部词相关性矩阵。矩阵的每个单元格表示输入文本中单词的词嵌入向量的点积。然后使用卷积神经网络提取这些相互作用的模式[gydF4y2B一个 46gydF4y2B一个].因此,ARC-I专注于根据整个文本的含义检查相关性,而MatchPyramid专注于根据局部词的相似度总结重要的相关性特征。对于OHC数据集,发帖时间相对较长,往往包含有噪声的信息;因此,考虑整个帖子的意思比关注相邻的单词更重要。这就是为什么在我们的评估中ARC-I的性能优于MatchPyramid。我们还观察到gydF4y2B一个 ARC-IgydF4y2B一个与word2vec表现gydF4y2B一个 MatchPyramidgydF4y2B一个 与word2vecgydF4y2B一个在这两个gydF4y2B一个 中华民国AUCgydF4y2B一个而且gydF4y2B一个 公关AUCgydF4y2B一个但有一个低劣的gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个.请注意,FgydF4y2B一个1gydF4y2B一个ROC AUC和PR AUC则是对具有不同召回阈值的所有样本的精度进行累积。这表明,平均性能gydF4y2B一个 MatchPyramidgydF4y2B一个 与word2vecgydF4y2B一个是比较好的,但整体表现呢gydF4y2B一个 ARC-IgydF4y2B一个 与word2vecgydF4y2B一个是更好的。gydF4y2B一个

问题与行动概率评估gydF4y2B一个

对问题概率计算模块和动作概率计算模块进行了评价。性能表示为gydF4y2B一个 表2gydF4y2B一个.在问题识别方面取得了良好的性能。在未来的行动识别方面,回忆度得分很高,但精确度不高。以下是一些被分类为包含未来行动但实际上没有行动意图的帖子的例子:gydF4y2B一个 我要告诉你,虽然我讨厌我的硅胶gydF4y2B一个或gydF4y2B一个 我会担心的gydF4y2B一个.这些句子有将来时的动词,但这些动词只传达意见或感觉,而不是在医疗保健方面采取行动。我们计划在未来的工作中,通过训练动作句子模型来改进动作检测。gydF4y2B一个

回想一下gydF4y2B一个 深度学习gydF4y2B一个方法概率、问题概率和动作概率被认为是输入特征,而不是对它们的存在有严格的要求。我们根据它们的存在对测试数据进行了分析。所有阳性案例出现行为的概率为1.0或出现问题的概率较高,平均概率为0.986 (SD 0.033)。这表明gydF4y2B一个 深度学习gydF4y2B一个方法很好地捕捉定义2,确保出现问题或未来行动的可能性很高。gydF4y2B一个

问题和动作计算模块的结果。gydF4y2B一个

精度gydF4y2B一个 回忆gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个 精度gydF4y2B一个 中华民国AUCgydF4y2B一个一个gydF4y2B一个 公关AUCgydF4y2B一个bgydF4y2B一个
问题概率计算模块gydF4y2B一个 1.000gydF4y2B一个 1.000gydF4y2B一个cgydF4y2B一个 1.000gydF4y2B一个 1.000gydF4y2B一个 1.000gydF4y2B一个 1.000gydF4y2B一个
动作概率计算模块gydF4y2B一个 0.771gydF4y2B一个 1.000gydF4y2B一个cgydF4y2B一个 0.871gydF4y2B一个 0.810gydF4y2B一个 0.733gydF4y2B一个 0.771gydF4y2B一个

一个gydF4y2B一个ROC AUC:受试者工作特征曲线下的面积。gydF4y2B一个

bgydF4y2B一个PR AUC:精确召回曲线下的面积。gydF4y2B一个

cgydF4y2B一个的gydF4y2B一个 PgydF4y2B一个值在统计上显著gydF4y2B一个 PgydF4y2B一个= . 05。gydF4y2B一个

影响关系分类评价gydF4y2B一个

表3gydF4y2B一个显示的性能gydF4y2B一个 基线gydF4y2B一个而且gydF4y2B一个 深度学习gydF4y2B一个结合文本相关性向量、问题特征和动作特征的方法。回想一下,对于特性组合模块,gydF4y2B一个 基线gydF4y2B一个结合文本相关性评分、问题出现的可能性和未来行动出现的可能性,以确定影响关系。gydF4y2B一个 猫MatchPyramid + Q / AgydF4y2B一个表示使用gydF4y2B一个 MatchPyramidgydF4y2B一个计算文本相关性得分和gydF4y2B一个 猫gydF4y2B一个作为组合运算符⊗,而gydF4y2B一个 MatchPyramid +点Q / AgydF4y2B一个使用gydF4y2B一个 点gydF4y2B一个作为组合运算符⊗。gydF4y2B一个 猫ARC-I + Q / AgydF4y2B一个表示使用gydF4y2B一个 ARC-IgydF4y2B一个计算关联分数和gydF4y2B一个 猫gydF4y2B一个作为组合运算符⊗,而gydF4y2B一个 ARC-I +点Q / AgydF4y2B一个使用gydF4y2B一个 点gydF4y2B一个作为组合运算符⊗。gydF4y2B一个

影响关系分类结果。gydF4y2B一个

精度gydF4y2B一个 回忆gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个 精度gydF4y2B一个 中华民国AUCgydF4y2B一个一个gydF4y2B一个 公关AUCgydF4y2B一个bgydF4y2B一个
基线gydF4y2B一个 0.300gydF4y2B一个 0.231gydF4y2B一个cgydF4y2B一个 0.261gydF4y2B一个 0.595gydF4y2B一个 0.495gydF4y2B一个 0.307gydF4y2B一个
猫MatchPyramid + Q / AgydF4y2B一个dgydF4y2B一个 0.667gydF4y2B一个 0.154gydF4y2B一个cgydF4y2B一个 0.25gydF4y2B一个 0.714gydF4y2B一个 0.560gydF4y2B一个 0.442gydF4y2B一个
MatchPyramid +点Q / AgydF4y2B一个egydF4y2B一个 0.633gydF4y2B一个 0.577gydF4y2B一个cgydF4y2B一个 0.603gydF4y2B一个 0.667gydF4y2B一个 0.634gydF4y2B一个 0.481gydF4y2B一个
猫ARC-I + Q / AgydF4y2B一个fgydF4y2B一个 0.667gydF4y2B一个 0.154gydF4y2B一个cgydF4y2B一个 0.25gydF4y2B一个 0.714gydF4y2B一个 0.637gydF4y2B一个 0.515gydF4y2B一个
ARC-I +点Q / AgydF4y2B一个ggydF4y2B一个 0.750gydF4y2B一个 0.462gydF4y2B一个cgydF4y2B一个 0.571gydF4y2B一个 0.786gydF4y2B一个 0.724gydF4y2B一个 0.631gydF4y2B一个

一个gydF4y2B一个ROC AUC:受试者工作特征曲线下的面积。gydF4y2B一个

bgydF4y2B一个PR AUC:精确召回曲线下的面积。gydF4y2B一个

cgydF4y2B一个的gydF4y2B一个 PgydF4y2B一个值在统计上显著gydF4y2B一个 P =gydF4y2B一个. 05。gydF4y2B一个

dgydF4y2B一个MatchPyramid+cat Q/A:模型使用gydF4y2B一个 MatchPyramidgydF4y2B一个计算文本相关性得分和gydF4y2B一个 猫gydF4y2B一个作为组合运算符⊗。gydF4y2B一个

egydF4y2B一个MatchPyramid+dot Q/A:模型使用gydF4y2B一个 MatchPyramidgydF4y2B一个计算文本相关性得分和gydF4y2B一个 点gydF4y2B一个作为组合运算符⊗。gydF4y2B一个

fgydF4y2B一个ARC-I+cat Q/A:模型使用gydF4y2B一个 建筑igydF4y2B一个计算关联分数和gydF4y2B一个 猫gydF4y2B一个作为组合运算符⊗。gydF4y2B一个

ggydF4y2B一个ARC-I+dot Q/A:模型使用gydF4y2B一个 建筑igydF4y2B一个计算关联分数和gydF4y2B一个 点gydF4y2B一个作为组合运算符⊗。gydF4y2B一个

我们还可视化了各种方法的工作特性曲线,如图所示gydF4y2B一个 图5gydF4y2B一个.从gydF4y2B一个 表3gydF4y2B一个而且gydF4y2B一个 图5gydF4y2B一个,我们有以下观察。gydF4y2B一个

首先,提出了gydF4y2B一个 深度学习gydF4y2B一个使用相关性特征并考虑相关性与问题或动作之间的相互作用的方法显著优于gydF4y2B一个 基线gydF4y2B一个的方法。这说明由文本相关性度量模块生成的相关性特征向量能够有效地捕获相关内容。将这些特征向量与问题存在和行动存在的特征相结合,有助于捕获它们之间的相互作用,在影响关系分类中取得了良好的效果。相比之下,gydF4y2B一个 基线gydF4y2B一个直接遵循定义2的方法没有很好地执行。这是由于无法捕捉文本相关性和问题或动作存在之间的交互,以及手动为每个模块设置适当的截止阈值的挑战。gydF4y2B一个

第二,模型的使用gydF4y2B一个 点gydF4y2B一个运算符比使用gydF4y2B一个 猫gydF4y2B一个操作符。这主要有两个原因。首先,问题概率和行动概率可能相互作用gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 而且gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 关联向量,可以很好地捕捉gydF4y2B一个 点gydF4y2B一个操作符。gydF4y2B一个 图1gydF4y2B一个B给出了一个例子,其中动作在gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 与?中的讨论有关gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 .的行动gydF4y2B一个 pgydF4y2B一个C2gydF4y2B一个 有关gydF4y2B一个 化疗gydF4y2B一个的共同内容gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个B2gydF4y2B一个 .在这种情况下,动作概率需要结合gydF4y2B一个 VgydF4y2B一个ABgydF4y2B一个 .不过,在另一种情况下,动作指的是gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 的相互作用。gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 是否更有可能是行动的上下文,因此,行动概率需要结合gydF4y2B一个 VgydF4y2B一个公元前gydF4y2B一个 .相比之下,gydF4y2B一个 猫gydF4y2B一个由于省略了一些中性词,运算符忽略了问题(动作)与上下文之间的一些交互。因此,gydF4y2B一个 猫gydF4y2B一个基于的方法的召回率比gydF4y2B一个 点gydF4y2B一个的方法。结果表明,行为与情境之间的相互作用对影响识别非常重要。gydF4y2B一个

此外,gydF4y2B一个 ARC-I +点Q / AgydF4y2B一个有更好的精度,准确性,ROC AUC和PR AUC比gydF4y2B一个 MatchPyramid +点Q / AgydF4y2B一个但回忆率和F值略低gydF4y2B一个1gydF4y2B一个.这是因为ARC-I在文本相关性度量模块中取得了比MatchPyramid更好的性能。gydF4y2B一个 ARC-I +点Q / AgydF4y2B一个更严格的比gydF4y2B一个 MatchPyramid +点Q / AgydF4y2B一个当模型与相关因子拟合时。对于想要分析具有影响力的文章的写作风格和模式的应用程序,精确度是至关重要的。gydF4y2B一个 ARC-I +点Q / AgydF4y2B一个对于定位此类讨论是有效的。相比之下,对于希望检查有影响力的帖子的信息质量,以防止和减轻误导性信息的传播的应用程序,gydF4y2B一个 MatchPyramid +点Q / AgydF4y2B一个更适合,因为它有较高的召回率。gydF4y2B一个

影响分类的关系。gydF4y2B一个

一个案例研究gydF4y2B一个

图1gydF4y2B一个展示了3个关系的示例,(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B1gydF4y2B一个pgydF4y2B一个C1gydF4y2B一个 ), (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B2gydF4y2B一个pgydF4y2B一个C2gydF4y2B一个 )和(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B3gydF4y2B一个pgydF4y2B一个C3gydF4y2B一个 ), (gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个 是线程的初始帖子。使用我们的系统计算这3个关系的得分分别为0.282、0.793和0.622。我们的系统识别出(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B2gydF4y2B一个pgydF4y2B一个C2gydF4y2B一个 )和(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B3gydF4y2B一个pgydF4y2B一个C3gydF4y2B一个 )作为每个包含影响关系的,以及(gydF4y2B一个 pgydF4y2B一个一个gydF4y2B一个pgydF4y2B一个B1gydF4y2B一个pgydF4y2B一个C1gydF4y2B一个 )没有。从帖子内容中我们可以看到,gydF4y2B一个 pgydF4y2B一个B2gydF4y2B一个 为最初的作者提供关于治疗决定的建议。在后期gydF4y2B一个 pgydF4y2B一个C2gydF4y2B一个 ,作者根据文章中的建议表达了要采取的行动gydF4y2B一个 pgydF4y2B一个B2gydF4y2B一个 .在后期gydF4y2B一个 pgydF4y2B一个B3gydF4y2B一个 ,回复者建议作者使用假发。然后,最初的作者提出了关于假发信息的进一步问题。这两种关系表明,最初的作者受到了影响。相比之下,gydF4y2B一个 pgydF4y2B一个B1gydF4y2B一个 讨论一般情况并安慰原作者,并在原作者表示感谢gydF4y2B一个 pgydF4y2B一个C1gydF4y2B一个 ,但没有受到影响的迹象。gydF4y2B一个

讨论gydF4y2B一个 主要研究结果gydF4y2B一个

据我们所知,这是第一项界定与职业健康国家决策有关的讨论职位的影响关系的研究。我们提出了一个基于深度学习的自然语言处理原型来识别影响关系。然后,我们在CSN乳腺癌论坛上应用开发的技术来确定影响关系。主要有两个观察结果。gydF4y2B一个

首先,我们发现在热含量中存在大量的影响关系。在Li等人确定的9052种决策线索关系中[gydF4y2B一个 1gydF4y2B一个], 3069个(33.9%)被确定为影响关系。也就是说,大约三分之一的通信影响了最初作者的决策。此外,在至少有一种关系的5143个决策线程中,2417个(47%)至少包含一种影响关系。由于这种现象普遍存在,研究具有影响力的职位是很重要的。gydF4y2B一个

其次,我们还观察到,有影响力的帖子可能有助于吸引用户参与讨论。包含至少一个影响关系的线程中的帖子的平均数量为15.5,而不包含影响关系的线程中的帖子的平均数量为12.6。我们的猜想是,有影响力的帖子可能会提供有用的信息或良好的推理,这是发人深省的,有助于吸引用户参与讨论。gydF4y2B一个

在这些观察的基础上,可以从确定和分析影响关系中受益的几个应用程序。gydF4y2B一个

首先,分析有影响力的帖子的质量有助于提高影响力的质量。正如在第一个观察中所讨论的,影响关系是常见的。就提高影响的效果和减少误导性信息的传播而言,对这些帖子的质量检查比对其他帖子的质量检查更为关键。gydF4y2B一个

在识别影响关系的基础上,我们可以进一步识别OHCs中有影响力的用户。我们可以使用现有的分析网络特征的技术来识别有影响力的用户[gydF4y2B一个 16gydF4y2B一个-gydF4y2B一个 20.gydF4y2B一个],该工作计算边缘权重(即帖子的影响)。查明和核查有影响力的用户有助于高质量的信息传播。gydF4y2B一个

其次,基于第二个观察,分析有影响力的帖子的写作风格,为医疗保健专业人员提供了关于有效沟通患者参与的见解。gydF4y2B一个

此外,确定影响关系有助于为解决信息过载问题提出有效的信息建议。当用户在OHCs中搜索信息时,重要的是对讨论线程和帖子进行排序,并向用户推荐最相关和最有帮助的讨论。基于对影响关系的分析和第二个观察结果,包含影响关系的讨论更有可能提供有用的信息,并鼓励患者参与。因此,影响力关系的存在是影响排名的积极因素。gydF4y2B一个

限制gydF4y2B一个

我们的结果并非没有局限性。首先,我们的关系定义是基于3个帖子,包括线程中的初始帖子。因此,我们只确定了对最初作者有影响的帖子。但是,任何3个与来自同一作者的第一个和第三个帖子有顺序回复关系的帖子都可以表示一种关系。我们推测,所提出的技术可以用于识别广义关系中的影响关系,并计划在未来研究该问题。其次,在本研究中,我们考虑了帖子之间的文本相关性关系。有时,即使是两个帖子,gydF4y2Ba pgydF4y2B一个BgydF4y2B一个 而且gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 ,都是整体相关的,具体的句子中有一个问题或未来的行动指示gydF4y2B一个 pgydF4y2B一个CgydF4y2B一个 可能不相关的建议gydF4y2B一个 pgydF4y2B一个BgydF4y2B一个 .此外,当前用于未来动作检测的技术有时会产生假阳性。为了解决这些问题,我们将研究如何利用词性和引用解析技术[gydF4y2B一个 47gydF4y2B一个来提高对自然语言的理解能力。gydF4y2B一个

结论及未来工作gydF4y2B一个

我们研究了网络讨论影响关系的识别问题,并开发了识别OHCs影响关系的技术和原型系统。所提出的深度学习模型证明了比较方法的性能优势。在未来的工作中,我们将解决上述的局限性,以提高所提议技术的通用性和准确性。gydF4y2B一个

缩写gydF4y2B一个 ARC-IgydF4y2B一个

建筑igydF4y2B一个

ARC-IIgydF4y2B一个

Architecture-IIgydF4y2B一个

伯特gydF4y2B一个

来自变压器的双向编码器表示gydF4y2B一个

CSNgydF4y2B一个

癌症幸存者网络gydF4y2B一个

DSSMgydF4y2B一个

深度结构化语义模型gydF4y2B一个

OHCgydF4y2B一个

在线健康社区gydF4y2B一个

公关AUCgydF4y2B一个

精度-召回曲线下的面积gydF4y2B一个

中华民国AUCgydF4y2B一个

接收器工作特性曲线下的面积gydF4y2B一个

本材料基于由Leir基金会和美国国立卫生研究院(UL1TR003017)资助的部分工作。gydF4y2B一个

没有宣布。gydF4y2B一个

李gydF4y2B一个 米gydF4y2B一个 史gydF4y2B一个 JgydF4y2B一个 程ydF4y2B一个 YgydF4y2B一个 分析在线健康社区中的患者决策gydF4y2B一个 2019年IEEE医疗保健信息学国际会议论文集gydF4y2B一个 2019gydF4y2B一个 阿一的19gydF4y2B一个 2019年6月10号至13号,gydF4y2B一个 西安,中国gydF4y2B一个 1gydF4y2B一个 8gydF4y2B一个 10.1109 / ICHI.2019.8904879gydF4y2B一个 风扇gydF4y2B一个 HgydF4y2B一个 史密斯gydF4y2B一个 SPgydF4y2B一个 莱德曼gydF4y2B一个 RgydF4y2B一个 常gydF4y2B一个 年代gydF4y2B一个 为什么人们信任在线健康社区:一种综合方法gydF4y2B一个 第21届澳大利亚信息系统会议论文集gydF4y2B一个 2010gydF4y2B一个 埃西斯的10gydF4y2B一个 2010年8月18 - 20,gydF4y2B一个 山形,日本gydF4y2B一个 金gydF4y2B一个 海关gydF4y2B一个 MrotekgydF4y2B一个 一个gydF4y2B一个 在线健康社区可持续性的功能和结构诊断:关注资源丰富度和网站设计特征gydF4y2B一个 第一版人类BehavgydF4y2B一个 2016gydF4y2B一个 10gydF4y2B一个 63gydF4y2B一个 362gydF4y2B一个 72gydF4y2B一个 10.1016 / j.chb.2016.05.004gydF4y2B一个 DemirisgydF4y2B一个 GgydF4y2B一个 虚拟社区在医疗保健中的普及:概念和挑战gydF4y2B一个 病人建造清纯甜美gydF4y2B一个 2006gydF4y2B一个 08gydF4y2B一个 62gydF4y2B一个 2gydF4y2B一个 178gydF4y2B一个 88gydF4y2B一个 10.1016 / j.pec.2005.10.003gydF4y2B一个 16406472gydF4y2B一个 s0738 - 3991 (05) 00312 - 5gydF4y2B一个 NasralahgydF4y2B一个 TgydF4y2B一个 NoteboomgydF4y2B一个 CgydF4y2B一个 恩-瓦贝gydF4y2B一个 一个gydF4y2B一个 Al-RamahigydF4y2B一个 妈gydF4y2B一个 基于社会支持视角的在线健康推荐系统gydF4y2B一个 达科他州立大学gydF4y2B一个 2017gydF4y2B一个 2022-06-10gydF4y2B一个 https://scholar.dsu.edu/cgi/viewcontent.cgi?article=1008&context=bispapersgydF4y2B一个 霁gydF4y2B一个 XgydF4y2B一个 盖勒gydF4y2B一个 JgydF4y2B一个 春gydF4y2B一个 年代gydF4y2B一个 面向患者的医疗保健知识支持的社会信息按钮gydF4y2B一个 2014年AMIA年度研讨会论文集gydF4y2B一个 2014gydF4y2B一个 AMIA的14gydF4y2B一个 2014年11月15 - 19,gydF4y2B一个 美国华盛顿特区gydF4y2B一个 WaterworthgydF4y2B一个 年代gydF4y2B一个 卢克gydF4y2B一个 卡gydF4y2B一个 不情愿的合作者:病人想参与到有关医疗的决策中吗?gydF4y2B一个 J副词孕育gydF4y2B一个 1990gydF4y2B一个 08gydF4y2B一个 15gydF4y2B一个 8gydF4y2B一个 971gydF4y2B一个 6gydF4y2B一个 10.1111 / j.1365-2648.1990.tb01953.xgydF4y2B一个 2229694gydF4y2B一个 希巴德gydF4y2B一个 JHgydF4y2B一个 格林gydF4y2B一个 JgydF4y2B一个 关于患者激活的证据表明:更好的健康结果和护理体验;成本数据较少gydF4y2B一个 健康等于off(米尔)gydF4y2B一个 2013gydF4y2B一个 02gydF4y2B一个 32gydF4y2B一个 2gydF4y2B一个 207gydF4y2B一个 14gydF4y2B一个 10.1377 / hlthaff.2012.1061gydF4y2B一个 23381511gydF4y2B一个 32/2/207gydF4y2B一个 乳腺癌gydF4y2B一个 癌症幸存者网络gydF4y2B一个 2022-06-10gydF4y2B一个 https://csn.cancer.org/forum/127gydF4y2B一个 YaraghigydF4y2B一个 NgydF4y2B一个 王gydF4y2B一个 WgydF4y2B一个 高gydF4y2B一个 GGgydF4y2B一个 阿加瓦尔gydF4y2B一个 RgydF4y2B一个 在线质量评分如何影响患者对医疗提供者的选择:对照实验调查研究gydF4y2B一个 J医学网络杂志gydF4y2B一个 2018gydF4y2B一个 03gydF4y2B一个 26gydF4y2B一个 20.gydF4y2B一个 3.gydF4y2B一个 e99gydF4y2B一个 10.2196 / jmir.8986gydF4y2B一个 29581091gydF4y2B一个 v20i3e99gydF4y2B一个 PMC5891665gydF4y2B一个 张gydF4y2B一个 DgydF4y2B一个 悦gydF4y2B一个 WTgydF4y2B一个 在决策过程中使用社交媒体:第十届电子商务讲习班决策支持系统特别问题gydF4y2B一个 决策支持系统gydF4y2B一个 2014gydF4y2B一个 07gydF4y2B一个 63gydF4y2B一个 65gydF4y2B一个 6gydF4y2B一个 10.1016 / j.dss.2013.08.007gydF4y2B一个 吴gydF4y2B一个 BgydF4y2B一个 姜gydF4y2B一个 年代gydF4y2B一个 程ydF4y2B一个 HgydF4y2B一个 个人动机对在线健康论坛交流的影响gydF4y2B一个 Soc Behav珀耳斯gydF4y2B一个 2016gydF4y2B一个 03gydF4y2B一个 23gydF4y2B一个 44gydF4y2B一个 2gydF4y2B一个 299gydF4y2B一个 312gydF4y2B一个 10.2224 / sbp.2016.44.2.299gydF4y2B一个 庞ydF4y2B一个 WgydF4y2B一个 沈gydF4y2B一个 CgydF4y2B一个 冯gydF4y2B一个 BgydF4y2B一个 你付出了什么就会得到什么:理解回复互惠和在线健康支持论坛的社会资本gydF4y2B一个 J健康CommungydF4y2B一个 2017gydF4y2B一个 01gydF4y2B一个 22gydF4y2B一个 1gydF4y2B一个 45gydF4y2B一个 52gydF4y2B一个 10.1080 / 10810730.2016.1250845gydF4y2B一个 28027009gydF4y2B一个 李gydF4y2B一个 年代gydF4y2B一个 冯gydF4y2B一个 BgydF4y2B一个 温盖特gydF4y2B一个 VSgydF4y2B一个 感谢一点点,你就会发现很多:寻求支持者的回复在在线支持提供中所扮演的角色gydF4y2B一个 Commun MonogrgydF4y2B一个 2019gydF4y2B一个 86gydF4y2B一个 2gydF4y2B一个 251gydF4y2B一个 70gydF4y2B一个 10.1080 / 03637751.2018.1539237gydF4y2B一个 余gydF4y2B一个 JgydF4y2B一个 胡gydF4y2B一个 YgydF4y2B一个 余gydF4y2B一个 米gydF4y2B一个 迪gydF4y2B一个 ZgydF4y2B一个 分析网友在论坛上的观点和回复行为gydF4y2B一个 Phys A Stat Mech应用程序gydF4y2B一个 2010gydF4y2B一个 8gydF4y2B一个 389gydF4y2B一个 16gydF4y2B一个 3267gydF4y2B一个 73gydF4y2B一个 10.1016 / j.physa.2010.03.043gydF4y2B一个 唐gydF4y2B一个 XgydF4y2B一个 杨gydF4y2B一个 CCgydF4y2B一个 在在线医疗保健社交网络中识别有影响力的用户gydF4y2B一个 2010年IEEE国际情报与安全信息学会议论文集gydF4y2B一个 2010gydF4y2B一个 ISI的10gydF4y2B一个 2010年5月23日,gydF4y2B一个 加拿大温哥华gydF4y2B一个 43gydF4y2B一个 8gydF4y2B一个 10.1109 / ISI.2010.5484779gydF4y2B一个 查gydF4y2B一个 米gydF4y2B一个 HaddadigydF4y2B一个 HgydF4y2B一个 BenevenutogydF4y2B一个 FgydF4y2B一个 GummadigydF4y2B一个 KgydF4y2B一个 衡量Twitter用户影响力:百万追随者谬误gydF4y2B一个 Proc Conf AAAI Artif IntellgydF4y2B一个 2010gydF4y2B一个 4gydF4y2B一个 1gydF4y2B一个 10gydF4y2B一个 7gydF4y2B一个 IshfaqgydF4y2B一个 UgydF4y2B一个 汗gydF4y2B一个 胡gydF4y2B一个 伊克巴尔gydF4y2B一个 KgydF4y2B一个 识别有影响力的博主:基于情感分析的模块化方法gydF4y2B一个 J Web英格gydF4y2B一个 2017gydF4y2B一个 16gydF4y2B一个 5 - 6gydF4y2B一个 505gydF4y2B一个 23gydF4y2B一个 赵gydF4y2B一个 KgydF4y2B一个 邱gydF4y2B一个 BgydF4y2B一个 CarageagydF4y2B一个 CgydF4y2B一个 吴gydF4y2B一个 DgydF4y2B一个 密特拉gydF4y2B一个 PgydF4y2B一个 日元gydF4y2B一个 JgydF4y2B一个 格里尔gydF4y2B一个 通用电气gydF4y2B一个 口感gydF4y2B一个 KgydF4y2B一个 确定在线癌症幸存者社区的领导者gydF4y2B一个 第21届信息技术与系统年度研讨会论文集gydF4y2B一个 2011gydF4y2B一个 智慧的11gydF4y2B一个 2011年12月3 - 4日gydF4y2B一个 中国上海gydF4y2B一个 115gydF4y2B一个 20.gydF4y2B一个 侯gydF4y2B一个 XgydF4y2B一个 LeigydF4y2B一个 铜gydF4y2B一个 郭gydF4y2B一个 即gydF4y2B一个 OP-DCI:一种无风险的K-means聚类,用于MOOC论坛中有影响力用户的识别gydF4y2B一个 第16届IEEE机器学习与应用国际会议论文集gydF4y2B一个 2017gydF4y2B一个 ICMLA的17gydF4y2B一个 2017年12月21日gydF4y2B一个 墨西哥坎昆gydF4y2B一个 936gydF4y2B一个 9gydF4y2B一个 10.1109 / icmla.2017.00-34gydF4y2B一个 赵gydF4y2B一个 KgydF4y2B一个 日元gydF4y2B一个 JgydF4y2B一个 格里尔gydF4y2B一个 GgydF4y2B一个 邱gydF4y2B一个 BgydF4y2B一个 密特拉gydF4y2B一个 PgydF4y2B一个 口感gydF4y2B一个 KgydF4y2B一个 寻找在线健康社区有影响力的用户:基于情感影响力的新指标gydF4y2B一个 美国医学信息协会gydF4y2B一个 2014gydF4y2B一个 10gydF4y2B一个 21gydF4y2B一个 e2gydF4y2B一个 e212gydF4y2B一个 8gydF4y2B一个 10.1136 / amiajnl - 2013 - 002282gydF4y2B一个 24449805gydF4y2B一个 amiajnl - 2013 - 002282gydF4y2B一个 PMC4173171gydF4y2B一个 CercelgydF4y2B一个 直流gydF4y2B一个 Trausan-MatugydF4y2B一个 年代gydF4y2B一个 网络论坛话题的意见影响分析gydF4y2B一个 第16届科学计算符号与数值算法国际研讨会论文集gydF4y2B一个 2014gydF4y2B一个 SYNASC的14gydF4y2B一个 2014年9月22日至25日,gydF4y2B一个 蒂米什瓦拉、罗马尼亚gydF4y2B一个 228gydF4y2B一个 35gydF4y2B一个 10.1109 / synasc.2014.38gydF4y2B一个 邱gydF4y2B一个 BgydF4y2B一个 赵gydF4y2B一个 KgydF4y2B一个 密特拉gydF4y2B一个 PgydF4y2B一个 吴gydF4y2B一个 DgydF4y2B一个 CarageagydF4y2B一个 CgydF4y2B一个 日元gydF4y2B一个 JgydF4y2B一个 格里尔gydF4y2B一个 通用电气gydF4y2B一个 口感gydF4y2B一个 KgydF4y2B一个 获得在线支持,感觉更好——情感分析和在线癌症幸存者社区的动态gydF4y2B一个 IEEE第三届隐私、安全、风险与信任国际会议和IEEE第三届社会计算国际会议论文集gydF4y2B一个 2011gydF4y2B一个 SocialCom的11gydF4y2B一个 2011年10月9 - 11,gydF4y2B一个 波士顿,美国gydF4y2B一个 274gydF4y2B一个 81gydF4y2B一个 10.1109 /帕萨特/ SocialCom.2011.127gydF4y2B一个 定义的影响gydF4y2B一个 梅里亚姆-韦伯斯特gydF4y2B一个 2022-06-10gydF4y2B一个 https://www.merriam-webster.com/dictionary/influencegydF4y2B一个 基德gydF4y2B一个 CgydF4y2B一个 海登gydF4y2B一个 通过gydF4y2B一个 好奇心的心理学和神经科学gydF4y2B一个 神经元gydF4y2B一个 2015gydF4y2B一个 11gydF4y2B一个 04gydF4y2B一个 88gydF4y2B一个 3.gydF4y2B一个 449gydF4y2B一个 60gydF4y2B一个 10.1016 / j.neuron.2015.09.010gydF4y2B一个 26539887gydF4y2B一个 s0896 - 6273 (15) 00767 - 9gydF4y2B一个 PMC4635443gydF4y2B一个 PalloffgydF4y2B一个 RMgydF4y2B一个 普拉特gydF4y2B一个 KgydF4y2B一个 《来自虚拟课堂的教训:在线教学的现实》第二版gydF4y2B一个 2013gydF4y2B一个 美国新泽西州霍博肯gydF4y2B一个 约翰·威利父子公司gydF4y2B一个 AdjeigydF4y2B一个 太gydF4y2B一个 高贵的gydF4y2B一个 SMgydF4y2B一个 高贵的gydF4y2B一个 CHgydF4y2B一个 在线品牌社区C2C传播对顾客购买行为的影响gydF4y2B一个 马克科学学院gydF4y2B一个 2009gydF4y2B一个 11gydF4y2B一个 13gydF4y2B一个 38gydF4y2B一个 5gydF4y2B一个 634gydF4y2B一个 53gydF4y2B一个 10.1007 / s11747 - 009 - 0178 - 5gydF4y2B一个 刘gydF4y2B一个 YgydF4y2B一个 程ydF4y2B一个 FgydF4y2B一个 程ydF4y2B一个 YgydF4y2B一个 学习病人论坛上的帖子回复结构gydF4y2B一个 2013年医疗保健数据管理与分析国际研讨会论文集gydF4y2B一个 2013gydF4y2B一个 敢的13gydF4y2B一个 2013年11月1日gydF4y2B一个 旧金山,加利福尼亚州,美国gydF4y2B一个 1gydF4y2B一个 4gydF4y2B一个 10.1145/2512410.2512426gydF4y2B一个 黄gydF4y2B一个 PSgydF4y2B一个 他gydF4y2B一个 XgydF4y2B一个 高gydF4y2B一个 JgydF4y2B一个 邓gydF4y2B一个 lgydF4y2B一个 AcerogydF4y2B一个 一个gydF4y2B一个 真见鬼gydF4y2B一个 lgydF4y2B一个 学习使用点击量数据进行网页搜索的深度结构化语义模型gydF4y2B一个 第22届ACM信息与知识管理国际会议论文集gydF4y2B一个 2013gydF4y2B一个 CIKM“13gydF4y2B一个 2013年10月27日- 11月1日gydF4y2B一个 旧金山,加利福尼亚州,美国gydF4y2B一个 2333gydF4y2B一个 8gydF4y2B一个 10.1145/2505515.2505665gydF4y2B一个 沈gydF4y2B一个 YgydF4y2B一个 他gydF4y2B一个 XgydF4y2B一个 高gydF4y2B一个 JgydF4y2B一个 邓gydF4y2B一个 lgydF4y2B一个 MesnilgydF4y2B一个 GgydF4y2B一个 学习使用卷积神经网络进行Web搜索的语义表示gydF4y2B一个 第23届国际万维网会议论文集gydF4y2B一个 2014gydF4y2B一个 WWW的14个同伴gydF4y2B一个 2014年4月7 - 11,gydF4y2B一个 韩国首尔gydF4y2B一个 373gydF4y2B一个 4gydF4y2B一个 10.1145/2567948.2577348gydF4y2B一个 胡gydF4y2B一个 BgydF4y2B一个 陆gydF4y2B一个 ZgydF4y2B一个 李gydF4y2B一个 HgydF4y2B一个 程ydF4y2B一个 问gydF4y2B一个 用于匹配自然语言句子的卷积神经网络结构gydF4y2B一个 第27届神经信息处理系统国际会议论文集第二卷gydF4y2B一个 2014gydF4y2B一个 少量的14gydF4y2B一个 2014年12月8日至13日,gydF4y2B一个 加拿大蒙特利尔gydF4y2B一个 2042gydF4y2B一个 50gydF4y2B一个 王gydF4y2B一个 YCgydF4y2B一个 德国人gydF4y2B一个 RgydF4y2B一个 莱文gydF4y2B一个 JMgydF4y2B一个 留还是走?在线健康支持小组中情感和信息支持与承诺的关系gydF4y2B一个 ACM 2012计算机支持协同工作会议论文集gydF4y2B一个 2012gydF4y2B一个 CSCW的12gydF4y2B一个 2012年2月11日- 15日gydF4y2B一个 美国西雅图,华盛顿州gydF4y2B一个 833gydF4y2B一个 42gydF4y2B一个 10.1145/2145204.2145329gydF4y2B一个 陆gydF4y2B一个 ZgydF4y2B一个 李gydF4y2B一个 HgydF4y2B一个 用于匹配短文本的深层架构gydF4y2B一个 第26届神经信息处理系统国际会议论文集-第一卷gydF4y2B一个 2013gydF4y2B一个 少量的13gydF4y2B一个 2013年12月5 - 10日gydF4y2B一个 太浩湖,美国gydF4y2B一个 1367gydF4y2B一个 75gydF4y2B一个 10.7551 / mitpress / 11474.003.0014gydF4y2B一个 庞gydF4y2B一个 lgydF4y2B一个 局域网gydF4y2B一个 YgydF4y2B一个 郭gydF4y2B一个 JgydF4y2B一个 徐gydF4y2B一个 JgydF4y2B一个 王ydF4y2B一个 年代gydF4y2B一个 程gydF4y2B一个 XgydF4y2B一个 文本匹配作为图像识别gydF4y2B一个 Proc Conf AAAI Artif IntellgydF4y2B一个 2016gydF4y2B一个 3.gydF4y2B一个 5gydF4y2B一个 30.gydF4y2B一个 1gydF4y2B一个 10341gydF4y2B一个 10.1609 / aaai.v30i1.10341gydF4y2B一个 DevlingydF4y2B一个 JgydF4y2B一个 常gydF4y2B一个 兆瓦gydF4y2B一个 李gydF4y2B一个 KgydF4y2B一个 ToutanovagydF4y2B一个 KgydF4y2B一个 伯特:深度双向转换语言理解的预训练gydF4y2B一个 arXivgydF4y2B一个 2018gydF4y2B一个 10gydF4y2B一个 11gydF4y2B一个 10.48550 / arXiv.1810.04805gydF4y2B一个 埃夫隆gydF4y2B一个 米gydF4y2B一个 WingetgydF4y2B一个 米gydF4y2B一个 问题是内容:微博环境中问题的分类gydF4y2B一个 Proc Am Soc信息科技gydF4y2B一个 2011gydF4y2B一个 02gydF4y2B一个 03gydF4y2B一个 47gydF4y2B一个 1gydF4y2B一个 1gydF4y2B一个 10gydF4y2B一个 10.1002 / meet.14504701208gydF4y2B一个 刘gydF4y2B一个 ZgydF4y2B一个 詹森gydF4y2B一个 BJgydF4y2B一个 提问者或问题:预测新浪微博社交问答的回应率gydF4y2B一个 正过程等内容gydF4y2B一个 2018gydF4y2B一个 03gydF4y2B一个 54gydF4y2B一个 2gydF4y2B一个 159gydF4y2B一个 74gydF4y2B一个 10.1016 / j.ipm.2017.10.004gydF4y2B一个 RanganathgydF4y2B一个 年代gydF4y2B一个 胡gydF4y2B一个 XgydF4y2B一个 唐gydF4y2B一个 JgydF4y2B一个 王gydF4y2B一个 年代gydF4y2B一个 刘gydF4y2B一个 HgydF4y2B一个 识别社交媒体上的反问gydF4y2B一个 Proc Conf AAAI Artif IntellgydF4y2B一个 2016gydF4y2B一个 10gydF4y2B一个 1gydF4y2B一个 667gydF4y2B一个 70gydF4y2B一个 RanganathgydF4y2B一个 年代gydF4y2B一个 胡gydF4y2B一个 XgydF4y2B一个 唐gydF4y2B一个 JgydF4y2B一个 王gydF4y2B一个 年代gydF4y2B一个 刘gydF4y2B一个 HgydF4y2B一个 理解并识别社交媒体中的反问句gydF4y2B一个 ACM Trans Intell Syst技术公司gydF4y2B一个 2018gydF4y2B一个 03gydF4y2B一个 31gydF4y2B一个 9gydF4y2B一个 2gydF4y2B一个 1gydF4y2B一个 22gydF4y2B一个 10.1145 / 3108364gydF4y2B一个 OjokohgydF4y2B一个 BgydF4y2B一个 IgbegydF4y2B一个 TgydF4y2B一个 AraoyegydF4y2B一个 一个gydF4y2B一个 AmehgydF4y2B一个 FgydF4y2B一个 学术问答网站上的问题识别和分类gydF4y2B一个 第16届ACM/IEEE-CS数字图书馆联合会议论文集gydF4y2B一个 2016gydF4y2B一个 JCDL的16gydF4y2B一个 2016年6月19号,gydF4y2B一个 美国新泽西纽瓦克gydF4y2B一个 223gydF4y2B一个 4gydF4y2B一个 10.1145/2910896.2925442gydF4y2B一个 鸟gydF4y2B一个 年代gydF4y2B一个 洛佩尔gydF4y2B一个 EgydF4y2B一个 NLTK:自然语言工具包gydF4y2B一个 ACL互动海报及示范会议记录gydF4y2B一个 2004gydF4y2B一个 ACL 04年gydF4y2B一个 2004年7月,第21到26gydF4y2B一个 西班牙巴塞罗那gydF4y2B一个 214gydF4y2B一个 7gydF4y2B一个 格拉汉姆·古德费勒gydF4y2B一个 我gydF4y2B一个 YoshuagydF4y2B一个 BgydF4y2B一个 考维尔gydF4y2B一个 一个gydF4y2B一个 深度学习gydF4y2B一个 2016gydF4y2B一个 11gydF4y2B一个 美国剑桥,马gydF4y2B一个 麻省理工学院出版社gydF4y2B一个 4gydF4y2B一个 KingmagydF4y2B一个 DPgydF4y2B一个 英航gydF4y2B一个 JgydF4y2B一个 一种随机优化的方法gydF4y2B一个 第三届学习表征国际会议论文集gydF4y2B一个 2015gydF4y2B一个 ICLR”15gydF4y2B一个 2015年5月7号到9号,gydF4y2B一个 圣地亚哥,加利福尼亚州,美国gydF4y2B一个 李明达,石金河,陈毅gydF4y2B一个 NJIT-AI-in-Healthcare / Influence-Relationship-ClassificationgydF4y2B一个 GitHubgydF4y2B一个 2022gydF4y2B一个 2gydF4y2B一个 27gydF4y2B一个 2022-06-10gydF4y2B一个 https://github.com/NJIT-AI-in-Healthcare/Influence-Relationship-ClassificationgydF4y2B一个 ScrapygydF4y2B一个 2022-06-10gydF4y2B一个 https://scrapy.org/gydF4y2B一个 KrizhevskygydF4y2B一个 一个gydF4y2B一个 SutskevergydF4y2B一个 我gydF4y2B一个 辛顿gydF4y2B一个 通用电气gydF4y2B一个 基于深度卷积神经网络的ImageNet分类gydF4y2B一个 Commun ACMgydF4y2B一个 2017gydF4y2B一个 6gydF4y2B一个 60gydF4y2B一个 6gydF4y2B一个 84gydF4y2B一个 90gydF4y2B一个 10.1145 / 3065386gydF4y2B一个 刘gydF4y2B一个 YgydF4y2B一个 史gydF4y2B一个 JgydF4y2B一个 程ydF4y2B一个 YgydF4y2B一个 以患者为中心和经验感知挖掘在线健康论坛中有效的药物不良反应发现gydF4y2B一个 美国科学技术协会gydF4y2B一个 2017gydF4y2B一个 09gydF4y2B一个 22gydF4y2B一个 69gydF4y2B一个 2gydF4y2B一个 215gydF4y2B一个 28gydF4y2B一个 10.1002 / asi.23929gydF4y2B一个
Baidu
map