JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v23i12e19183 34914615 10.2196/19183 原始论文 原始论文 中文在线健康社区的用户行为与用户生成内容:比较研究 Kukafka 丽塔 Xueying Xiaonan Lei 韩宇奇 废话 1 https://orcid.org/0000-0001-6984-9609 松花蛋 博士学位 1
医学人工智能研究所 西安交通大学附属第二医院 建强路5号 新城地区 西安,710016 中国 86 029 82666758 36832164 @qq.com
https://orcid.org/0000-0002-2276-2538
Linyun 英里每小时 1 https://orcid.org/0000-0001-6500-537X
医学人工智能研究所 西安交通大学附属第二医院 西安 中国 通讯作者:徐松华 36832164 @qq.com 12 2021 15 12 2021 23 12 e19183 11 1 2021 10 2 2021 24 2 2021 12 8 2021 ©雷宇奇,徐松花,周林云。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 15.12.2021。 2021

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

在线卫生社区(ohc)越来越受到全球患者、护理人员和支持者的关注。中国的OHCs也不例外。然而,中国OHCs中的用户生成内容(UGC)和相关用户行为在很大程度上未得到充分探索,很少进行系统分析,从而丧失了利用OHCs的见解优化治疗设计和护理提供的宝贵机会。

客观的

本研究旨在通过系统全面地分析国内两大热门ohc的UGC及相关用户行为,揭示其共同特征和不同特征。

方法

我们重点研究了米健的肺癌论坛(LCF)和乳腺癌论坛(BCF)以及甜蜜之家的糖尿病会诊论坛(DCF),因为这三种疾病在中国患者中的重要性以及它们在中国OHCs中的总体患病率。我们的分析探讨了每个社交网络的关键用户活动、小世界效应和无标度特征。我们全面考察了这些论坛的UGC,采用加权知识网络技术,发现各个论坛的突出话题以及这些话题之间的潜在关系。最后,我们讨论了我们的分析结果对公共卫生的影响。

结果

我们的分析表明,每个论坛上每个线程的读取数遵循gamma分布( Hl =0, HB = 0, HD = 0);每个论坛的回复数量遵循指数分布(经过调整) Rl 2= 0.946,调整 RB 2=0.958,经调整 RD 2= 0.971);以及用户所涉及的线程数(已调整) Rl 2= 0.978,调整 RB 2=0.964,并调整 RD 2=0.970),用户的关注数(调整后) Rl 2= 0.989,调整 RB 2=0.962,并调整 RD 2=0.990)和用户的度(调整后) Rl 2= 0.997,调整 RB 2=0.994,并调整 RD 2=0.968)均服从幂律分布。研究进一步表明,用户通常在工作日更活跃,这在所有三个论坛中都很常见。特别是,LCF和DCF表现出较高的时间相似性( ρ= 0.927; P<.001)在一天中每个小时内的相对线程发布频率。此外,研究表明,所有3个论坛都表现出小世界效应(平均 σl = 517.15,意味着 σB =275.23,和mean σD =525.18)和无标度特征,而全球聚类系数低于国际同类OHCs。研究还发现了三个疾病论坛共同分享的几个热点话题,如疾病治疗、疾病检查和诊断。特别是,研究发现,在COVID-19爆发后,LCF和BCF的用户在讨论医疗问题时更有可能提出与COVID-19相关的问题。

结论

在中国OHCs中,UGC和相关的在线用户行为可以作为重要的信息来源,以获得关于个人和人群健康状况的见解。有效和及时地挖掘和利用这些内容可以不断提供有价值的第一手线索,以增强卫生提供者和政策制定者的态势感知。

在线健康社区 用户行为 用户生成内容 社会网络分析 加权知识网络
简介 背景

在线社区是互联网用户为了各种目的和兴趣而创建的社会群体。“互联网+”快速发展 1近年来,科技进一步提升了在线社区的价值。与此同时,人民的健康意识和改善自我健康管理的动机一直在稳步增长。在缓解传统医疗保健交流中普遍存在的医生和患者之间的信息不对称的强烈愿望的推动下,患者通过在线健康社区(ohc)获得了一种新的方式来分享他们的疾病情况并接受所需的医疗保健建议。例如,越来越多的患者及其亲属持续参与OHCs,积极分享治疗经验,对治疗或整个护理过程中遇到的各种问题公开表达个人意见和感受。OHCs在交流情感交流和为患者及其家属提供社会支持方面的价值也得到了广泛认可[ 2].目前,越来越多的用户生成内容(UGC)和相关的在线用户行为在ohc上可用。美国国家卫生信息技术协调员办公室将患者生成的健康数据定义为患者(或家庭成员或其他护理人员)为帮助解决健康问题而创建、记录或收集的与健康相关的数据[ 3.].中国国家卫生健康委员会公开发布《进一步提高医疗服务质量行动计划(2018-2020年)》,强调患者组织在知识共享、全程疾病管理、康复支持、药物开发和临床试验等方面的作用[ 4].然而,中国OHCs中的UGC及其相关用户行为往往缺乏系统的探索和分析,从而失去了改进治疗设计和患者护理的宝贵线索和证据。

OHCs的研究现状

存在许多ohc,为用户提供多种流畅的方式来交流信息、分享经验、寻求答案和获得支持。PatientsLikeMe是世界上第一个也是最大的致力于患者的社交网络平台。截至2018年,共有超过65万用户通过该平台交流分享健康信息,涉及2900多种疾病[ 5].MyHealthTeams [ 6是一个面向慢性疾病患者的社交网络,旨在为参与者提供互助,目前已聚集了超过200万用户,分布在33个在线疾病平台上。几种OHCs,如乳腺癌[ 7]和BecomeAnEX [ 8],也很受病人欢迎。在中国,Manyoubang [ 9]为慢性疾病患者提供了一个互动的OHC,它有超过22个分论坛。壹翔网络[ 10是中国最大的病例分享网站,为患者提供病例上传、交流、互助等服务。Mijian [ 11]是撰写本文时国内最大的患者互动OHC,集多个单一疾病论坛为一体,具有互动问答功能。其他在中国的OHCs,如甜蜜家园[ 12]及淋巴瘤之家[ 13],主要服务慢性病患者。与此同时,在一些通用中文网络论坛(如天涯论坛[ 14]、贴吧[ 15]、知乎[ 16]),也有专门讨论疾病的分论坛。

自多功能ohc出现以来,学者们试图从不同角度对这些虚拟社区进行分析。例如,Smailhodzic等[ 17]进行了22篇文献综述,将患者对社交媒体的使用分为情绪类、信息类、尊重类、网络支持类、社会比较类、情绪表达类6类。东乡[ 18]从中国OHCs的UGC、参与者和底层网络社区的特点3个方面对中国OHCs进行了概述。吴等[ 19,总结了热含量及其演化的研究热点,以及热含量的关键分析方法。为了揭示可能激发ohc知识共享的因素,学者们利用文本挖掘来更好地理解和预测用户参与[ 20. 21].费尔南德斯等[ 22]采用网络图法分析OHCs对糖尿病预后的积极影响。李( 23]利用结构方程模型研究了影响个体患者医疗信息共享意愿的因素。学者们还利用机器学习方法,根据OHCs的问答,研究了健康主题的分布[ 24- 27].此外,学者利用社会网络分析方法,通过构建和考察底层知识共享网络,分析OHCs中用户之间的知识交换行为[ 28- 33].

总体而言,现有的OHCs研究主要集中在揭示用户参与OHCs的动机、探讨用户在线知识共享行为的影响因素以及挖掘OHCs中的UGC。对于中国的OHCs,现有的研究主要集中在小规模的单一疾病论坛。与国际同行的研究相比,目前对中国OHCs的分析在广度和深度上都要有限得多,需要进一步扩大认识,加强现有研究的初步成果。为满足需求和填补空白,本研究综合考察了在中国最受欢迎的2个OHCs上举办的3个具有代表性的疾病论坛。通过大规模的评价,揭示了这些论坛用户行为和UGC的共同特征和不同特征,从而有助于从总体上理解中国OHCs的用户行为和UGC。

目标

鉴于OHCs的流行和扩散,了解UGC在这些论坛中反映的多方面患者体验和相关用户行为,可以为增强公共卫生意识和提高所提供的护理质量提供许多有价值的见解。全面深入地分析这些用户内容和行为还可以从软件工程的角度优化ohc的设计和管理,以及更好的基于社区的知识服务的设计和开发。在上述预期效益的推动下,本研究对中国3个大型ohc的UGC及相关在线用户行为进行了深入分析。我们利用多种社会网络分析方法,为每个OHC构建知识共享网络,研究OHC的演化,发现用户行为特征,揭示每个虚拟社区的突出主题及其关系,揭示所研究的3个OHC的共同特征和不同特征。通过这些案例分析,我们也希望从总体上对中国OHCs的用户行为和UGC提供一些见解。

方法 数据收集

本研究选择在中国有影响力的两家OHCs,米健和甜蜜之家进行分析。本研究选择米健进行分析,是因为该公司是目前中国患者OHC最大的公司。该网站的服务对象是慢性病、重症、罕见病患者,旨在帮助他们缓解心理压力,学习疾病相关健康知识,有效获取医疗资源。本研究选择Sweet Home进行分析,是因为Sweet Home是中国最大的糖尿病患者OHC。该网站提供了医疗咨询、服务指导和情感表达的分类论坛。通过该网站,糖尿病患者不仅可以讨论自己的病情,还可以与全国各地的糖尿病患者进行远程联系和交流。关于本研究中确定的2个焦点OHCs,我们的分析集中在米建网站上的肺癌论坛(LCF)和乳腺癌论坛(BCF),特别是“甜蜜之家”糖尿病咨询论坛(DCF),因为这两种ohc在使用者中非常受欢迎,考虑到乳腺癌和肺癌是世界上两种主要的慢性非传染性疾病,而且中国拥有全球最多的糖尿病患者,这三种疾病对中国患者和整个人群的福祉具有重要意义[ 34 35].

在疾病论坛中,单个对话被称为“线程”(即一个主题)。用户可以回复另一个人的线程,这被称为“回复”。因此,一个用户在论坛上发表的帖子既可以是该用户自己创建的原创帖子,也可以是对另一个用户的帖子的回复。 36].我们从3个重点疾病论坛各自的论坛成立日期(LCF: 2013年11月15日;BCF: 2015年8月25日;DCF: 2005年9月1日)至2020年10月20日。一旦一个帖子被抓取,我们还获得了它的ID、发布时间、阅读数和回复数。然后,我们执行了一系列数据清理操作,包括过滤聊天机器人在这些论坛上自动创建的帖子,并删除缺失的数据。 表1将获得的在线数据集的主要统计数据与同行研究中使用的数据集进行比较[ 20. 24 26 28 30. 37 38],这表明当前分析的规模大大超过了之前所有的努力。

本研究中分析的实验数据集与同行研究中对应数据集的比较。

研究 网站 论坛 线程数 用户数 回复数量
本研究 Mijian [ 11 肺癌论坛 37090年 22610年 254687年
本研究 Mijian [ 11 乳腺癌论坛 112790年 31909年 2123728年
本研究 甜蜜的家[ 12 糖尿病咨询论坛 41060年 26751年 466225年
吴等[ 28一个 壹翔网络[ 13 乳腺癌论坛 754 540 3498
吴等[ 37一个 39健康网络[ 39 乙型肝炎论坛 1066 N/Ac N/A
吴等[ 38一个 贴吧( 15 肿瘤论坛 2009 1476 11940年
史等[ 30.一个 Manyoubang [ 9 糖尿病互助论坛 777 636 3553
王等[ 20.b Breastcancer [ 7 乳腺癌论坛 107549年 49552年 2800000年
王等[ 24b BecomeAnEX [ 8 戒烟 38156年 5435 316886年
德拉·罗莎等人[ 26b Facebook ( 40 多发性硬化症 N/A 24915年 N/A

一个中国的在线健康社区。

b其他国家的在线健康社区。

cN/A:不适用。

社会网络分析

社会网络是由一组社会行动者(如个人和组织)、一组二元关系以及行动者之间的其他社会互动组成的社会结构[ 41].社会网络分析可以帮助识别网络层面的社区结构,以及单个用户层面的个人行为。由于用户既可以是帖子作者,也可以是回复作者,因此本研究采用有向网络结构来建模社区网络。在这样的有向网络中,网络的每条边都是有向的,其中节点的入度是指以该节点结束的有向边的数量。相反,节点的出度是从该节点开始的有向边的数量。一个节点的总度是它的网络邻居的总数,与连接方向无关(即它的入度和出度之和)。

我们对复杂网络进行了拓扑分析[ 41],以探讨各论坛的结构特点。我们的分析分两步进行。首先,我们探讨了每个社交网络的小世界效应。我们将两个节点之间的路径长度作为网络中连接这些节点的最小边数。平均路径长度,也称为特征路径长度,定义为所有可能的网络节点对沿最短路径的平均步数。让 dij 表示两个节点之间的最短距离而且 j在网络中。假设 dij = 0,如果 j j无法从.然后是平均路径长度 l如下:

在哪里 N是网络节点的数量。网络的聚类系数衡量的是网络中节点的聚类程度。假设一个节点 k n相邻相邻节点( N1 N2、…… Nn).2个节点而且 j都用一个链接连接,有向链接记为 eij .节点的局部聚类系数 k定义如下:

假设整个网络都有 K节点总数。网络的平均聚类系数是网络中所有节点聚类系数的平均值,即:

小世界效应,也被称为6度分离,是指所有陌生人都可以通过6个或更少的人联系在一起。 42].Watts等人提出了一个小世界网络模型(WS模型)[ 43,其中小世界网络具有平均路径长度小、聚类系数高的特点。作为量化网络小世界效应的一种通用方法,可以将网络的聚类系数和平均路径长度与具有相同节点数和边数的等效Erdös-Rényi (ER)随机网络进行比较[ 44].为了构造这样一个等价的随机网络,我们采用以下生成过程:设N和M分别为期望生成的网络的节点数和边数。网络被初始化为有N个未连接的节点。在每一步中,我们随机选择并连接一对当前未连接到网络中的节点。我们重复上述步骤,直到所有M条边都添加到网络中。给定生成的随机网络, σ可计算如下:

在哪里为网络的平均聚类系数, l是网络的平均路径长度, Cr 为等效ER随机网络的平均聚类系数, lr 为等效ER随机网络的平均路径长度。如果 σ> 1(如),该网络被认为是一个小世界网络[ 44,在这种情况下,假设知识可以在网络所代表的社区中有效、快速地传播。

其次,我们探讨了社交网络的无标度特性。无标度属性是关于网络的一种结构特征,由Barabási等人介绍[ 45].在科学领域和网络类别中,经常会遇到这样的说法,即大多数或所有现实世界的网络都是无标度的。一般情况下,如果一个网络中节点的比例具有度,则认为该网络是无标度的 k服从幂律分布 P k)= c× k r ,在那里 r> 1。其性质主要包括以下两个方面。首先,节点的分布服从幂律分布,大多数节点的链路数较少,而一小部分节点的链路数较多。在幂律分布中,一个节点具有度的概率 k遵循分布方程 P k)= c× k r ,在那里 c而且 r是网络特定的常数。一般认为,如果网络中节点的度服从幂律分布,则该网络为无标度网络。第二,在网络增长过程中,新节点优先与连接良好的节点建立关系。无标度网络模型通常也称为B-A模型[ 45].

加权知识网络

主题分析技术可用于提取概念性主题,确定主题类型,并分析大型文本语料库中潜在的主题内部结构。在本研究中,我们分析了有关OHCs的健康话题,以确定热点话题及其用户的突出健康信息需求。

我们分两个步骤执行主题分析。首先,我们根据点互信息(PMI)和左右信息熵提取UGC中的关键短语,有效地发现单词之间的共现关系;在这一步中,根据信息论,互信息主要用来衡量两个信号之间的相关程度[ 46],用于衡量两个变量之间的相互依赖程度。在自然语言处理(natural language processing, NLP)中,PMI是用来计算2个词之间的相关程度,从而从统计学的角度发现词的共现,从而检验一对词之间是否存在语义相关或主题相关。2个相邻单词的PMI x而且 y计算公式如下:

在哪里 p x)是单词出现的概率 x出现在所有的线索中,也就是说, p x=单词出现的次数 x/所有线程的总字数; p y)是单词出现的概率 y出现在所有的线索中,也就是说, p y=单词出现的次数 y/所有线程的总字数;而且 p x y的联合概率 x而且 y,表示2个单词( x y)在文本中相邻出现。更高的PMI为 x而且 y与更高的内部聚集和更大的可能性,这两个词形成一个短语。相反,这两个词更有可能有短语界限。

熵是一种与随机变量相关的不确定性度量。更高的熵与更大的潜在信息含量相关,因此不确定性也更高[ 47].在自然语言处理中,单词的左右熵 W定义如下:

在哪里 El 而且 ER 是单词的左熵和右熵吗 W分别; 一个而且 B表示出现在左侧和右侧的所有单词的集合 W分别;而且 一个而且 b表示立即出现在左侧和右侧的单词 W,分别。较大的左熵或右熵与单词的自由度较高相关,这表明围绕给定单词的目标单词有更多的选择 W

其次,以关键字为节点,以关键字对的共现关系为边,构建加权知识网络(weighted knowledge network, WKN) [ 37 48].在此过程中,我们还根据对应关键字的权重以及对应关键字之间的关系强度,对节点和边进行了权重分配。WKN对专题内容的碎片化知识进行了整合和建模,可以有效地发现知识网络的内部关系和整体特征。更具体地说,我们将上面计算的左熵和右熵的PMI值相加,作为2个单词作为一个短语的度量。然后我们提取每个帖子中的关键短语和它们各自的权重,其中关键短语的频率被用作关键短语的权重。我们定义 E作为关键字共现集和 E)作为关联的权重集 E,详情如下:

在上述公式中,if为关键字 k 而且 kj 根据它们在WKN中的共现关系,制定关键短语,然后 eij1;否则, eij0. eij 的重量 eij eij )= n eij ) / N,在那里 n eij )为关键短语在所有短语和中的出现次数 N是所有短语的总数。接下来,将所有检测到的关键短语组织为一个关键字集 K,其中关联的关键字权重集 K)介绍如下:

在哪里 k 是关键字,并且 k )是它的重量。 k )= k ) /,在那里 k )是关键字出现的次数 k 在200个关键短语和是200个关键短语中所有关键字的总数。

现在,我们可以为相关的热含量定义一个WKN模型如下:

根据所构建的WKN模型,结果可以通过社交网络可视化工具进行显示。

结果 描述性统计

表2给出了本研究中分析的热含量数据的描述性统计,其中在预处理过程中除去了极端异常值。就每个线程的读和回复数量而言,数据分布严重不均匀。换句话说,大多数线程的读和回复次数都比较少,只有少数线程的读和回复次数比较多,这意味着大多数用户会优先阅读收到回复次数较多的线程,从而导致两极分化。SD是一组数字的变化量或离散度的度量,这也受到所分析的数据量的影响。变异系数是对数据序列均值附近数据点离散度的统计度量。一般正态分布的变异系数小于1。考虑到中列出的每个属性的较大变异系数 表2根据频率分布图的偏度( SKl = 35.41, SKB = 25.65, SKD =12.45),我们得出结论,它们都不符合正态分布。

本研究分析的3个数据集的统计特征。

数据集和变量 最低 第一季度 中位数 第三季 最大 的意思是 SD 简历一个
肺癌论坛
读取 15 362 758 2043.5 98050年 531.25 1136.88 2.14
回复 0 4 8 16 3405 15.34 31.98 2.08
追随者 0 5 14 49 10127年 54.52 456.76 8.38
线程 1 1 2 5 595 5.84 20.12 3.44
乳腺癌论坛
读取 14 297 504 854 90783年 368.81 719.18 1.95
回复 0 8 15 26 1017 21.47 23.57 1.08
追随者 0 15 46 166 2627 219.26 474.06 2.16
线程 1 1 3. 12 5118 43.34 317.59 4.53
糖尿病咨询论坛
读取 38 812 1203 1813 95905年 1065.60 1342.66 1.26
回复 0 4 8 14 796 11.44 14.99 1.31
追随者 0 0 0 0 466 1.10 7.63 6.93
线程 0 2 4 14 3862 20.60 94.14 4.57

一个CV:变异系数;简历= SD /的意思。

接下来,我们绘制了每个论坛中每个线程读取数的频率分布,如图所示 图1.我们还采用了K-S检验( Hl =0, HB = 0, HD =0),从其结果我们可以确定每个线程的读取数量遵循gamma分布[ 49].当我们绘制每个线程回复数的频率分布时,我们发现它们表现出明显的长尾现象,这表明每个线程的回复数遵循幂律分布。我们进一步发现,每个线程的回复数的对数-对数分布是明显弯曲的,如图所示 图2,据此,我们确定每个线程的回复数遵循指数分布。的拟合指数曲线均大于0.94 (= 0.946,= 0.958,= 0.971)。通过类似的分析过程,我们进一步发现用户所涉及的线程数(= 0.978,> = 0.964,=0.970),用户的关注数(> = 0.989,= 0.962,=0.990)服从幂律分布拟合幂律曲线均大于0.96。

每个论坛(肺癌、乳腺癌和糖尿病咨询)中每个线程的阅读数分布。为了更好的可视化,水平轴只显示每个线程在5000之前的读取数,因为这样的线程几乎不存在。

每个论坛(肺癌、乳腺癌和糖尿病咨询)中每个帖子的回复数的对数分布。

用户活动

我们探讨了每个论坛上的主要用户活动。为了了解社区中的用户粘性,我们分析了在线用户的活动。社区管理人员可以根据这些用户的行为采取不同的策略和激励措施来改善他们的用户体验。 图3显示一周中每天创建的所有帖子(线程加上回复)的百分比。这些论坛有类似的趋势,特别是在LCF和DCF之间。此外,大多数在线问答社区或垂直知识分享社区在工作日比周末更活跃,这可能是由于用户有意识地选择平衡工作和生活。将每周每天的发帖频率按月计算,并绘制箱形图,还可以看出,LCF和DCF中的用户在一周中发帖的频率更高,在一周中比周末更活跃( 多媒体附件1).在DISboards等非在线健康社区中也发现了同样的结论[ 36 50]和天涯社区[ 15 51].

一周中每天所有帖子的百分比。

图4显示一天中每个小时所创建的线程和回复的百分比。在每个论坛中,帖子和回复的数量从凌晨4点开始显著增加。从每个帖子的发布时间来看,BCF的帖子数在上午8点左右达到峰值,在中午下降,然后在晚上9点左右出现第二个峰值。LCF和DCF都在上午10点、下午4点和晚上9点左右出现了3个高峰发帖时刻,下午6点左右出现了最不活跃发帖时刻。此外,相似度较高( ρ= 0.927; PLCF和DCF之间的<.001)在一天中每个小时的相对线程发布频率。3个疾病论坛在中午12点和下午6点左右的帖子数量少于一天中的其他时间,可能是由于这两个时间观察到的午餐和晚餐时间相同。大多数用户从晚饭后的晚上7点开始活跃起来,活跃度在晚上9点再次达到峰值,之后随着睡觉时间的临近,发布的帖子数量逐渐下降。我们还发现LCF和DCF的帖子数量在中餐时间(中午12点和下午6点)前2 - 3小时达到峰值,这可能是因为糖尿病患者更注重饮食来控制血糖。同样,肺癌影响患者的消化功能,可能导致食欲下降。特别是在肺癌晚期,控制和调整饮食是必不可少的。因此,大多数用户都提前咨询了饮食问题,导致帖子数量明显增加。由于乳腺癌患者与其他2种疾病患者的饮食行为不同,BCF的活跃发帖时间与其他2个论坛有所不同。在回复的发布时间方面,我们发现在每个论坛中,每天每个小时的帖子和回复的相对发布频率高度正相关。 表3示Spearman相关检验结果。同样,回复最少的时间是在中午12点和下午6点左右,这也是因为这两个时间段与就餐时间重合。

每天每个小时的线程(A)和应答(B)的百分比。

斯皮尔曼排名相关系数的帖子和回复相对频率在每个论坛在一天的每个小时。

论坛 ρ P价值
肺癌论坛 0.911 <措施一个
乳腺癌论坛 0.914 <措施一个
糖尿病咨询论坛 0.976 <措施一个

一个使用0.01显著性水平(2尾检验)显著相关。

社会网络结构

社会网络结构图直观地展示了网络的节点关系矩阵[ 41]. 表4根据用户在各个论坛上的回复帖子,展示了聚合社交网络的特征。在结构图中,每个节点代表社区中的一个用户,边是用户之间的回复形成的有向链接。3个论坛的平均聚类系数均低于Facebook(0.519)、Flickr(0.313)和LiveJournal (0.330) [ 52].全局聚类系数越高,说明用户之间的联系越紧密,朋友之间更倾向于通过共同的朋友找到彼此。 36].在网络中,用户度是用户的出度和入度之和。在我们的数据集中,由于在数据采集时使用的爬行策略,所有用户都至少有一个线程。在LCF中,39.7%(8968/22,610)的用户的用户度为1;换句话说,超过39%的用户只有一个帖子。在BCF中,51.4%(15886 / 30901)用户的用户度为1,在DCF中,24.7%(6604/ 26751)用户的用户度为1。大部分用户学历相对较低,只有少数用户学历较高。 图5显示了每个论坛的用户度分布,从中我们可以直观地看到每个论坛的度分布遵循幂律分布。为了定量验证这一发现,我们将用户度数作为自变量,将用户数作为因变量来拟合幂律曲线。所得拟合曲线为 y= 3.571 x−1.330=0.9976)为LCF, y= 3.253 x−1.056=0.9946)为BCF,且 y= 3.873 x−1.445=0.9683)为DCF。各论坛幂律曲线的拟合度接近完美,说明各论坛用户度的分布遵循幂律分布和 r>1,进一步说明底层社交网络是典型的无标度网络。许多研究得出了与其他OHCs相同的结论[ 20. 29 53],例如Facebook [ 52和微博[ 54],也是典型的无标度网络。我们还计算了每个论坛的平均聚类系数和等效ER随机网络的平均路径长度。我们随机生成50组等效ER随机网络,根据式(4)计算σ,并计算50组σ的平均值作为最终判断系数。最后的计算结果表明都远大于1 (= 517.15, SDl = 13.31;= 275.23, SDB = 13.02;而且= 525.18, SDD =14.38),表明所有3个论坛都表现出小世界效应。

每个聚合社会网络的特征。

特征 肺癌论坛 乳腺癌论坛 糖尿病咨询论坛
节点数量 22610年 31909年 26751年
边数 183175年 739620年 223077年
平均节点度 8.10 23.179 8.34
网络直径 10 8 11
平均聚类系数 0.130 0.179 0.130
平均路径长度 3.494 3.011 3.967
高级用户百分比一个 3.1% (697/22,610) 9.1% (2906/31,909) 2.6% (697/26,751)
低学历用户的百分比b 66.6% (15050/22610) 67.0% (21382/31909) 49.3% (13057/26751)

一个度大于或等于100的用户百分比。

b度小于或等于5的用户百分比。

每个聚合社交网络用户的总学位分布。(A)肺癌论坛(LCF);(B)乳腺癌论坛;糖尿病咨询论坛(DCF)。

接下来,我们分析了这3个社交网络从成立之初的动态演化特征(LCF: 11月15日,2013;BCF: 2015年8月25日;DCF: 2005年9月1日至2020年( 多媒体附件2).结果表明,自LCF创建以来,节点和边的数量逐年增加。随着社区的发展,用户数量逐渐增加,用户行为也更加活跃。自2015年BCF成立以来,节点数量逐年增加,不断有新用户加入论坛。与此同时,网络中的边数呈现出先增加后下降的趋势,2017年达到峰值。这样的趋势线表明,疾病论坛在2017年达到了最活跃的时期。自2005年DCF创建以来,论坛的节点和边缘数量一直在稳步增加,直到2015年达到顶峰,之后社区的活跃度持续下降,特别是在2018年至2019年期间。论坛用户的“睡眠率”或“流失率”是显而易见的。更具体地说,2019年活跃节点数为2015年的21%(943/4510),而活跃边数仅为2015年的5%(2731/55,741),这两个统计数据都表明论坛处于明显的衰退阶段。

使用wkn分析UGC

由于2020年COVID-19疫情的爆发及其对OHCs用户行为的可能影响,我们将观测窗口分为2个时期(一个在2020年1月1日之前,另一个在2020年1月1日之后)。通过比较这两个时期的用户行为,我们分析了UGC是否因为疾病爆发而发生了明显的变化。我们从三个论坛的UGC中提取了前200个关键短语。在预处理中,我们首先根据同行文献过滤掉没有事实信息的关键词,以及合并的同义词关键词[ 25 37].对于每个论坛,我们随后根据前面讨论的WKN模型的构建方法构建了相应的WKN。 图6- 8显示每个论坛的工作网点结果( 多媒体详细图片)。WKN中关键字的节点越大,该关键字的权重就越大,意味着该关键字受到的关注越多。应用该标准,我们在每个论坛中检测到重要的关键字,例如,根据LCF中的关键字“治疗”和“化疗” 图6A.两个关键字之间的连接链接颜色越深,这两个关键字之间的共现频率越高。例如,关键字“target”在LCF中最常与关键字“treatment”同时出现;因此,这些节点之间的连接链接在论坛对应的WKN中颜色最深,如图所示 图6a .关键字的密集连接表示该关键字在句子中与许多其他关键字同时出现,例如,根据LCF中的关键字“treatment”和“patients” 图6一个。

为肺癌论坛构建了两个单独的加权知识网络,用于分析阶段(A) 2013年11月15日至2020年1月1日,(B) 2020年1月1日至2020年10月20日。

根据PubMed文献中OHC信息的分类,主题特征分类策略主要有8大类,分别为“病因与病理知识”、“诊断与检查”、“治疗”、“疾病管理”、“并发症”、“社会生活”、“疾病预防”、“教育与研究”[ 55].根据这8种分类策略,判断3个疾病论坛关键词的分类类别,并对话题分布进行宏观分类,从而更清晰、快速地确定内容中讨论的热点话题。200个关键短语中有400个关键字。LCF中,“疾病治疗”(145/400,36.3%)包含“治疗”、“化疗”等关键词;“检查诊断”(118/400,29.5%)包含“检查”、“确诊”、“检测”等关键词;“社会生活”(38/400,9.5%)包含“生病的朋友”、“生活”等关键词。BCF中,“疾病治疗”(128/400,32.0%)包含“治疗”、“化疗”等关键词;“检查诊断”(119/400,29.8%)包含“检查”、“确诊”等关键词;“社会生活”(58/400,14.5%)包含“姐妹”、“食物”、“运动”等关键词。在DCF中,“疾病治疗”(155/400,38.8%)包含“控制”、“治疗”、“注射”等关键词;“检查诊断”(115/400,28.8%)包含“检查”、“确诊”、“高血糖”等关键词;“社交生活”(31/400,7.8%)包含“食物”、“运动”、“生病的朋友”等关键词。可以看出,这3个论坛的主题分别是“疾病治疗”、“检查诊断”和“社会生活”。然而,我们注意到,在所有三个论坛中,与疾病预防相关的话题很少被讨论。 表5显示了出现在每个论坛的前10个关键词,主要集中在疾病治疗和诊断上。鉴于米建的目标用户是确诊后的患者,论坛用户更倾向于讨论疾病治疗和检查的话题。具体而言,在米健两个论坛(LCF和BCF)上,用户普遍更关注疾病复查、转移、复发、抗癌药物、药物副作用等话题。在BCF和DCF中,用户更关注健康饮食、运动和疾病管理等主题。

3个论坛的前10个关键词。

肺癌论坛热门关键词 乳腺癌论坛热门关键词 糖尿病咨询论坛热门关键词
2020年1月1日前 治疗,患者,化疗,肿瘤,肺癌,父亲,母亲,确诊,手术,检查 乳腺癌、患者、治疗、肿瘤、化疗、癌症、手术、影响、检查和转移 血糖、对照、胰岛素、断食、治疗、正常、检查、糖尿病、患者、检测
2020年1月1日至10月20日 治疗,患者,化疗,肿瘤,发现,父亲,效果,母亲,肺癌,和病情 乳腺癌,患者,治疗,肿瘤,化疗,发现,影响,增加,手术,检查 血糖、对照、胰岛素、断食、治疗、正常、检查、糖尿病、患者、检测

根据 图6A, 2020年1月1日前LCF上的热点话题,主要集中在肺癌治疗、检查诊断、社会生活等方面。LCF中最突出的主题是疾病治疗,因为这个主题的权重最大。这一类别主要关注的主题包括“肺癌治疗”、“化疗”、“手术治疗”、“药物治疗”和“治疗效果”等关键词。与治疗最相关的话题是检查和诊断,包括“肺痛”和“咳嗽症状”等关键词,说明用户讨论了检查和诊断内容,以及肺癌的治疗。自我网络包括一个被称为自我的焦点节点,以及与自我直接相连的节点,称为祭坛,其边缘显示自我与祭坛之间或祭坛之间的链接。自我网络中的每一个角色都可以有自己的自我网络,所有的自我网络结合起来就形成了社会网络。红色的节点 图6以“父亲”和“母亲”为关键词,构建2个自我网络。我们发现“母亲”、“父亲”、“确诊”、“复查”和“手术”这些关键词之间存在共现关系,而且它们出现在同一条线索中,这意味着许多用户可能是为父母咨询和交流在线健康信息的儿童。在BCF中,2020年1月1日之前的热点话题主要集中在乳腺癌治疗、社会生活、检查诊断、疾病管理等因素,如图所示 图7A、用户主要集中在乳腺癌的治疗和化疗,如内分泌治疗和治疗效果。绿色的节点 图7A为“孩子”这个关键词建立一个自我网络。我们发现关键字与“结果”相关,而“健康”与“儿童”相关。由于乳腺癌的特殊性,患者会考虑一些特殊的因素,如下一代的健康状况。使用不同的节点颜色来更清晰地区分特定关键字的自我网络。由于其他节点的自我网络没有明显的特征结果,本文只讨论具有特征结果的节点的自我网络。在DCF ( 图8), UGC主要集中在糖尿病的控制和管理、疾病治疗、检查和诊断以及社会生活等主题,包括“血糖控制”和“饮食控制”等关键词。同时,糖尿病的检查和诊断多与疾病管理相关。在 图6B和7B,黄色节点构成了关键字“COVID-19”的自我网络,与“感染”、“缓解”、“确诊”和“影响”等关键字相关。癌症患者是COVID-19的易感人群之一,他们更容易出现COVID-19并发症[ 56并且容易在暴露于COVID-19后发生严重事件,如入住重症监护室或死亡。因此,他们应该更加注意自我保护和保持社交距离。自2020年以来,在LCF和BCF中,用户在讨论医疗问题时倾向于提及与covid -19相关的事项。与此同时,其他关键话题的相对提及频率没有明显变化。鉴于2020年之后DCF上的帖子很少(只有130个),没有观察到明显的主题变化,无法就参与者对COVID-19的反应得出任何定性结论。因此,没有区别。

为乳腺癌论坛构建了两个单独的加权知识网络,用于分析阶段(A) 2015年8月25日至2020年1月1日,以及(B) 2020年1月1日至2020年10月20日。

为糖尿病会诊论坛全程(2005年9月1日- 2020年10月20日)构建的加权知识网络。

讨论 主要研究结果

本研究对中国3家大型ohc的UGC及相关在线用户行为进行了深入分析。我们运用多种社会网络分析方法,为每个OHC构建知识共享网络,研究相应网络社区的演化规律,发现用户行为特征,揭示虚拟社区共享的突出话题及其关系。

由于中国现有的OHCs研究只研究了一个小规模的单一疾病论坛,如 表1,即数据集数量小于2000个线程,小于10000个回复[ 28 30. 37 38],其规模明显小于在西方国家进行的分析[ 20. 24 26],严重影响了分析结果的可靠性和全面性。为了满足需求和填补空白,我们从中国最受欢迎的2个OHCs中选择了3个具有代表性的疾病论坛进行了深入和广泛的研究。通过对8万多名用户、19万多条线程和280多万条回复的抓取,揭示了这些论坛中用户行为和UGC的共同特征和独特特征,可以更好地支持我们的研究结果,并代表中国OHCs的整体特征。结果将在下面详细讨论。

首先,我们发现这3个疾病论坛的数据是两极分化的,底层的数据分布肯定是不均匀的。在这些疾病论坛中,每个线程的读取数遵循gamma分布( Hl =0, HB = 0, HD =0),每个线程的回复数呈指数分布(= 0.946,= 0.958,= 0.971)。然而,用户所涉及的线程数(= 0.978,= 0.964,=0.970),用户的关注数(= 0.989,= 0.962,=0.990)均服从幂律分布。

其次,用户在工作日比周末更活跃。以上3个论坛的发帖频率和回复频率在一天中各小时间呈高度正相关。特别是,LCF和DCF表现出较高的时间相似性( ρ= 0.927; P<.001),即每天每个小时的帖子发布频率。从凌晨4点开始,讨论数和回复数显著增加,下午12点和6点左右,每个论坛的发帖数相对较少。由于肺癌患者和糖尿病患者都需要注意饮食,因此LCF和DCF的贴文数在中餐时间(中午12点和下午6点)前2、3小时出现峰值。

此外,研究显示,所有三个论坛都具有小世界效应(= 517.15, SDl = 13.31,= 275.23, SDB = 13.02,= 525.18, SDD =14.38)和无标度特征,用户度服从幂律分布(= 0.997,= 0.994,=0.968),而全球聚类系数均低于国际同行。根据社区网络的动态趋势,证明LCF仍处于发展阶段,BCF需要激发“僵尸用户”的活跃度,DCF需要吸引更多的新用户,提高用户留存率。

最后,我们发现,在上述3个疾病论坛中,疾病治疗、疾病检查、诊断、社会生活等几个热点话题是共同分享的。与治疗最相关的话题是检查和诊断,许多孩子在LCF中为父母咨询相关信息。在BCF中,用户更关注下一代的健康,而在DCF中,用户更关注血糖检测和饮食控制。此外,我们注意到,在LCF和BCF中,用户在讨论2020年疾病爆发后的医疗问题时,都倾向于提及与covid -19相关的事项。

限制

本文有一些局限性。一方面,虽然本研究选择了中国2个有影响的OHCs(米建和甜蜜之家)进行分析,但分析结果不能推广到所有中国OHCs。另一方面,本文只关注了整体社会网络结构的特征,没有区分用户和用户角色之间的强弱联系。同时,本研究只分析了1个用户的主题内容,没有考虑回复和一个帖子的主题类型。因此,后续研究应尝试对用户之间的连接边增加权重,研究用户在社交网络中的影响,或研究不同时期的主题变化。

结论

我们的研究结果揭示了中国OHCs的社交网络、用户行为和UGC的基本特征。利用OHCs中的UGC和相关的在线用户行为作为重要的信息来源,可以洞察个人和人群的健康状况,有利于用户了解不同论坛的热点话题,获得健康管理知识。尽管ohc在中国正在发展,但采取措施提高用户的留存率和活跃度,增加用户粘性,分析用户行为,挖掘论坛内容主题是必不可少的。更好地挖掘潜在内容,为用户提供有用的信息和知识是很重要的。总之,我们的研究不仅有助于理解OHCs的不同特征,而且有助于发现各个论坛的突出主题和这些主题之间的潜在关系。因此,有效、及时和一致地挖掘和利用内容可以为卫生提供者和政策制定者提供更有价值的证据。

按月显示每周每天的张贴频率的箱形图。

不同年份社会网络的动态演化特征。

图6-8详细图片

缩写 供应量

乳腺癌论坛

贴现

糖尿病咨询论坛

Erdos-Renyi

疲劳性能

肺癌论坛

NLP

自然语言处理

OHC

在线健康社区

采购经理人指数

点互信息

用户原创内容

用户生成内容

WKN

加权知识网络

中国科技部科技计划项目(no . 2020AAA0106302)、国家自然科学基金项目(no . 61876150和12026609)、西安市科技计划项目(no . XA2020-RKXYJ-0105)资助了本研究。

没有宣布。

李互联网+:总理的新科技工具 中华人民共和国国务院 2021-01-10 http://english.www.gov.cn/premier/news/2015/03/13/content_281475070887811.htm Maloney-Krichmar D 泼里斯 J 在线健康社区的社交性、可用性和社区动态的多层次分析 ACM反式。Comput.-Hum。交互 2005 06 12 2 201 232 10.1145/1067860.1067864 开放医疗保健联盟 2021-01-10 https://www.omaha.org.cn 进一步改善医疗服务行动计划(2018-2020年) 中华人民共和国国家卫生健康委员会 2021-01-10 http://www.nhc.gov.cn/yzygj/s3594q/201801/9df87fced4da47b0a9f8e1ce9fbc7520.shtml Patientslikeme公司 2021-01-10 https://www.patientslikeme.com/ MyHealthTeams 2021-01-10 https://www.myhealthteams.com/ Breastcancer.org 2021-01-10 https://www.breastcancer.org/ BecomeAnEX 2021-01-10 https://www.becomeanex.org/ Manyoubang 2021-01-10 http://www.manyoubang.com/ 亿祥网络 2021-01-10 http://www.yx129.com/ Mijian360 2021-01-10 http://www.mijian360.com/ 甜蜜之家糖尿病论坛 2021-01-10 http://bbs.tnbz.com/ 淋巴瘤的家 2021-01-10 https://www.house086.com/ 天涯社区 2021-01-10 https://bbs.tianya.cn/ Tieba.baidu 2021-01-10 https://tieba.baidu.com/ 2021-01-10 https://www.zhihu.com/ Smailhodzic E Hooijsma W Boonstra 一个 兰利 DJ 社交媒体在医疗保健中的使用:对患者及其与医疗保健专业人员关系的影响的系统回顾 BMC运行状况服务决议 2016 08 26 16 1 442 14 10.1186 / s12913 - 016 - 1691 - 0 27562728 10.1186 / s12913 - 016 - 1691 - 0 PMC5000484 动向 Z 中国在线健康社区的研究现状综述 情报工作 2018 62 09 134 142 10.13266 / j.issn.0252-3116.2018.09.016 J G X 网络医疗卫生研究综述:热点、主题演变与研究内容 数据分析与知识发现 2019 3. 4 2 12 10.11925 / infotech.2096-3467.2018.1063 X K N 分析和预测在线健康社区的用户参与:一个社会支持的视角 J医疗互联网服务 2017 04 24 19 4 e130 10.2196 / jmir.6834 28438725 v19i4e130 PMC5422656 X 年代 Z 程ydF4y2B一个 X 在线健康社区的知识共享动机:卫生专业人员和正常用户的比较研究 计算机在人类行为中的应用 2017 10 75 797 810 10.1016 / j.chb.2017.06.028 费尔南德斯 摩门教 Calado C Araujo 中科院 社会网络和健康实践:糖尿病在线社区对坚持治疗的影响 Cien Saude Colet 2018 10 23 10 3357 3368 10.1590 / 1413 - 812320182310.14122018 30365855 s1413 - 81232018001003357 Y 在线医疗社区患者医疗信息共享意愿影响因素研究 Wanfangdata 2015 2021-10-19 https://d.wanfangdata.com.cn/thesis/ChJUaGVzaXNOZXdTMjAyMTA1MTkSB0Q3NTQxNDYaCGRqZG50NjNo X K 年代 阿玛托 女士 科恩 皮尔森 莱托 Papandonatos GD 格雷厄姆 艾尔 挖掘在线戒烟社区中的用户生成内容以识别吸烟状态:一种机器学习方法 Decis支持系统 2019 01 116 26 34 10.1016 / j.dss.2018.10.005 31885411 PMC6934371 B X 网络健康社区主题特征研究 情报工作 2015 59 12 One hundred. 105 10.13266 / j.issn.0252-3116.2015.12.015 德拉罗萨 年代 F Facebook群组中的健康话题:多发性硬化症社区帖子的内容分析 Interact J medical Res 2019 02 11 8 1 e10146 10.2196/10146 30741640 v8i1e10146 PMC6388097 Bi l 埃文斯 R Z 年代 W C 确定中国在线健康社区中白化病的话题演变和情感极性:机器学习和社会网络分析 JMIR Med Inform 2020 05 29 8 5 e17813 10.2196/17813 32469320 v8i5e17813 PMC7293058 J l 在线健康社区知识共享网络与用户知识交互研究 信息科学 2017 35 3. 144 151 10.13833 / j.cnki.is.2017.03.026 K X 年代 科恩 Papandonatos GD 阿玛托 女士 皮尔森 莱托 格雷厄姆 艾尔 在线戒烟健康社区的多关系社会网络分析 J医疗互联网服务 2016 08 25 18 8 e233 10.2196 / jmir.5985 27562640 v18i8e233 PMC5016624 J B l 健康问答社区用户知识共享网络动态演化研究 信息科学 2019 2 37 02 77 82 10.13833 / j.issn.1007-7634.2019.02.013 Y Y J J P 从不同利益相关者的角度理解医疗保健社交媒体的使用:对在线医疗社区的内容分析 J医疗互联网服务 2017 04 07 19 4 e109 10.2196 / jmir.7087 28389418 v19i4e109 PMC5400888 Y 多诺万 E 在线健康社区中癌症意见领袖传播行为的阐述:网络与内容分析 社交媒体+社会 2020 04 02 6 2 205630512090947 10.1177 / 2056305120909473 威利斯 E Royne MB 在线健康社区与慢性疾病自我管理 健康Commun 2017 03 24 32 3. 269 278 10.1080 / 10410236.2016.1138278 27218836 布雷 F Ferlay J Soerjomataram 西格尔 RL 托瑞 Jemal 一个 2018年全球癌症统计:GLOBOCAN估计了185个国家36种癌症的发病率和死亡率 CA癌症J临床 2018 11 12 68 6 394 424 10.3322 / caac.21492 30207593 Ogurtsova K 罗恰·费尔南德斯 J Y Linnenkamp U Guariguata l N 卡文 D J Makaroff l IDF糖尿病地图集:2015年和2040年全球糖尿病患病率估计 糖尿病治疗临床实践 2017 06 128 40 50 10.1016 / j.diabres.2017.03.024 28437734 s0168 - 8227 (17) 30375 - 3 Z 钱德勒 H H 基于社会化网络论坛的知识共享活动分析——以DISboards为例 IEEE反式。大数据 2018 12 1 4 4 432 446 10.1109 / tbdata.2017.2749307 J Y 年代 基于加权知识网络的在线健康社区知识发现 数据分析与知识发现 2019 3. 2 108 117 10.11925 / infotech.2096-3467.2018.0619 J l 基于社会网络分析的在线健康社区用户交互行为研究 信息科学 2017 35 07 120 125 10.13833 / j.cnki.is.2017.07.021 39健康网络 2021-01-10 http://www.39.net 脸谱网 2021-01-10 https://www.facebook.com 社交网络 维基百科 2021-01-10 https://en.wikipedia.org/wiki/Social_network 米尔格拉姆 年代 小世界问题 今日心理学 1967 1 1 61 67 美国瓦茨 DJ 上海 “小世界”网络的集体动态 自然 1998 6 393 6684 440 442 10.1038/30918 汉弗莱斯 医学博士 格尼 K 网络“小世界性”:确定规范网络等价性的定量方法 《公共科学图书馆•综合》 2008 04 30. 3. 4 e0002051 10.1371 / journal.pone.0002051 18446219 巴巴斯 艾尔 艾伯特 R 随机网络中尺度的出现 科学 1999 10 15 286 5439 509 12 10.1126 / science.286.5439.509 10521342 7898 Loeckx D Slagmolen P 梅斯 F Vandermeulen D Suetens P 使用条件互信息的非刚性图像配准 IEEE跨医学成像 2010 01 29 1 19 29 10.1109 / TMI.2009.2021843 19447700 香农 CE 印刷英语的预测与熵 贝尔系统技术杂志 1951 30. 1 50 64 10.1002 / j.1538-7305.1951.tb01366.x 西 Y 见鬼 Y 基于加权知识网络的个人知识存量表示与度量方法 中国管理杂志 2007 3. 4 1 28 31 10.3969 / j.issn.1672 - 884 x.2007.01.005 卡拉达ğ O Aktaş 年代 广义伽玛分布拟合优度检验 AIP会议记录 2016 6 1738 1 480119 10.1063/1.4952355 卸载 2021-01-10 https://www.disboards.com 永亮 Z Xijin T 基于天涯论坛的网络行为分析 系统科学与数学科学杂志 2015 35 2 129 141 10.12341 / jssms12525 梅丝洛夫 一个 Marcon Gummadi PK Druschel P 保护好 B 在线社交网络的测量和分析 IMC '07:第七届ACM SIGCOMM互联网测量会议论文集 2007 第七届ACM SIGCOMM互联网测量会议 2007年10月24-26日 圣地亚哥,加利福尼亚州,美国 29 42 10.1145/1298306.1298311 杜兰特 KT 麦克雷 赛峰集团 C 在线黑色素瘤讨论组的社交网络分析 Summit Transl Bioinform 2010 03 01 2010 6 10 21347134 Y Z l H D 基于幂律分布的社会网络学科分析 计算机工程 2015 41 7 299 304 10.3969 / j.issn.1000-3428.2015.07.057 J Y 基于社交问答日志的用户术语可视化分析 信息处理与管理 2013 9 49 5 1019 1048 10.1016 / j.ipm.2013.04.003 W W Y H 程ydF4y2B一个 Z Y X 程ydF4y2B一个 R C T C l 程ydF4y2B一个 P l W J C l B 年代 Z J Y l H Lei C Y l Y Y P J J 程ydF4y2B一个 Z G Z 年代 J C 年代 l F 年代 J N N J 中国新冠肺炎医疗专家组 中国1590例COVID-19患者的共病及其影响:全国分析 呼吸呼吸J 2020 05 55 5 2000547 10.1183/13993003.00547 -2020 32217650 -2020 - 13993003.00547 PMC7098485
Baidu
map