医学互联网研究杂志-利用Reddit了解精神健康障碍患者所经历的书面沟通挑战:来自精神健康社区的文本分析

原始论文

美国犹他州盐湖城犹他大学医学院生物医学信息系

通讯作者:

阿尔伯特·帕克博士

生物医学信息系

医学院

犹他大学

瓦卡拉路421号140号

盐湖城，德州，84108-3514

美国

电话:1 206 743 7843

传真:1 801 581 4297

电子邮件:alpark1216@gmail.com

背景:抑郁症、双相情感障碍和精神分裂症等精神障碍很常见，会使人丧失行动能力，并有可能致命。尽管精神障碍普遍且严重，但我们对与之相关的日常挑战的知识相对有限。与日常挑战相关的最受研究的缺陷之一是语言障碍，但我们不知道精神障碍如何影响常见的书面交流形式，例如社交媒体。

摘要目的:这项研究的目的是调查在线心理健康社区中抑郁症、双相情感障碍和精神分裂症的书面交流挑战，以及参与这些在线心理健康社区对书面交流的影响。作为对照，我们选择了三个专注于积极情绪、锻炼和体重管理的在线健康社区。

方法:我们考察了词汇多样性和可读性，这两个都是衡量写作质量的重要特征。我们使用了四个公认的可读性指标，考虑词频和句法复杂性来衡量作者的书面沟通能力。然后，我们通过计算帖子中独特单词的百分比来衡量词汇多样性。为了比较社区间的词汇多样性和可读性，我们首先采用了两两独立的样本t测试，然后是P值调整使用预先指定的Hommel程序调整多重比较。为了衡量这些变化，我们对每个成员的交互序列的可读性和词汇多样性得分应用线性最小二乘回归，然后使用成对独立的样本t测试和P值调整。考虑到成员的大样本，我们还报告了成对比较的效应量和95% ci。

结果:平均而言，与其他三个在线健康社区相比，抑郁症、双相情感障碍和精神分裂症社区的成员表现出难以表达自己想法的迹象。我们的研究结果还表明，参与这些平台有可能提高成员的书面交流。例如，与专注于积极情绪的OHC成员相比，所有三个心理健康社区的成员在词汇多样性和可读性方面都有统计上的显著改善。

结论:我们为患有抑郁症、躁郁症和精神分裂症的人所面临的书面交流挑战提供了新的见解。与其他三个在线健康社区的比较表明，心理健康社区的书面交流明显更难阅读，同时词汇的多样性也明显较低。我们提供实用的建议，利用我们的发现在网络交流环境中，以提高成员的交流经验。我们认为这些发现是理解和解决精神障碍患者日常书面交流挑战的重要一步。

中国医学网络杂志，2018;20(4):e121

doi: 10.2196 / jmir.8219

关键字

心理健康；抑郁症；重度抑郁症；抑郁症；双相情感障碍；双相；双相情感障碍及相关障碍；精神分裂症；分裂型人格障碍；精神分裂症谱系和其他精神障碍；消费者健康信息；信息学；信息科学；社会支持；心理支持系统；社区网络；自助小组；传播媒体

精神障碍很常见，使人丧失行动能力[1]，并解释了多年来生产力的损失[2］．此外，严重的精神障碍[3.]例如抑郁[4]、双相情感障碍[5]，以及精神分裂症[6有可能致命，因为自杀的风险增加了。尽管精神障碍普遍且严重，但我们对与这些疾病相关的日常挑战的了解相对有限，特别是与许多身体疾病相比。

对于患有抑郁症、躁郁症和精神分裂症的人来说，与日常挑战相关的最受研究的缺陷之一是语言障碍[7-12］．长期以来，这些精神疾病的研究人员一直怀疑语言障碍是因为额叶功能的缺陷[10，13)，它同时控制着情绪调节和语言处理。语言障碍通常是通过一个人在语义处理任务中的表现来衡量的(即，确定一个单词、短语或类别之间的语义关系[14-16]或区分真假词[17，18]基于个体的语义网络[19])和语言流利性任务(即从音素或语义类别中产生单词[20.-22])。尽管语言在日常生活中很重要，但这些研究并没有说明与语言障碍相关的日常挑战。此外，由于样本量小，可泛化性仍不确定[7，8]，在语言障碍或额叶活动方面的结果不一致[10，23，24］．

尽管语言障碍有可能导致毁灭性的残疾，但目前尚不清楚语言障碍在常见的书面交流形式(例如社交媒体交流)中是如何表现的。随着科技的日益普及，写作的机会也越来越多。例如，2015年，84%的美国成年人使用互联网[25]，而互联网最常见的用途之一是书面交流[26，包括在社交媒体上的交流。近三分之二的美国成年人使用社交媒体，比十年前增长了大约十倍。27］．例如，Reddit内的一些社交媒体平台和在线心理健康社区已经成为精神障碍患者的热门场所[28］．Reddit支持一次性和无法识别的账户，这可以保护用户免受有关精神障碍的社会歧视[29-31]并允许在Facebook等其他社交媒体网站上可能不合适的诚实讨论[32］．Reddit还提供上下文信息，这在其他流行的社交媒体平台(如Twitter)中是相对有限的，因为长度限制。

众所周知，对于患有抑郁症和双相情感障碍的人来说，通过写作来表达思想等费力的任务(即需要注意力的任务)比自动的任务(即不需要注意力的任务)更难，而对于精神分裂症患者来说，这两种类型的任务同样困难[33，34］．从之前关于精神障碍的研究和Reddit [30.，35-37]，我们可以推断，患有精神障碍的个体也经常进行书面交流，但在线精神健康社区中个体面临的书面交流挑战仍然未知。

检查写作的重要特征为评估成员的书面沟通技能和任何相关的语言挑战提供了机会。例如，一项关于写作质量的研究使用词汇多样性、句法复杂性和词频等语言特征来预测写作质量[38］．在不同的研究中，阅读的便利性(即书写简单明了)[39]以及与语篇流相关的语篇衔接[40]被认为是写作质量的一些最具决定性的特征。

我们可以研究这些特征来评估在线心理健康社区成员的书面交流挑战。更具体地说，帖子中的词汇多样性和可读性差可能是语言障碍的标志。对语言障碍的研究表明，词汇多样性明显减少与特定语言障碍有关[41］．同样，句子结构差，组织和表达思想有困难，可被描述为可读性不足[42]，也与语言障碍有关[43］．

在传播学领域，可读性度量已经被研究或使用了很长时间[39，44]、教育[45]，以及信息学[46-58]，包括社交媒体写作[58］．可读性指标为读者理解书面文本的难易程度提供了定量估计。通常情况下，它们是通过测量给定文本的语言特征来作为估计的美国年级水平[59］．此外，可读性指标虽然很基本，但考虑了前面提到的与写作质量相关的三个特征中的两个:词频[39，57，59，60]和句法复杂性[38，39，45，57，59-61］．从作者和他们的写作质量的角度来看，可读性指标可以衡量作者以简单直白的方式表达思想的能力。根据可读性度量的开发人员之一的说法，更高的可读性分数可以表明不必要的复杂性[44或者写作挑战，比如组织和表达想法。语言障碍会阻碍作者在使用不那么多样化的词汇时，简单地表达思想的能力。此外，使用这些可读性指标的一个好处是，它们计算简单，应用起来相对简单。因此，我们使用文章的可读性和词汇多样性(即第三个写作质量特征)来代表抑郁症、双相情感障碍和精神分裂症患者的书面沟通挑战。

尽管心理健康和语言障碍已被广泛研究[7-12]，对于社交媒体中表现出的书面交流挑战，以及长期参与在线心理健康社区对抑郁症、双相情感障碍和精神分裂症患者书面交流挑战的影响，我们知之甚少。了解这些人的书面交流挑战对治疗精神障碍、管理在线精神健康社区和开展未来研究具有重要意义。尽管对心理健康的临床、实践和公共政策影响很重要，但据我们所知，利用在线心理健康社区交流的书面交流挑战的调查并不是之前心理健康研究的重点。

我们的目标是通过这项研究填补文献中的这一空白，并解决两个研究问题(RQ):

RQ1:在关注抑郁症、双相情感障碍和精神分裂症的在线心理健康社区中，书面交流的挑战在多大程度上表现出来?作为对照，我们选择了三个在线健康社区(ohc):一个情感挑战较少，两个医疗或技术术语较少。

在线心理健康社区的参与行为(即发帖与其他成员互动)将如何影响成员的书面交流?

社区平台

这项研究的数据包括来自Reddit的几个主题子社区的提交和相关评论，这些子社区被称为subreddits。提交是开始对话的帖子，评论是回复提交或其他评论的帖子。Reddit是一个非常受欢迎的社交媒体平台，2015年的页面浏览量超过825亿次，提交量超过7300万次，来自88700个活跃Reddit子版块的7.25亿次相关评论[62］．除了Reddit的受欢迎程度，Reddit还具有适合保护精神健康社区成员身份的功能(例如，一次性和无法识别的帐户)。因此，我们审查了意见书和意见(的帖子从这里开始保持清晰)来自Reddit，调查患有潜在污名化疾病的人之间的书面交流挑战。

Subreddit选择

据我们所知，R /抑郁症，R /躁郁症和R /精神分裂症是各自精神障碍的最大和最活跃的reddit子版块[63-65］．2017年5月，r/depression活跃8年，订阅用户178,921个[63]， r/bipolar成立于8年前，拥有24,724名用户[64]， r/schizophrenia已有7036个订阅用户，已活跃7年[65］．因此，我们选择了r/抑郁症、r/双相情感障碍和r/精神分裂症作为主要的兴趣社区，以调查在线心理健康社区中个人面临的书面交流挑战。

为了理解r/抑郁、r/躁郁症和r/精神分裂症成员之间书面交流的重要性，我们选择了r/happy [66]， r/loseit [67]和r/健美[68]来控制。我们首先选择了r/happy，这是reddit上一个分享积极想法和快乐故事的版块。截至2017年5月，该版块已经活跃了9年，拥有116,441名订阅用户[66］．大多数ohc成员都经历过情感挑战[69-71从生活或被诊断患有严重疾病的痛苦中解脱出来。然而，我们寻找了一种与精神障碍，尤其是抑郁症没有直接关系的OHC，以帮助确保对照组的书面沟通挑战与精神困扰无关，即使是次要症状。因此，我们选择了Reddit中最大、最活跃、最积极、最关注情感的版块。

我们选择了第二个OHC r/loseit，以提高我们发现的质量。R /loseit是reddit的一个专注于体重管理的子版块，已经有6年的历史了，有425,934个订阅者[67］．我们特意选择了一个没有大量医学或技术术语的社区，因为大量难懂的医学或技术术语会影响帖子的可读性。虽然不可能在没有任何医学或技术术语的情况下选择OHCs，但一项关于r/loseit的研究将社区讨论最多的主题描述为普通的健康信息和管理策略，可以在没有复杂的医学或技术术语(例如，食物、衣服、身体外观、锻炼和卡路里计算)的情况下描述这些主题[72］．此外，与r/happy不同，r/loseit包含了大量的情感支持。73]，这可以表明成员面临着与许多ohc类似的情感挑战。因此，我们选择了Reddit上最大的体重管理社区r/loseit作为第二个对照组。

我们选择了第三个OHC, r/健美，其中成员致力于以激情为中心的活动，锻炼和肌肉发展。健美社区拥有259,743名订阅者，已活跃9年[68］．之前的一项研究表明，在线健身社区的成员会交换相当程度的情感支持(例如，动机支持和比赛准备支持)和信息支持(例如，训练制度和饮食)[74］．健身社区成员之间的一般讨论主题可能与r/loseit成员之间的讨论主题相对相似;然而，就健康相关的目标和习惯而言，这两个群体可能由截然不同的个体组成。因此，我们将Reddit上最大、最活跃的肌肉发展社区r/bodybuilding作为最后一个对照组。

数据

首先，我们使用数据集[75](2007年10月至2015年5月的公开帖子)，由Reddit会员收集和存档，并已用于先前的几项研究[36，76，77］．其次，我们提取了r/抑郁、r/躁郁症、r/精神分裂症、r/快乐、r/失去和r/健美的帖子。我们排除了标记为的帖子(删除］在分析中。第三，我们删除了少于5个单词的帖子，以确保帖子有表达性的内容和思想。在线社区中的许多帖子都很简短——例如，一个词的回答帖子(如“是”和“肯定”)，可以被视为自动任务，而不是费力的任务。这些帖子可能会歪曲结果;因此，我们删除了少于五个字的帖子。第四，为了将我们的调查限制在社区的常规成员(即排除一次性帐户或不频繁成员)，我们将我们的分析限制在特定的reddit子版块中有四个或更多有意义的帖子(即有五个或更多单词的帖子)的成员(即唯一的成员id)。在另一项研究中[78)，一个类似的门槛被用来确定那些还不是定期贡献会员的潜伏者。我们使用类似的阈值来识别常规成员。我们总结了中OHC数据集表1．

本研究报告的研究被犹他大学的机构审查委员会(IRB;伦理委员会;IRB 00076188)根据美国联邦法规45 CFR 46.101(b)中定义的豁免2。

研究问题1:社交媒体中的传播挑战分析

为了了解语言障碍在书面交流中的表现，我们首先衡量文章的可读性。文章的可读性评估作者简单明了地表达观点的能力。为了评估可读性，我们使用Flesch-Kincaid等级［60］，简单测量官样文章(SMOG)指数［59］，雾指数［39),而写公式［61]，这些都是可读性研究中广泛使用的指标[47-56］．尽管可读性指标已被证明是相互关联的[46]，不同的可读性指标仍然可以产生一系列的结果。为了增加结果的可靠性，我们按照先前研究的程序计算了四个可读性指标的平均值[47，48］．此外，我们使用了min-max正常化在我们的分析中，给予每个可读性指标相同的权重(可读性评分从这里开始保持清晰);但是，我们也通过每个可读性度量和归一化前的平均值来报告完整的可读性结果。为了自动执行可读性分析，我们使用了开源Pythontextstat包(79］．

为了计算每个子reddit的可读性得分的平均值，我们首先计算每个成员的可读性得分的平均值，然后计算每个子reddit的平均值。接下来，我们根据特定社区的最小值和最大值，对单个成员的可读性得分平均值进行标准化。这个两步走的过程是为了防止一个多产的成员歪曲一个子reddit的平均值。然后，我们通过计算帖子中唯一单词的百分比(即唯一单词的数量除以总单词数)来测量词汇多样性，使用相同的两步过程，不包括归一化过程。

为了比较不同子reddit的可读性分数和词汇多样性，我们首先进行了两两独立的样本t测试，然后是P使用预先指定的Hommel程序调整值[80]来调整多重比较。鉴于成员样本大，我们还报告了效应量(d)使用科恩d［81]，以及95% CI的两两比较，根据之前的研究建议[82］．效应量解释为d(. 01) =非常小,d(2) =小,d(5) =媒介,d(八)=大,d(1.2)=非常大，并且d(2.0) =巨大的(81，83］．我们使用了开源的R光敏电阻包来测量效应大小[84］．

为了支持我们的发现，我们手动检查了使用可读性分数来衡量沟通挑战的有效性。因为高可读性分数也可以表明语言复杂，句子结构复杂，我们在控制文章长度和可读性分数后，手动分析了随机选择的120篇文章样本(即，每个reddit子版块的20篇文章):60篇文章可读性分数高(即，每个reddit子版块的可读性分数前5%)和60篇文章可读性分数低(即，每个reddit子版块的可读性分数后5%)。此外，我们手动将这些文章分为高可读性组和低可读性组，将可读性分数与人工判断进行比较。

研究问题2:社交媒体中传播随时间变化的分析

为了衡量参与这六个版块的每个成员发布的帖子的可读性和词汇多样性的变化，我们首先计算了每个帖子的可读性得分和词汇多样性。然后，我们根据每个成员的发帖时间来组织每个帖子的可读性得分和词汇多样性。接下来，我们对每个成员的交互序列(即由发布时间决定)应用线性最小二乘回归。我们对交互序列而不是时间进行线性最小二乘回归，因为我们感兴趣的是每次交互所引起的变化，而不是时间。我们报告了可读性分数和词汇多样性的斜率平均值，以反映六个版块中每个成员的整体变化。接下来，我们应用了成对独立样本t试验和Hommel程序。然后，我们报告了效应大小和95% ci，就像我们在RQ1中所做的那样。在这两项分析中，我们还报告了r/happy、r/loseit和r/bodybuilding之间的比较，以加深我们对情感挑战对语言障碍影响的理解。

表1。数据集的摘要。

Subreddit	日期	职位数量	成员人数
r /抑郁	2008年12月至2015年5月	526470年	34685年
r /双相	2010年1月至2015年5月	146328年	5019
r /精神分裂症	2012年10月至2015年5月	22273年	896
r /快乐	2008年1月至2015年5月	70516年	6433
r / loseit	2010年7月至2015年5月	1054949年	46367年
r /健身	2009年8月至2015年5月	724190年	18927年

研究问题1:社交媒体中的传播挑战分析

我们捕捉了(1)四个不同指标衡量的个人可读性得分的平均值和SE，(2)四个指标的平均可读性得分，(3)四个指标的标准化平均可读性得分，(4)词汇多样性，(5)五个社区的帖子总字数(表2)．平均而言，来自r/精神分裂症的帖子被发现是最难阅读的(即标准化可读性得分最高)，其次是r/双相情感障碍、r/抑郁、r/迷失、r/快乐，然后是r/健美。词汇多样性也呈现出类似的趋势。平均而言，来自r/happy的帖子拥有最丰富的词汇，其次是r/健美，r/失去，r/躁郁症，r/精神分裂症，然后是r/抑郁症。图1在六个不同的reddit子版块中展示了平均可读性分数和词汇多样性的散点图。

然后我们进行了两两独立的样本t测试比较可读性分数和词汇多样性的每个子reddit，以了解两个子reddit之间的差异。分reddit之间标准化可读性分数的两两比较显示在表3．

从句法复杂性和词频的可读性来看，r/bodybuilding、r/happy和r/loseit的帖子比r/depression、r/bipolar和r/schizophrenia的帖子要简单得多。当r/happy、r/loseit和r/健美的可读性得分与r/抑郁、r/躁郁症和r/精神分裂症的可读性得分进行比较时，效应值也在中等到巨大之间。表3总结这些发现。

词汇多样性的两两比较结果相似(表4)．来自r/快乐和r/健美的帖子使用的词汇明显比来自r/抑郁、r/躁郁症和r/精神分裂症的帖子更加多样化。效应大小从非常大到巨大不等。来自r/loseit的帖子也有明显更多样化的词汇，与来自三个心理健康版块的帖子相比，具有中等到较大的效应量。来自三个心理健康版块的帖子之间的词汇多样性差异具有非常小到很小的效应值。r/双相情感障碍与r/抑郁症、r/精神分裂症与r/抑郁症之间的词汇多样性差异具有统计学意义;然而，r/躁郁症和r/精神分裂症的帖子没有显著差异。有趣的是，在r/happy和r/loseit的帖子之间，词汇多样性的影响大小也有很大到很大的显著差异。表4总结词汇多样性差异的研究结果。

在我们的手工分析中，我们发现高和低可读性分数的帖子都类似于普通的互联网交流，并且缺乏复杂的写作。然而，我们遇到了一些表达不清楚的帖子，很多都是连用的句子结构。以不充分的表达为指导，我们手动将120篇文章分为高或低可读性组。手工评估在68%的时间里与可读性分数一致(120分中有82分)。在精神健康版块的帖子中，可读性评分和手动评估与对照组相比有更高的一致性。心理健康版块，r/抑郁症，r/躁郁症，r/精神分裂症，分别有80%，80%和90%的一致性。相反，对照版块r/happy, r/loseit和r/bodybuilding的一致性分别为40%，70%和50%。

研究问题2:社交媒体中传播随时间变化的分析

为了了解参与在线心理健康社区对书面交流的影响，我们对交互序列的可读性评分和词汇多样性应用了线性最小二乘回归。

三个心理健康版块的成员在可读性分数(即，负斜率的改善)和词汇多样性(即，正斜率的改善)方面都有所改善。在心理健康版块中，r/躁郁症表现出最大的改善，其次是r/抑郁症和r/精神分裂症的可读性得分。在词汇多样性方面，成员的词汇多样性提高的顺序是r/躁郁症，r/精神分裂症，然后是r/抑郁症。r/bodybuilding组的成员在可读性得分上提高最大，r/loseit组的成员在可读性得分和词汇多样性上也有提高。r/happy的成员只在词汇多样性上有所提高(表5)．

表2。成员之间的沟通挑战。变量报告为可读性得分的平均值(SE)，可读性得分的标准化平均值，词汇多样性，以及每个社区帖子的总字数。雾霾:官样文章的简单衡量标准。

Subreddit	Flesch-Kincaid 平均等级(SE)	烟雾指数, 意思是(SE)	射击雾指数, 意思是(SE)	Linsear写公式, 意思是(SE)	四个指标, 意思是(SE)	四个指标, 归一化意思是(SE)	词汇多样性, 意思是(SE)	总数量帖子里的文字，意思是(SE)
r /快乐	4.83 (0.03)	1.61 (0.02)	16.76 (0.03)	5.22 (0.02)	7.11 (0.02)	0.06 (0.0003)	0.93 (0.001)	29.10 (0.25)
r /健身	5.03 (0.02)	1.92 (0.01)	17.21 (0.02)	5.90 (0.01)	7.51 (0.01)	0.05 (0.0001)	0.92 (0.0003)	34.01 (0.16)
r / loseit	4.83 (0.01)	2.90 (0.01)	16.76 (0.01)	6.06 (0.01)	7.64 (0.01)	0.08 (8.3 e-05)	0.88 (0.0003)	52.37 (0.16)
r /抑郁	5.53 (0.01)	3.74 (0.01)	17.05 (0.01)	6.69 (0.01)	8.25 (0.01)	0.09 (0.0001)	0.84 (0.0004)	76.24 (0.29)
r /双相	5.88 (0.03)	3.92 (0.02)	17.80 (0.03)	6.72 (0.03)	8.58 (0.02)	0.13 (0.0004)	0.85 (0.001)	69.76 (0.62)
r /精神分裂症	6.67 (0.08)	4.17 (0.07)	18.55 (0.08)	7.26 (0.09)	9.16 (0.06)	0.16 (0.001)	0.85 (0.002)	72.10 (1.65)

表3。成对t测试四个指标的标准化平均分。

Subreddit比较(按可读性得分排序)		t价值	P价值	调整P值(鞍环)	95%可信区间	效应量(d）
r /精神分裂症
	对r /双相	22.52	<措施	<措施	0.03 - -0.03	0.97(大-很大)
	对r /抑郁	52.70	<措施	<措施	0.07 - -0.07	3.18(巨大的)
	对r / loseit	62.71	<措施	<措施	0.08 - -0.08	4.43(巨大的)
	对r /快乐	68.90	<措施	<措施	0.09 - -0.09	3.46(巨大的)
	对r /健身	81.41	<措施	<措施	0.10 - -0.11	5.64(巨大的)
r /双相
	对r /抑郁	85.94	<措施	<措施	0.04 - -0.04	1.70(非常大-巨大)
	对r / loseit	116.99	<措施	<措施	0.05 - -0.05	2.62(巨大的)
	对r /快乐	116.71	<措施	<措施	0.06 - -0.06	2.26(巨大的)
	对r /健身	169.66	<措施	<措施	0.07 - -0.08	3.64(巨大的)
r /抑郁
	对r / loseit	92.43	<措施	<措施	0.01 - -0.01	0.67(中大)
	对r /快乐	71.60	<措施	<措施	0.02 - -0.02	1.08 (large-very large)
	对r /健身	222.10	<措施	<措施	0.04 - -0.04	1.90(非常大-巨大)
r / loseit
	对r /快乐	32.69	<措施	<措施	0.01 - -0.01	0.55(中大)
	对r /健身	163.41	<措施	<措施	0.02 - -0.02	1.39(非常大-巨大)
r /快乐
	对r /健身	43.57	<措施	<措施	0.01 - -0.01	0.74(中大)

表4。成对t词汇多样性测试。

Subreddit比较(按可读性得分排序)		t价值	P价值	调整P值(鞍环)	95%可信区间	效应量(d）
r /快乐
	对r /健身	20.83	<措施	<措施	0.01到0.01	0.30(中小)
	对r / loseit	80.58	<措施	<措施	0.05到0.05	0.89(大-很大)
	对r /双相	80.04	<措施	<措施	0.08到0.08	1.57(非常大-巨大)
	对r /精神分裂症	36.89	<措施	<措施	0.08 - 0.09	1.80(非常大-巨大)
	对r /抑郁	143.16	<措施	<措施	0.09到0.09	1.42(非常大-巨大)
r /健身
	对r / loseit	84.41	<措施	<措施	0.03到0.03	0.66(中大)
	对r /双相	74.10	<措施	<措施	0.06到0.07	1.40(非常大-巨大)
	对r /精神分裂症	31.70	<措施	<措施	0.06到0.07	1.54(非常大-巨大)
	对r /抑郁	163.08	<措施	<措施	0.08到0.08	1.30(非常大-巨大)
r / loseit
	对r /双相	36.78	<措施	<措施	0.03到0.03	0.59(中-大)
	对r /精神分裂症	16.09	<措施	<措施	0.03到0.04	0.64(中大)
	对r /抑郁	100.61	<措施	<措施	0.04 ~ 0.05	0.74(中大)
r /双相
	对r /精神分裂症	1.21	23)	23)	−0.002 ~ 0.01	0.05(很小-很小)
	对r /抑郁	13.63	<措施	<措施	0.01到0.01	0.19(很小很小)
r /精神分裂症
	对r /抑郁	4.41	<措施	<措施	0.01到0.01	0.14(很小很小)

表5所示。编写成员的质量变化。变量报告为可读性分数斜率的平均值(SE)，可读性分数斜率的归一化平均值，词汇多样性的斜率，以及每个社区帖子中总字数的斜率。雾霾:官样文章的简单衡量标准。

Subreddit	Flesch-Kincaid 平均等级(SE)	烟雾指数, 意思是(SE)	射击雾指数, 意思是(SE)	Linsear写公式, 意思是(SE)	四个指标, 意思是(SE)	四个指标, 归一化意思是(SE)	词汇多样性, 意思是(SE)	总数量帖子里的文字，意思是(SE)
r /快乐	−0.01 (0.005)	0.0002 (0.01)	−0.004 (0.003)	−0.01 (0.01)	−0.01 (0.01)	0.13 (0.56)	0.34 (0.23)	−0.002 (0.001)
r /健身	−0.05 (0.01)	−0.21 (0.10)	−0.06 (0.04)	−0.29 (0.22)	−0.10 (0.03)	−15.22 (5.17)	3.85 (0.34)	−0.01 (0.001)
r / loseit	−0.002 (0.005)	−0.08 (0.04)	−0.02 (0.02)	−0.02 (0.01)	−0.03 (0.01)	−5.37 (1.74)	0.93 (0.88)	−0.005 (0.0006)
r /抑郁	−0.03 (0.004)	−0.06 (0.004)	−0.01 (0.003)	−0.04 (0.004)	−0.05 (0.005)	−5.59 (0.32)	2.40 (0.10)	−0.01 (0.0003)
r /双相	−0.09 (0.01)	−0.14 (0.02)	−0.03 (0.01)	−0.12 (0.02)	−0.14 (0.02)	−9.12 (1.02)	5.04 (0.48)	−0.01 (0.001)
r /精神分裂症	−0.02 (0.02)	−0.09 (0.02)	0.005 (0.02)	−0.07 (0.04)	−0.07 (0.03)	−4.69 (1.25)	3.89 (0.89)	−0.01 (0.002)

表6所示。成对t标准化平均可读性分数变化检验。

Subreddit比较(按可读性得分排序)		t价值	P价值	调整P值(鞍环)	95%可信区间	效应量(d）
r /快乐
	对r /精神分裂症	3.52	<措施	. 01	2.13 ~ 7.51	0.11(很小很小)
	对r / loseit	3.01	.003	03	1.92到9.08	0.02(非常小-小)
	对r /抑郁	8.87	<措施	<措施	4.46到6.99	0.10(非常小-小)
	对r /双相	7.98	<措施	<措施	6.98 ~ 11.53	0.16(很小很小)
	对r /健身	2.95	.003	03	5.17 ~ 25.54	0.02(非常小-小)
r /精神分裂症
	对r / loseit	0.32	综合成绩	.90	−3.52 ~ 4.88	0.002(非常小)
	对r /抑郁	0.70	报	.90	−1.64 ~ 3.44	0.02(非常小-小)
	对r /双相	2.75	. 01	0。	1.27 ~ 7.59	0.07(很小很小)
	对r /健身	1.98	0。	。	0.11到20.95	0.02(非常小-小)
r / loseit
	对r /抑郁	0.12	.90	.90	−3.25 ~ 3.69	0.0008(非常小)
	对r /双相	1.86	06	。31	−0.20 ~ 7.70	0.01(非常小-小)
	对r /健身	1.81	07	.35点	−0.84 ~ 20.53	0.02(非常小-小)
r /抑郁
	对r /双相	3.31	措施	. 01	1.44 ~ 5.62	0.06(很小很小)
	对r /健身	1.86	06	。31	−0.52 ~ 19.77	0.02(非常小-小)
r /双相
	对r /健身	1.16	二十五分	.90	−4.22 ~ 16.42	0.01(非常小)

为了理解可读性分数和词汇多样性变化的意义，我们通过两两独立的样本，将三个心理健康版块的变化与r/happy、r/bodybuilding和r/loseit进行了比较t测试。各看板之间可读性得分的总体比较显示在表6．

reddit版块的比较表明，这三个心理健康版块的成员发布的帖子的可读性比r/happy的成员提高了很多。然而，这些比较的效应量非常小。此外，只有r/躁郁症患者发布的帖子的可读性明显优于r/抑郁症和r/精神分裂症患者发布的帖子，在三个心理健康子版块的两两比较中，效果非常小。

r/躁郁症的成员在词汇多样性方面也有最大的改善，明显高于r/抑郁、r/失落和r/快乐的成员，尽管影响大小非常小(表7)．此外，r/精神分裂症和r/抑郁的成员比r/快乐的成员改善得更明显;但与r/loseit无显著差异。

表7所示。成对t词汇多样性变化检验。

Subreddit比较(按可读性得分排序)		t价值	P价值	调整P值(鞍环)	95%可信区间	效应量(d）
r /双相
	对r /精神分裂症	1.14	二十五分	.76	−0.83 ~ 3.13	0.03(很小很小)
	对r /健身	2.01	.04点	口径。	0.03 - 2.36	0.03(很小很小)
	对r /抑郁	5.35	<措施	<措施	1.68 - 3.61	0.12(很小很小)
	对r / loseit	4.09	<措施	<措施	2.14 - -6.08	0.02(非常小-小)
	对r /快乐	8.77	<措施	<措施	3.65至5.75	0.18(很小很小)
r /精神分裂症
	对r /健身	0.04	.96点	.96点	−1.82 ~ 1.91	0.001(非常小)
	对r /抑郁	1.68	.09点	38	−0.26 ~ 3.24	0.08(很小很小)
	对r / loseit	2.37	02	点	0.51到5.41	0.02(非常小-小)
	对r /快乐	3.88	<措施	<措施	1.75至5.35	0.18(很小很小)
r /健身
	对r /抑郁	4.05	<措施	<措施	0.75至2.15	0.05(很小-很小)
	对r / loseit	3.08	.002	02	1.06到4.77	0.02(非常小-小)
	对r /快乐	8.45	<措施	<措施	2.69到4.32	0.08(很小很小)
r /抑郁
	对r / loseit	1.66	.10	点	−0.27 ~ 3.21	0.01(非常小-小)
	对r /快乐	8.16	<措施	<措施	1.56到2.55	0.11(很小很小)
r / loseit
	对r /快乐	0.64	点	.96点	−1.2 ~ 2.37	0.003(非常小)

主要研究结果

我们利用Reddit上公开的在线心理健康社区帖子的可读性和词汇多样性，研究了书面沟通挑战的问题。我们发现，平均而言，抑郁症、双相情感障碍和精神分裂症的成员所写的帖子，与其他三个专注于积极情绪、锻炼和体重管理的ohc相比，要难读得多，词汇多样性也要少得多。

我们还发现，随着心理健康社区的成员更多地参与社区，他们写的帖子更容易阅读，词汇更多样化。有趣的是，除了r/快乐成员的可读性得分有所提高外，其他ohc成员的得分也有所提高。只有r/双相情感障碍组在词汇多样性上比其他两种ohc组(r/happy和r/loseit)的成员有统计学上的显著提高，而在可读性得分上比r/happy组有统计学上的显著提高。与r/快乐的成员相比，r/抑郁和r/精神分裂症的成员在这两项测试特征上也有显著改善。

另一个有趣的发现是r/loseit的可读性得分和词汇多样性，其中成员可能由于超重的痛苦而出现抑郁症状。r/loseit的可读性分数和词汇多样性介于r/happy和三个心理健康版块之间。尽管如此，r/loseit上的帖子与三个心理健康版块相比，在统计上更容易阅读，词汇多样性更丰富(中等到巨大的效应量)。然而，与r/happy相比，来自r/loseit的帖子在统计上明显更难阅读(中等到大的效应量)，词汇多样性更少(大到非常大的效应量)。在可读性分数和词汇多样性方面，r/bodybuilding和r/happy的人写的文章比r/loseit的人更相似。

尽管心理健康社区的成员可能面临语言障碍，但他们在现实生活中的沟通挑战是未知的。据我们所知，这是第一个显示心理健康社区成员在现实世界中使用社交媒体进行书面交流的挑战的研究。

在线交流和心理健康的实际意义

我们的分析表明，在线心理健康社区的成员可能会因为其他成员的语言障碍而遇到不连贯的文本。自动更正拼写错误[85]，简化语言[86]，以及提高文本的连贯性[87]可以提高帖子的可读性和参与这些社区的整体体验。

许多在线社区，包括Reddit的许多子版块，都利用版主来规范内容和支持成员。许多自动化系统已被建议协助版主并减轻版主负担[88］．类似地，我们的自动分析方法的适应性可以作为检测大规模网络中词汇多样性和帖子可读性正在恶化的个体的基础。这可能表明精神障碍症状恶化，这样的功能可以提醒并允许版主提供及时的支持。

我们还展示了通过在线心理健康社区更频繁地写作来改善书面交流的潜力。为改善书面交流而设计在线心理健康社区的功能，可以改善精神疾病患者的日常生活。例如，一个表达性写作的地方可以改善他们的症状。89，90并可能帮助他们解决书面交流的挑战。

用户隐私

在美国，使用公开可访问的社交媒体数据(如Reddit)的研究通常不受irb的审查;然而，隐私等道德考量仍然至关重要[91-93］．在本文中，我们不报告任何用户身份信息，以保护用户隐私(如直接报价和用户名)。

局限性和未来发展方向

我们的研究有几个局限性。一些混杂因素，如个体发病前的智力、语言技能和教育水平，以及人口和地理特征[9会影响写作质量，而不是语言障碍。与群体动态和精神健康状况相关的其他可能的混杂因素包括特定reddit子版块的沟通实践和文化，以及患有精神健康状况的个人的药物和物质使用。此外，我们假设可读性得分高反映了作者的表达能力或组织能力不足。虽然不清晰的发音和组织可以提高可读性分数，但高可读性分数也可能是因为复杂的语言和复杂的句子结构。然而，在我们的手工评估中，我们并没有遇到复杂的写作，而且这种复杂和复杂在日常交流中也不太可能非常普遍。同样，我们不知道可读性分数是如何受到常见的在线交流属性的影响，如俚语、缩写、社区术语和拼写错误[85]，或词汇多样性如何受到话题数量和话题变化的影响[94］．然而，这些在线交流属性更有可能出现在所有的reddit子版块中，从而以类似的方式影响可读性得分。Reddit是一个广泛使用的平台，年轻男性使用频率更高[95，96]在英语国家[96］．尽管更多用户活动来自英语国家(85%)[96，目前还不清楚以英语为第二语言的人的参与对结果有何影响。此外，选择参与r/抑郁症、r/双相情感障碍和r/精神分裂症研究的成员不一定代表各自的人群，并且会受到选择偏差的影响。同样，我们没有任何证据表明这三个心理健康版块的成员是临床诊断的;他们的病情的严重程度是未知的，重叠的成员可能存在于这些reddits。然而，以往研究的主要局限性之一是样本量小[7，8]，这可能是结果不一致的根本原因[10，23，24］．因此，考虑到r/抑郁症、r/躁郁症和r/精神分裂症的规模，精神障碍的患病率和严重性，社交媒体的日益普及，以及与日常使用社交媒体相关的潜在挑战，使Reddit成为一个有趣的研究平台。

虽然这超出了本研究的范围，但为了更准确地确定年级阅读水平，可能需要对可读性指标进行进一步的调查[46］．我们根据已验证或使用过的文献选择了可读性指标[44，46-56］．然而，我们注意到指标之间的差异。例如，可读性评分雾指数远高于其他三个指标。烟雾指数导致可读性得分低于其他指标。尽管存在明显的差异，但正如之前的研究所表明的那样，这些分数是相互关联的。46]，并且我们使用了四个可读性指标的归一化得分的平均值来加强我们研究结果的可靠性。由于统计结果的一致性，我们认为这四个指标可以衡量可读性的总体难度。我们也承认，我们的大样本量可能会夸大统计显著性水平。因此，我们报告了95%的ci，并在解释结果时使用了效应量。另一个有趣的未来方向将是调查为什么成员在长期参与在线心理健康社区方面正在改善和纵向改变书面交流。在这项研究中，我们只检查了参与在线心理健康社区的整体影响;然而，了解成员如何提高他们的书面沟通技能可能会为相关患者教育项目的设计提供信息。

结论

我们为患有抑郁症、躁郁症和精神分裂症的人所面临的书面交流挑战提供了新的见解。精神卫生社区与其他三个OHCs的比较表明，精神卫生社区的著作明显更难阅读，而词汇的多样性也明显较低。我们的研究结果还表明，随着时间的推移，参与这些reddit版块有可能提高成员的书面沟通能力。我们提供实用的建议，利用我们的发现在在线交流环境，以提高会员的交流经验。我们认为这些发现是理解精神障碍患者书面沟通挑战的重要一步。

致谢

我们的分析仅限于公开的讨论内容。该研究免除了犹他大学机构审查委员会(伦理委员会)的审查[IRB 00076188]。美联社对这项研究的贡献得到了美国国立卫生研究院国家医学图书馆的培训拨款T15 LM007124的支持。MC对这项研究的贡献得到了美国国立卫生研究院国家医学图书馆的支持，奖励编号为R00LM011393和K99LM011393。内容仅为作者的责任，并不一定代表美国国立卫生研究院的官方观点。

利益冲突

没有宣布。

Kessler RC, Aguilar-Gaxiola S, Alonso J, Chatterji S, Lee S, Ormel J，等。精神障碍的全球负担:世卫组织世界精神卫生调查的最新情况。中华流行病学杂志2009;18(1):23-33 [免费全文] [Medline］
Whiteford HA, Degenhardt L, Rehm J, Baxter AJ, Ferrari AJ, Erskine HE，等。可归因于精神和物质使用障碍的全球疾病负担:《2010年全球疾病负担研究》的结果。柳叶刀2013年11月09日;382(9904):1575-1586。［CrossRef] [Medline］
广川S，川上N，松本T，稻垣A，江口N，土屋M，等。日本的精神障碍与自杀:一项全国性的心理解剖病例对照研究。《情感失调》杂志2012 10月;140(2):168-175。［CrossRef] [Medline］
高桥Y.抑郁症和自杀。日本医学杂志2001;44(8):359-363 [免费全文］
Oquendo MA, Waternaux C, Brodsky B, Parsons B, Haas GL, Malone KM，等。双相情感障碍的自杀行为:未遂者和非未遂者的临床特征。《情感失调》2000年8月;59(2):107-117。［Medline］
Melle I, Johannesen JO, Friis S, Haahr U, Joa I, Larsen TK，等。早期发现精神分裂症的首次发作和自杀行为。美国精神病学杂志2006年5月;163(5):800-804。［CrossRef] [Medline］
莫里茨，Birkner C, Kloss M, Jahn H, Hand I, Haasen C，等。强迫症、单相抑郁症和精神分裂症的执行功能。阿奇临床神经精神病学2002七月;17(5):477-483。［Medline］
傅志刚，李志刚，李志刚，李志刚。年轻单极抑郁和精神分裂症患者的执行功能和言语记忆。精神病学Res 1999年12月27日;89(3):171-187。［Medline］
单极抑郁患者言语智力的评估:单词定义和单词识别的比较。中华精神病学杂志2009;63(2):120-123。［CrossRef] [Medline］
抑郁症患者语义加工和语言流畅性的脑功能研究。中华心理医学杂志2010年2月;75(2):77-85。［CrossRef] [Medline］
福萨提P，纪尧姆LB，厄吉斯AM，阿利莱尔JF。抑郁症言语流利性的定性分析。精神病学杂志2003年1月25日;117(1):17-24。［Medline］
Fossati P, Harvey PO, Le Bastard G, Ergis AM, Jouvent R, Allilaire JF。初次抑郁发作和单相、双相复发抑郁症患者的言语记忆表现。中华精神病学杂志2004;38(2):137-144。［Medline］
李志刚，李志刚，李志刚。精神分裂症和单极重度抑郁症患者额叶功能的评估。精神病理学1993;26(2):76 - 84。［CrossRef] [Medline］
李文杰，张志刚。词汇理解中布洛卡区作用的研究。Brain Res 2007年5月18日;1146:101-114。［CrossRef] [Medline］
sehier ML, Lazeyras F, Pegna AJ, Annoni JM, Zimine I, Mayer E，等。健康受试者在语音和语义语言任务中fMRI激活的可变性。Hum Brain Mapp 2004 11月23日(3):140-155。［CrossRef] [Medline］
达西RC，康诺利JF，服务E, Hawco CS, Houlihan ME。听觉句子加工中的语音和语义加工分离:高分辨率事件相关脑电位研究。Hum Brain Mapp 2004 5月;22(1):40-51。［CrossRef] [Medline］
宾德JR，麦基尔南KA，帕森斯ME，韦斯特伯里CF，波辛ET，考夫曼JN，等。视觉词识别中词汇通路的神经相关。中华认知神经科学2004,01;15(3):372-393。［CrossRef] [Medline］
肖震，张建新，王旭，吴蓉，胡霞，翁霞，等。假词和真实词在左额下回的差异活动:听觉词汇决策的事件相关功能磁共振研究。Hum Brain Mapp 2005 Jun;25(2):212-221。［CrossRef] [Medline］
Collins AM, Loftus EF。语义加工的扩散-激活理论。精神病学Rev 1975 Oct;82(6):407-428 [免费全文] [CrossRef］
Borkowski JG, Benton AL, Spreen O.语言流畅性与脑损伤。神经心理学1967年5月;5(2):135-140 [免费全文] [CrossRef］
李志刚，李志刚。寻词的PET研究。神经心理学1991 Dec;29(12):1137-1148 [免费全文] [CrossRef］
Basso A, Burgio F, Prandoni P.语义类别与左脑损伤患者首字母单词流畅性的关系。中华神经科杂志，1997 11月;4(6):544-550 [免费全文] [CrossRef］
傅立平，李志强，李志强，等。慢性精神分裂症患者在执行语言流畅性任务时的区域脑活动中华精神病学杂志1999,9(3):343-349。［Medline］
海因里希斯RW，扎克扎尼斯KK。精神分裂症的神经认知缺陷:证据的定量回顾。神经心理学1998 7月;12(3):426-445。［Medline］
张晓东，张晓东，张晓东，2015。美国人上网情况:2000-2015http://www.pewinternet.org/2015/06/26/americans-internet-access-2000-2015［WebCite缓存］
Fox S, Rainie L. Pew互联网。:皮尤网络与美国生活项目;2014.总体结论:互联网为社会带来了好处，对个人用户来说更是一件好事。http://www.pewinternet.org/2014/02/27/the-web-at-25-in-the-u-s［WebCite缓存］
Perrin A. Pew互联网。:皮尤网络与美国生活项目;2015.社交媒体使用:2005-2015http://www.pewinternet.org/2015/10/08/social-networking-usage-2005-2015［WebCite缓存］
康威M，奥康纳D.社交媒体，大数据和心理健康:当前的进展和伦理影响。Curr Opin Psychol 2016 6月;9:77-82 [免费全文] [CrossRef] [Medline］
Corrigan P.污名化如何干扰精神卫生保健。Am Psychol 2004 10月;59(7):614-625。［CrossRef] [Medline］
De CM, De S. Reddit上的心理健康论述:自我表露、社会支持和匿名。2014年发表于:ICWSM, AAAI论文集;2014年6月1日;美国密歇根州安阿伯市，第71-80页。
Barney LJ, Griffiths KM, Banfield MA。抑郁症患者的显性和隐性信息需求:对在线抑郁症支持论坛上报告的问题进行定性调查。BMC精神病学2011年5月18日;11:88 [免费全文] [CrossRef] [Medline］
纽曼M，劳特巴赫D，芒森S，雷斯尼克P，莫里斯M。这并不是说我没有问题，我只是没有把它们放在Facebook上。: ACM出版社;2011年发表于:ACM 2011年计算机支持协作工作会议论文集;2011年3月19日至23日;中国杭州，p. 341-350http://dl.acm.org/citation.cfm?id=1958824.1958876［CrossRef］
Hartlage S, Alloy LB, Vázquez C, Dykman B.自动和努力处理抑郁症。精神牛1993 3月;113(2):247-278。［Medline］
Roy-Byrne PP, Weingartner H, Bierer LM, Thompson K, Post RM。抑郁症中的努力和自动认知过程。Arch Gen Psychiatry 1986 Mar;43(3):265-267。［Medline］
Park A, Conway M.在线健康社区成员心理状态的纵向变化:了解参与在线抑郁社区的长期影响。J Med Internet Res 2017年3月20日;19(3):e71 [免费全文] [CrossRef] [Medline］
Gkotsis G, Oellrich A, Hubbard TJ, Dobson RJ, Liakata M, Velupillai S.社交媒体中心理健康问题的语言。第三届计算语言学与临床心理学研讨会论文集:从语言信号到临床现实2016年6月16日;圣地亚哥，加州p. 63-73 URL:https://www.researchgate.net/profile/George_Gkotsis/publication/303365632_The_language_of_mental_health_problems_in_social_media/links/573e2d0408ae9f741b3009ff.pdf
Park A, Conway M, Chen AT。研究来自reddit的三个在线心理健康社区的主题相似性、差异和成员:文本挖掘和可视化方法。Comput Human behaviour 2018年1月;78:98-112。［CrossRef] [Medline］
麦克纳马拉DS，克罗斯利SA，麦卡锡PM。写作质量的语言特征。令状公告2009年11月24日;27(1):57-86 [免费全文] [CrossRef］
R.清晰写作的技巧。美国纽约州纽约:麦格劳-希尔国际图书公司;1952.
韩礼德，哈桑。H.英语衔接。英国伦敦:朗文集团有限公司;1976.
沃特金斯RV，凯利DJ，哈伯斯HM，霍利斯W.测量儿童词汇多样性:区分典型和受损的语言学习者。J Speech Hear Res 1995 Dec;38(6):1349-1355。［Medline］
Todirascu A, François T, Gala N, Fairon C, Ligozat AL, Bernhard D.文本可读性评估的连贯和衔接。发表于:自然语言处理与认知科学国际研讨会(NLPCS 2013);2013年10月15日至16日;法国马赛，第11-19页。
杜克瑞，林德杰，康纳利。特定语言障碍对青少年书面文本的影响。例外儿童2009年7月;75(4):427-446 [免费全文] [CrossRef］
Gunning R. 20年后的雾指数。J Bus community 2016 9月16日;6(2):3-13 [免费全文] [CrossRef］
Bormuth JR.:美国卫生、教育和福利部;教育部研究局办公室;1969.可读性分析的开发https://files.eric.ed.gov/fulltext/ED029166.pdf[访问时间:2018-03-17][WebCite缓存］
米德CD，史密斯CF.可读性公式:注意事项和标准。病人教育计数1991 Apr;17(2):153-158 [免费全文] [CrossRef］
朴a，朱士华，康威。电子烟健康信息和建议的可读性:基于网络信息的定量分析。JMIR公共卫生监测2017年1月06日;3(1):e1 [免费全文] [CrossRef] [Medline］
Eltorai AE, Naqvi SS, Ghanian S, Eberson CP, Weiss AC, Born CT，等。侵入性手术同意书的可读性。临床翻译科学2015年12月;8(6):830-833 [免费全文] [CrossRef] [Medline］
Meade CD, Byrd JC。患者素养与吸烟教育文献的可读性。中华卫生杂志1989年2月;79(2):204-206。［Medline］
马鲁夫，张志强，张志强，等。烟草产品健康警示的可读性研究。中华卫生杂志1992年3月;82(3):464。［Medline］
田晨，Champlin S, Mackert M, Lazard A, Agrawal D.基于网络的结直肠癌筛查患者教育材料的可读性、适宜性和健康内容评估。胃肠病学杂志2014年8月;80(2):284-290。［CrossRef] [Medline］
D'Alessandro DM, Kingsley P, Johnson-West J.儿科患者教育材料在万维网上的可读性。儿科青少年医学2001年7月;155(7):807-812。［Medline］
尹海霞，顾晓峰，李志强，李志强，等。哮喘行动计划的可读性、适宜性和特征:检查可能损害理解的因素。儿科学2013年1月;131(1):e116-e126。［CrossRef] [Medline］
Risoldi CZ, Gregory P, Wilson a .互联网上消费者健康信息的可读性:美国政府资助和商业资助网站的比较。中华卫生杂志2012;17(9):1003-1010。［CrossRef] [Medline］
Agarwal N, Hansberry DR, Sabourin V, Tomei KL, Prestigiacomo CJ。医学专科患者教材质量的比较分析。JAMA实习生医学2013年7月08日;173(13):1257-1259。［CrossRef] [Medline］
Terblanche M, Burgess L.检查患者知情同意书的可读性。Open AccessJ临床试验2010年10月:157 [免费全文] [CrossRef］
Pitler E, Nenkova A.重新审视可读性:预测文本质量的统一框架。发表于:EMNLP '08自然语言处理经验方法会议论文集;2008年10月25日至27日;檀香山，夏威夷p. 186-195网址:http://dl.acm.org/citation.cfm?id=1613715.1613742
Agichtein E, Castillo C, Donato D, Gionis A, Mishne G.在社交媒体中寻找高质量的内容。发表于:Web搜索和Web数据挖掘国际会议论文集- WSDM '08;2008年2月11日至12日;帕洛阿尔托，加利福尼亚州，美国p. 183网址:http://portal.acm.org/citation.cfm?doid=1341531.1341557
麦克劳克林GH。烟雾分级:一个新的可读性公式。J Read 1969;12(8):639-646 [免费全文］
金凯德JP，菲什伯恩RP，奇索姆BS，罗杰斯RL。海军现役人员新可读性公式(自动可读性指数、雾数和肉质阅读简化公式)的推导。米林顿，TN:海军技术训练司令部;1975年2月。
维基百科。Linsear编写可读性公式https://en.wikipedia.org/wiki/Linsear_Write[访问2017-05-14][WebCite缓存］
Reddit。2015。2015年Reddit网址:http://www.redditblog.com/2015/12/reddit-in-2015.html[访问时间:2016-01-12][WebCite缓存］
Reddit。2017。r/ 2017年5月的萧条https://www.reddit.com/r/depression/search?q=depression[已访问2017-05-11][WebCite缓存］
Reddit。2017。r/双极2017年5月https://www.reddit.com/search?q=bipolar[已访问2017-05-11][WebCite缓存］
Reddit。2017。r/精神分裂症2017年5月https://www.reddit.com/search?q=schizophrenia[已访问2017-05-11][WebCite缓存］
Reddit。2017。r/happy in 2017年5月https://www.reddit.com/search?q=happy[已访问2017-05-11][WebCite缓存］
Reddit。2017。r/loseit在2017年5月https://www.reddit.com/search?q=loseit[已访问2017-05-11][WebCite缓存］
Reddit。2017。r/健美在2017年10月网址:https://www.reddit.com/search?q=bodybuilding[已访问2017-10-14][WebCite缓存］
Park A, Hartzler AL, Huh J, McDonald DW, Pratt W.词汇使用的同质性:词汇相似度对在线健康社区参与的有益影响。AMIA年度法律程序2015;2015:1024-1033 [免费全文] [Medline］
Hwang KO, Ottenbacher AJ, Green AP, Cannon-Diehl MR, Richardson O, Bernstam EV，等。网络减肥社区的社会支持。国际医学杂志2010年1月;79(1):5-13 [免费全文] [CrossRef] [Medline］
王勇，克劳特R，列文J.去留?: ACM出版社发表于:ACM 2012年计算机支持合作工作会议论文集- CSCW '12;2012年2月11-15日;西雅图，华盛顿，美国p. 833-842网址:http://dl.acm.org/citation.cfm?doid=2145204.2145329［CrossRef］
Pappa GL, Cunha TO, Bicalho PV, Ribeiro A, Couto Silva AP, Meira Jr W，等。在线体重管理社区中与体重变化相关的因素:LoseIt Reddit社区的案例研究。J Med Internet Res 2017年1月16日;19(1):e17 [免费全文] [CrossRef] [Medline］
杜库尼亚，韦伯I，哈达迪H，帕帕g社会反馈在Reddit减肥社区的影响。美国纽约州纽约:ACM出版社发表于:DH '16第六届数字健康国际会议论文集;2016年4月11-13日;Montréal, Québec，加拿大p. 99-103网址:http://dl.acm.org/citation.cfm?doid=2896338.2897732
Ploderer B, Howard S, Thomas P.在线上，线下生活:社会关系对社交网站占用的影响。: ACM出版社发表于:2008年ACM计算机支持协作工作会议论文集;2008年11月08-12日;美国加州圣地亚哥p. 333-342网址:http://portal.acm.org/citation.cfm?id=1460618
Reddit_Member。Reddit。我有每个公开的Reddit研究评论网址:https://www.reddit.com/r/datasets/comments/3bxlg7/i_have_every_publicly_available_reddit_comment/;［WebCite缓存］
Park A, Conway M.追踪社交媒体上与鸦片相关的讨论。网上J公共卫生信息2017年5月02日;9(1):e73 [免费全文] [CrossRef］
Park A, Conway M.跟踪公共卫生应用在Reddit上的健康相关讨论。发表于:AMIA Symp年度会议;2017年11月3日至8日;华盛顿特区:https://knowledge.amia.org/65881-amia-1.3897810/t003-1.3901461/f003-1.3901462/2730999-1.3901643/2730999-1.3901644?timeStamp=1520105203311
Nonnecke B, Preece J. Lurker人口统计数据。纽约，纽约，美国:ACM出版社发表于:SIGCHI会议论文集关于计算系统中的人为因素;2000年4月1日至6日;荷兰海牙，p. 73-80网址:http://dl.acm.org/citation.cfm?id=332409［CrossRef］
Bansal S, Aggarwal C. Python软件基金会。Textstat URL:https://pypi.python.org/pypi/textstat[访问时间:2016-09-23][WebCite缓存］
调整p值同步推理。biomeics 1992 Dec;48(4):1005 [免费全文] [CrossRef］
行为科学的统计权力分析。(第二版)。新泽西州希尔斯代尔:Lawrence Erlbaum Associates;1988.
林敏，Lucas HC, Shmueli G.研究评论-大到不能倒:大样本和p值问题。Inf Syst Res 2013 12月;24(4):906-917 [免费全文] [CrossRef］
新设计尺寸的经验法则。中国计算机工程学报(英文版);2009;26(2):597-599。
纳瓦罗D.: Citeseer;2014.用R学习统计学:心理学学生和其他初学者教程0.5版https://cran.r-project.org/web/packages/lsr/lsr.pdf［WebCite缓存］
Park A, Hartzler AL, Huh J, McDonald DW, Pratt W.在线社区文本的自然语言处理工具自动检测故障。J Med Internet Res 2015 Aug 31;17(8):e212 [免费全文] [CrossRef] [Medline］
Carroll JB, Minnen G, Pearce D, Canning Y.为语言障碍读者简化文本。发表于:计算语言学协会欧洲分会第九届会议论文集;1999年6月08-12日;卑尔根，挪威p. 269-270网址:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.45.5993&rep=rep1&type=pdf
Smith CA, Hetzel S, Dalrymple P, Keselman A.超越可读性:为消费者调查临床文本的一致性。J Med Internet Res 2011年12月02日;13(4):e104 [免费全文] [CrossRef] [Medline］
Calvo RA, Hussain MS, Milne D, Nordbo K, Hickie I, Danckwerts P.加强在线心理健康支持服务。见:在积极心理学实践中整合技术。好时，PA: IGI Global;2016:82 - 103。
Krpan KM, Kross E, Berman MG, Deldin PJ, Askren MK, Jonides J.一种治疗抑郁症的日常活动:表达性写作对诊断为重度抑郁症患者的益处。J Affect disds 2013 9月25日;150(3):1148-1151 [免费全文] [CrossRef] [Medline］
Koopman C, Ismailji T, Holmes D, Classen CC, Palesh O, Wales T.表达性写作对亲密伴侣暴力幸存者疼痛、抑郁和创伤后应激障碍症状的影响。中华卫生心理杂志2005年3月10日(2):211-221。［CrossRef] [Medline］
使用Twitter进行公共卫生监测和研究中的伦理问题:从研究文献中建立伦理概念的分类。J Med Internet Res 2014 12月22日;16(12):e290 [免费全文] [CrossRef] [Medline］
Vayena E, Salathé M, Madoff LC, Brownstein JS。公共卫生大数据的伦理挑战。公共科学图书馆计算生物学2015年2月;11(2):e1003904 [免费全文] [CrossRef] [Medline］
米卡尔J，赫斯特S，康威M.在使用Twitter的人群水平抑郁症监测伦理问题:一个定性研究。BMC医学伦理2016年4月14日;17:22 [免费全文] [CrossRef] [Medline］
Park A, Hartzler AL, Huh J, Hsieh G, McDonald DW, Pratt w。:在线健康讨论的话题漂移。J Med Internet Res 2016年11月02日;18(11):e284 [免费全文] [CrossRef] [Medline］
杜根·M，史密斯·a·皮韦尼特，2013。6%的成年人是Reddit用户http://www.pewinternet.org/2013/07/03/6-of-online-adults-are-reddit-users/[访问时间:2016-02-12][WebCite缓存］
Bogers T, Wernersen R.，社交新闻网站如何“社交化”?探索使用Reddit.com的动机: iSchools;2014年发表于:iConference 2014 Proceedings;2014年3月4日至7日;柏林，德国p. 329-344网址:https://www.ideals.illinois.edu/handle/2142/47295

‎

IRB:机构检讨委员会

OHC:在线健康社区

中移动:研究问题

烟雾:官样文章的简单度量

编辑:N Collier, M Conway, V Lampos, A Culotta;提交16.06.17;S Champlin, G Lim, A Elmessiry同行评议;作者评论01.09.17;17年12月9日收到修订版本;接受03.01.18;发表10.04.18

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

利用Reddit了解精神健康障碍患者所经历的书面沟通挑战:来自精神健康社区的文本分析

利用Reddit了解精神健康障碍患者所经历的书面沟通挑战:来自精神健康社区的文本分析

原始论文

通讯作者:

摘要

关键字

简介

方法

社区平台

Subreddit选择

数据

研究问题1:社交媒体中的传播挑战分析

研究问题2:社交媒体中传播随时间变化的分析

结果

研究问题1:社交媒体中的传播挑战分析

研究问题2:社交媒体中传播随时间变化的分析

讨论

主要研究结果

在线交流和心理健康的实际意义

用户隐私

局限性和未来发展方向

结论

致谢

利益冲突

参考文献

缩写