这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息,https://formative.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
社交媒体提供的生活方式干预已经显示出有希望的结果,通常能产生适度但显著的减肥效果。参与者参与似乎是减肥结果的重要预测因素;然而,敬业度通常会随着时间的推移而下降,并且在研究内部和研究之间都有很大的变化。在社交媒体提供的生活方式干预的背景下,关于影响参与者参与度的因素的研究仍然很少。
这项研究旨在从社交媒体提供的生活方式干预过程中产生的内容中确定参与者参与的预测因素,包括帖子的特征、帖子后的对话以及参与者之前的参与模式。
我们使用一项通过Facebook提供两种生活方式干预的试点随机试验的数据进行了二次分析。我们分析了80名参与者在16周干预期间的参与度数据,并使用混合效应模型将它们与预测因素联系起来,包括帖子的特征、帖子后的对话以及参与者之前的参与度。我们还进行了基于机器学习的分类,以确认之前确定的重要预测因素的重要性,并探索这些措施在多大程度上可以预测参与者是否会参与特定的职位。
参与者参与每个帖子的概率每周下降0.28% (
研究结果揭示了从干预主义者和其他参与者产生的内容中得出的几个参与预测因素。研究结果对增加异步远程提供生活方式干预的参与度具有影响,这可能会改善结果。我们的研究结果还指出了数据科学和自然语言处理在分析微观层面的对话数据和确定影响参与者参与度的因素方面的潜力。未来的研究应该在更大的试验中验证这些结果。
ClinicalTrials.gov NCT02656680;https://clinicaltrials.gov/ct2/show/NCT02656680
肥胖在美国很普遍,是心血管疾病、二型糖尿病的已知危险因素[
系统综述和荟萃分析显示支持社交媒体提供的生活方式干预的有效性[
使用自然语言处理(NLP)研究干预者和参与者在干预过程中产生的内容和互动,是增加我们对影响参与者参与基于社交媒体的行为干预因素的理解的一种有前途的方法。直接从基于网络的平台(如Facebook)收集的数据可以在干预项目过程中提供详细的实时行为信息。NLP可以处理大量文本,生成可靠的定性编码[
利用一项为期16周的试点可行性随机减肥试验的数据,该试验通过Facebook提供生活方式干预,利用之前基于网络的传播文献确定的影响参与者参与度的多层次因素,我们从参与者和干预者在干预过程中产生的内容中得出各种因素,包括帖子的特征(例如,帖子、时间和主题),帖子后的对话(例如,情绪和收到回复),以及参与者以前的参与行为,并评估这些因素在社交媒体提供的生活方式干预的背景下,单独和整体预测参与者参与程度的好坏。
在一项试点可行性随机试验中,我们将80名超重或肥胖的参与者随机分为两组,其中一组远程提供生活方式干预。2019年6月至10月期间,我们通过康涅狄格大学ResearchMatch网站上的网络广告、庭院甩卖或美国37个州的社区Facebook群组招募了对减肥感兴趣的人。入选标准包括BMI在27到45公斤/平方米之间,拥有智能手机,活跃的Facebook用户(即,每周发表评论或帖子超过一次),年龄在18到65岁之间,每天都能上网。排除标准包括在研究期间怀孕或计划怀孕,在研究期间进行减肥手术或计划进行减肥手术,在过去3个月内体重减轻≥5%,存在排除体力活动或饮食改变的疾病,服用影响体重的药物,不能在无辅助的情况下不间断地行走四分之一英里,1型或2型糖尿病,以及在研究期间参加过主要研究者的减肥研究。
参与者在随机分组之前完成了一个定向网络研讨会,以了解更多关于研究的信息,那些仍然有兴趣参与的人会收到一个Wi-Fi秤(FitBit Aria, FitBit Inc),并被要求向工作人员提供他们的秤登录信息,以便记录体重以进行评估。我们将80名参与者随机分为两组。
参与者被随机分为两组,一组是在第1周至第8周持续招募新参与者的Facebook小组(公开招募),另一组是只包括最初40名随机参与者的Facebook小组(封闭招募)。在开放招募条件下,在第1周至第8周期间,又招募了54名参与者,最终的小组规模为94人。然而,我们在这项研究中只纳入了最初的80名随机参与者,以确保所有参与者在所有16周的干预中都有相同的时间。
这两种情况都接受了基于糖尿病预防计划(DPP)的相同的16周生活方式干预,但经过修改,在一个私人Facebook群组中发布,每天两次帖子指导参与者完成该计划,该计划由一名营养师(顾问)领导,并由一名学生辅导员协助。我们调整了DPP内容以适应基于web的设置,如其他地方所述[
这项试点可行性随机试验于2017年10月由康涅狄格大学机构审查委员会(H17-215)批准。
我们包括了干预主义者、随机和非随机参与者的所有帖子和评论或回复,以构建测量方法。没有文字的帖子(约6%的帖子被排除在外)和民意调查被排除在外,结果在两个干预组中有761个帖子和9396个评论或回复。
感兴趣的结果是在参与者配对水平上;也就是说,每个参与者是否参与(即,评论或回复)Facebook群中的帖子(1如果是,0如果不是)。评论是对原始帖子的回应,而回复是对其他人在帖子上的评论的回应。我们专注于评论和回复,因为这些活动是积极的参与形式,而不是消极的参与形式,如观点和反应(如“喜欢”),并已被证明能积极预测减肥[
中所描述的岗位特征
我们使用一个二进制变量来表示焦点是由干预者(1)还是参与者(0)创建的。
我们测量了每篇文章的字数。
我们测量了每个帖子内容的平均情绪(文本极性)。文本极性测量文本中的价和情感,并在一个连续的频谱上从负(较低的值)到正(较高的值)。为了分析,我们将情绪测量标准化。情绪分析使用
我们使用自然语言处理来识别每个帖子、评论和回复中出现的主题。内容经过预处理,以去除表情符号和非英语字符。主题检测使用
我们收集了帖子创建的时间(从干预的第一天开始算起的天数)和星期几。
我们构建了一系列变量,代表每个帖子的回复或评论的特征。为了反映每个参与者参与之前的对话内容,如果参与者参与了帖子,我们会根据每个独特的参与者对参与前在帖子下的所有评论或回复计算这些变量;如果参与者没有参与帖子,我们会根据帖子下的所有评论或回复计算这些指标。特性描述在
我们创建了两个二进制变量来表示每个参与者是否被(1)干预者或(2)其他参与者在同一篇帖子的先前回复或评论中标记或提到。值得一提的是,我们数据中的大多数标签或提及都是由Facebook自动生成的(例如,当参与者A评论或回复参与者B的内容时,Facebook会在A的回复或评论中自动生成关于B的标签)。因此,我们数据中的大多数标签或提及都表示回复或评论关系。在极少数情况下,干预主义者会故意给先前不参与的参与者贴上标签;然而,样本量太小,无法单独测试它们的影响。
我们测量了每对参与者的所有回复或评论的平均情绪。为了分析,对测量方法进行了标准化。
纳入的参与者特征如下:
以前评论或回复的帖子百分比:对于每个帖子,我们计算每个参与者评论或回复的以前帖子的百分比。
基线和社会人口学特征:虽然这些变量不是我们分析的重点,但我们纳入了每个参与者的基线特征,包括治疗条件(开放vs封闭)、基线体重、BMI、年龄、种族、性别、教育程度、婚姻状况、家庭人数和就业状况,作为分析的协变量。
我们的分析集中在每个随机参与者(N=80)是否参与了每个帖子,因为随机参与者在整个干预过程中都可以访问Facebook群组(应该注意的是,每个帖子只在特定的治疗组中可用,因此只能由40名随机参与者看到)。为了研究预测参与者参与每个帖子的因素,我们在参与者对水平上进行了分析(即,每个参与者是否参与每个帖子)。这使得我们能够在每个参与者参与之前构建准确反映内容(即帖子和对话)的衡量标准。我们包括了来自80名随机参与者的761篇帖子中的所有可能的参与(即参与者参与的情况和他们没有参与的情况),这导致了最终的31,968个观察样本(参与者参与了4462个例子,没有参与27,506个例子)用于我们的分析。
总体分析框架描述在
分析框架,以确定参与者参与的重要预测因素。左面板:一个干预帖子的例子,以及紧随其后的评论或回复。右图:分析流程图。NLP:自然语言处理。
虽然回归分析对于确定线性关系的统计显著性很有用,但有些关系可能要复杂得多(例如,非线性或受其他变量调节)。为了确认我们之前确定的重要预测因素的重要性,并调查这些变量作为一个整体如何预测参与者对特定职位的参与度,我们在机器学习算法中包括了所有上述预测因素,包括梯度增强机,深度学习模型,以及它们的集合[
参与者特征(N=80)。
参与者的特征 | 闭门登记(n=40) | 公开报名(n=40) | |
年龄(年),平均值(SD) | 40.4 (11.8) | 40.0 (10.6) | |
女性,n (%) | 34 (85) | 34 (85) | |
基线BMI (kg/m2),平均值(SD) | 34.8 (5.4) | 34.0 (4.6) | |
西班牙裔或拉丁裔,n (%) | 3 (8) | 1 (3) | |
|
|||
|
白色 | 36 (90) | 36 (90) |
|
黑人或非裔美国人 | 3 (8) | 3 (8) |
|
亚洲 | 0 (0) | 0 (0) |
|
夏威夷土著或其他太平洋岛民 | 0 (0) | 0 (0) |
|
美国印第安人或阿拉斯加原住民 | 0 (0) | 0 (0) |
|
多民族 | 0 (0) | 1 (3) |
|
未知的 | 1 (3) | 0 (0) |
|
|||
|
已婚或与伴侣同居但未结婚 | 29日(73) | 30 (75) |
|
单 | 8 (20) | 6 (15) |
|
丧偶的,离婚的或分居的 | 3 (8) | 4 (10) |
|
|||
|
不到高中,高中学历,普通教育文凭一个,相当于 | 1 (3) | 2 (5) |
|
贸易,技术,一些大学,助理 | 8 (20) | 11 (28) |
|
学士学位或研究生学历 | 21 (53) | 17 (43) |
|
研究生学位 | 10 (25) | 10 (25) |
|
|||
|
全职雇员 | 28 (70) | 27 (68) |
|
雇佣兼职 | 7 (18) | 4 (10) |
|
学生 | 2 (5) | 2 (5) |
|
失业、退休、残疾或家庭主妇 | 3 (8) | 6 (15) |
一个普通教育发展。
在16周的干预中发布和回复或评论的特征。
文章的特点 | 闭门登记(n=374) | 公开登记(n=387) | |
内容情绪,平均值(SD) | 0.134 (0.197) | 0.133 (0.195) | |
字数,平均值(SD) | 33.78 (24.63) | 33.28 (23.12) | |
由干涉主义者创造,n (%) | 225 (60.2) | 211 (54.5) | |
|
|||
|
锻炼 | 80 (21.4) | 83 (21.4) |
|
饮食 | 158 (42.2) | 152 (39.3) |
|
重量 | 64 (17.1) | 74 (19.1) |
|
MyFitnessPal应用 | 61 (16.3) | 67 (17.3) |
|
表达情感 | 28日(7.5) | 28日(7.2) |
|
睡眠 | 6 (1.6) | 5 (1.3) |
|
目标或计划 | 80 (21.4) | 72 (18.6) |
|
|||
|
内容情绪,平均值(SD) | 0.171 (0.255) | 0.156 (0.234) |
|
与会者对其他与会者的回答,n (%) | 750 (23.8) | 803 (12.9) |
|
干预主义者对参与者的回答,n (%) | 1018 (32.3) | 1195 (19.1) |
一个非公开注册人数为3152人,公开注册人数为6244人。
为了确认之前确定的预测因素的重要性,并测试上述变量预测参与者参与帖子的概率的程度,我们使用所有上述预测因素作为输入,参与者参与作为结果,执行了各种基于机器学习的分类算法。在我们测试的32个模型中,基于梯度增强机器学习和基于深度学习的分类算法的集成方法表现最好,使用5倍交叉验证的曲线下平均面积为0.963
预测参与者敬业度的混合效应回归结果(N=31,968)一个.
Mixed-effects回归 | 值,平均值(SD;范围) | 系数(95% CI) |
|
||
结果:参与者的参与度 | 0.140 (0.347;0至1) | - - - - - -b | - - - - - - | ||
|
|||||
|
由干涉主义者创造的 | 0.583 (0.493;0至1) | 0.0627(0.0507至0.0746) | <措施 | |
|
字数 | 33.44 (23.80;1至107) | 0.0005(0.0003至0.0008) | <措施 | |
|
内容情感(标准化) | 0 (1;−3.67 ~ 4.74) | −.0042(−0.097 ~ 0.0012) | 13。 | |
|
|
||||
|
|
锻炼 | 0.212 (0.409;0至1) | 0.0096(−0.0075 ~ 0.0266) | 低位 |
|
|
饮食 | 0.389 (0.487;0至1) | −0.0085(−0.0249 ~ 0.0078) | 。31 |
|
|
重量 | 0.191 (0.392;0至1) | 0.0654(0.0494至0.0814) | <措施 |
|
|
MyFitnessPal应用 | 0.163 (0.369;0至1) | −0.0377(−0.0534 ~−0.0219) | <措施 |
|
|
表达情感 | 0.071 (0.257;0至1) | 0.0083(−0.01558 ~ 0.0321) | 50 |
|
|
睡眠 | 0.0141 (0.117;0至1) | −0.0587(−0.1070 ~−0.0103) | 02 |
|
|
目标或计划 | 0.209 (0.407;0至1) | 0.0612(0.0414至0.0811) | <措施 |
|
投递时间 | 46.61 (32.94;1至112) | −0.0004(−0.0006 ~−0.0002) | <措施 | |
|
|||||
|
内容情感(标准化) | 0 (1;−7.84 ~ 5.91) | −0.0539(−0.0589 ~−0.0488) | <措施 | |
|
其他与会者回复 | 0.026 (0.161;0至1) | 0.4484(0.4279至0.4690) | <措施 | |
|
由干涉主义者回答 | 0.029 (0.167;0至1) | 0.4604(0.4409至0.4798) | <措施 | |
|
|||||
|
以前的帖子评论或回复的百分比 | 13.16 (13.68;0至100) | 0.0076(0.0074至0.0079) | <措施 |
一个该模型包括后水平随机效应,并控制了职位创建的星期几以及参与者的其他基线和社会人口学特征,包括治疗分配、种族、婚姻状况、教育程度、就业、家庭人数、年龄、性别、基线BMI和体重。
b不可用。
在20个机器学习模型中预测参与者参与度的变量重要性。x轴为不同的模型名称,y轴上从上到下的变量为基线体重、家庭人数、基线BMI、年龄、帖后体重、帖后目标或计划、教育程度、治疗分配、帖后饮食、帖后MyFitnessPal app、帖后锻炼、就业状况、婚姻状况、帖后饮酒、帖后睡眠、性别、种族、帖后表达情绪、帖后情绪、帖是否由干预者创建、帖子创建时的干预日期,帖子字数,回复或评论情绪,帖子创建时的星期几,之前帖子的参与百分比,以及是否由其他参与者或干预者回复。
在这项研究中,我们使用两组试验可行性随机对照试验的数据进行了二次分析,该试验通过Facebook提供生活方式干预。我们分析了80名参与者对咨询师和参与者在16周的干预期间产生的761个帖子中的每一个帖子的评论或回复行为,并将它们与预测因素联系起来,包括帖子特征(例如,时间,帖子长度和帖子主题),对话特征(例如,对话的情绪和被回复的参与者),以及参与者特征(例如,社会人口学和以前的评论或回复行为)。我们的研究结果表明,尽管参与者的评论或回复随着时间的推移而减少,但帖子的重要特征、与该帖子相关的对话以及参与者的参与模式可以预测参与者是否参与特定的帖子。例如,我们发现那些在以前的帖子上投入更多精力的参与者更有可能参与未来的帖子。较长的帖子(最大字数不超过107字),由干预主义者创建,或内容与权重相关(例如,称重帖子)和目标设定更容易吸引用户参与。后者与干预的设计是一致的,参与者被要求每周一制定一周的饮食和运动目标,周日报告他们的目标进展,每周五报告他们一周的体重变化。这也是令人鼓舞的,因为目标设定[
在这项研究中,我们展示了使用NLP工具分析微观层面对话数据的潜力,并确定影响参与者在社交媒体提供的减肥干预中评论或回复行为的因素。我们的研究结果揭示了参与者、帖子和对话的一些重要微观层面特征,这些特征可以塑造参与者在干预期间的体验,并预测他们未来的参与。这些结果对社交媒体提供的行为干预的设计和实施有影响,以最大限度地提高参与者的参与度。我们之前报道过参与者参与和减肥之间的强烈关联[
尽管许多研究已经测试了社交媒体提供的减肥干预措施,或强调了参与者参与网络社区的重要性[
与之前的研究相似,我们发现参与者的参与度是高度可变的[
这项研究有几个局限性,为未来的研究指明了方向。首先,我们的样本量很小(80名参与者;10,157个帖子、评论和回复),我们的参与者主要是白人(72/ 80,90%)和女性(68/ 80,85%)。这限制了我们结果的泛化性,遵循长期以来难以招募男性参与者的减肥研究模式[
在这项研究中,我们使用试点可行性随机减肥试验的数据进行了二次分析,该试验通过Facebook提供了生活方式干预,并将参与者的参与度与几个重要的预测因素联系起来,包括帖子、回复或评论的特征以及参与者。我们的结果指出了使用数据科学和NLP工具来分析微观层面的行为或对话数据的潜力,并确定影响参与者在社交媒体减肥干预过程中参与度的因素,这对未来干预措施的设计和实施具有意义,可能会导致更有利的减肥结果。未来的研究需要验证我们的结果,并在类似和更大的试验中进一步探索这些关系。
补充分析和结果。
糖尿病预防计划
自然语言处理
本项目由美国国立卫生研究院拨款K24HL124366资助(主要研究者:SP)。
SP一直是WW(前身为Weight Watchers)和FitBit的付费顾问。