JMIR儿科和育儿-一个聊天机器人，让早产儿和足月婴儿的父母参与父母的压力，父母的睡眠和婴儿喂养:可用性和可行性研究

原始论文

¹精确营养d实验室，达能纽迪西亚研究，新加坡，新加坡

²新加坡Cytel私人有限公司，新加坡，新加坡

^3.NLYTICS私人有限公司，新加坡，新加坡

⁴荷兰阿姆斯特丹大学医学中心艾玛儿童医院儿科

⁵荷兰希尔弗瑟姆的Nutrition4Health

⁶新加坡KK妇幼医院新生儿科，新加坡

⁷杜克-新加坡国立大学医学院，新加坡，新加坡

⁸新加坡国立大学医学院，新加坡，新加坡

⁹李光前医学院，南洋理工大学，新加坡，新加坡

*所有作者贡献相同

通讯作者:

蔡美倩，医学博士

新生儿科

KK妇女儿童医院

武吉知马路100号

新加坡,229899年

新加坡

电话:65 6394 1240

电子邮件:chua.mei.chien@singhealth.com.sg

背景:父母在照顾新生儿，尤其是早产儿时，通常会经历焦虑、担心和心理困扰。基于网络的治疗师服务可以为父母提供更方便和及时的心理支持，但由于其互动性，仍然是劳动密集型的。模拟人类对话的聊天机器人显示出这种交互式应用的前景。

摘要目的:本研究的目的是探索聊天机器人技术的可用性和可行性，以收集新生儿父母关于压力、睡眠和婴儿喂养的现实对话数据，并调查早产儿和足月婴儿父母的经历之间的差异。

方法:2018年11月至2019年3月，纳入年龄≥21岁、婴儿≤6个月的父母。他们开发了三种聊天机器人脚本(压力、睡眠、喂食)，通过移动设备捕捉与父母的对话。研究结束后，家长们完成了一份聊天机器人可用性调查问卷。对封闭式问题和手动编码的开放式问题的回答进行了描述性总结。使用潜狄利克雷分配方法分析开放式回答以揭示语义主题。

结果:在45名参与者中(20名早产儿，25名足月期)，26人完成了研究。家长们认为聊天机器人“容易”使用(平均值4.08，标准差0.74;1=非常困难，5=非常简单)，“满意”(均值3.81，标准差0.90;1=非常不满意，5 =非常满意)。在45名登记的父母中，早产儿父母比足月婴儿父母更频繁地报告情绪压力(33次对24次)。家长们普遍表示他们的睡眠质量令人满意。早产组报告喂养问题的频率高于足月组(8次对2次)。在压力域对话中，与“不适”和“疲劳”相关的话题在早产儿群体对话中更普遍，而“积极感受”的话题在术语群体对话中出现得更频繁。有趣的是，与喂养相关的话题主导了睡眠领域的对话内容，这表明频繁或不规律的喂养可能会影响父母获得充足睡眠或休息的能力。

结论:该聊天机器人成功地从45位父母那里收集了关于压力、睡眠和婴儿喂养的实时对话数据。在聊天机器人的对话中，足月组的父母经常表达积极的情绪，而早产儿组的父母经常表达身体不适和疲劳，以及情绪压力。总体而言，完成研究的家长对他们使用聊天机器人作为表达想法和担忧的工具的用户体验给予了积极的反馈。

试验注册:ClinicalTrials.gov NCT03630679;https://clinicaltrials.gov/ct2/show/NCT03630679

JMIR儿科家长2021;4(4):e30169

doi: 10.2196/30169

关键字

聊天机器人；父母的压力；父母的睡眠；婴儿喂养；早产儿；足月婴儿；睡眠；压力；电子健康；支持；焦虑；可用性

照顾婴儿会导致父母焦虑和心理困扰，尤其是第一次做父母的，尤其是在婴儿出生后的头六个月内[1］．多项研究表明，父母的压力、焦虑和心理困扰不仅是短期问题，而且可能对孩子的情感、行为和认知发展产生长期影响。1］．与足月婴儿的父母相比，早产儿父母的这种情况更为突出[2］．一项对单胎早产儿和多胎早产儿母亲心理压力的评估发现，与单胎母亲相比，多胎母亲在6个月时有更严重的创伤后应激症状、出院时焦虑和抑郁症状[3.］．在对父母及其早产儿的后续临床评估中，许多人报告称，父母对儿童诊断不支持的医疗和发育结果的担忧[4］．在早产儿晚期出生并住进重症监护室(ICU)的学龄儿童母亲中，与足月儿童母亲的压力相比，总压力显著增加了18倍[5］．在一个平行的研究小组中，与足月出生的孩子的母亲相比，早产儿晚期出生但没有住进ICU的学龄儿童的母亲的总压力也增加了24倍[5］．

除了在新生儿出生后直接经历最初的压力外，父母还需要适应出院后(或在家)的新情况，并建立自己照顾新生儿的信心。这些调整和从医疗机构到家庭的护理过渡可能与压力增加和睡眠不足有关。虽然睡眠障碍最常出现在产后早期，但父母在孩子出生后的几个月内仍可能会有睡眠障碍。6，7］．除了睡眠障碍外，婴儿喂养，包括营养的频率和类型，是另一个潜在的压力源，与抑郁症状和较高的压力评级有关[8］．早产儿的父母经常面临喂养频率的问题，他们的婴儿也经常在生命的后期开始吃固体食物[9］．在家庭生活发生变化的这一时期，关于父母在压力、睡眠和婴儿喂养方面的经验的知识相对较少。

基于网络的心理健康干预已经在抑郁和焦虑等情况下取得了一些成功[10］．通过这些干预措施远程提供人力支持已被证明优于自我指导干预措施，并实现更高的参与者依从率[10］．研究表明，这些积极的结果是通过实施定期的提示和与参与者频繁的互动来实现的[11］．然而，这样的互动功能是高度治疗师密集的。可以模拟人类对话的聊天机器人应用12近年来越来越流行。这类聊天机器人应用程序可以实时向用户提供计算机生成的响应，通过即时电子消息模拟与另一个人的对话互动。13］．这项技术，再加上移动设备的使用，提供了实时收集数据的可能性，同时减少了治疗师的工作量。虽然聊天机器人被用于许多应用程序中，但其中一个更具创新性的开发领域是医疗保健部门的交互式数据收集[14］．

在这项研究中，聊天机器人技术被用来提供一个互动对话平台，让刚出院的新生儿的父母在父母压力和睡眠以及婴儿喂养方面进行交流。据我们所知，目前还没有关于使用聊天机器人作为家长在这些主题领域提供信息的交互式对话工具的研究发表。本研究的目的是探索聊天机器人技术的可行性和可用性，以收集新生儿父母在3个领域(父母压力、睡眠和婴儿喂养)的现实生活中家庭对话数据，并使用这些对话数据调查早产儿和足月婴儿父母在这3个领域的差异。

这项观察性研究于2018年11月至2019年3月进行。参与者从新加坡的一家三级转诊妇产医院招募。该研究已获得新加坡SingHealth中央机构审查委员会的批准，并在ClinicalTrials.gov上注册(NCT03630679)。

研究人群

研究人群包括父母年龄≥21岁，婴儿健康，年龄≤6个月，入组时已出院。符合条件的家长必须精通英语，家中有可靠的互联网连接，拥有适合电子交流和评估的平板电脑或移动设备，并能够遵守规定的学习任务。非单胎婴儿或已知目前或以前患有可能影响研究结果的疾病或条件的婴儿或正在参加任何其他临床研究的婴儿被排除在外。有过去或现在精神病史的父母、单亲父母、患有急性或慢性疾病的父母或经研究人员评估不能或不愿遵守研究方案要求的父母被排除在外。从所有符合条件的父母处获得书面知情同意。

研究设计

本观察性研究的参与者根据上述纳入和排除标准进行筛选。在提供知情同意后，符合条件的参与者可以下载ClaimIt应用程序(ObvioHealth)，该应用程序可以在他们的移动设备上访问电子问卷(equestionnaire)和研究聊天机器人。ClaimIt是一款商用移动应用程序，用于虚拟或混合研究中的数据收集，不需要或很少使用物理研究场所。参加者填写了一份电子筛选问卷，以确认他们的资格。研究人群包括两组:“早产儿”(胎龄<37周的早产儿父母)和“足月”(胎龄≥37周的足月婴儿父母)。

收集对话数据，易用性和满意度评级

ClaimIt提供给参与者，以便他们可以执行特定的研究相关任务并接收研究信息。研究人员通过ClaimIt应用程序向参与者提供了如何使用聊天机器人的指导，并要求他们在最多28天的时间内每周至少与聊天机器人互动3次。聊天机器人是一个交互式对话应用程序，是专门为这项研究而构建的ClaimIt应用程序的一个组件。该聊天机器人通过在线平台与用户交谈。该聊天机器人使用脚本编程，每当用户发起对话时，它都会做出适当的回应。聊天机器人脚本包括开放式和封闭式(多项选择)问题和回答。有3个对话脚本，分别对应3个感兴趣的领域，包括压力、睡眠和饮食(多媒体附件1)．

参与者还会在每周的第一天收到通知，提醒他们在方便的时候与聊天机器人完成所需的互动次数。在每周的第一天触发提醒通知，让参与者在一周内完成3次互动。研究团队和首席研究员监测了研究依从性，并通过电子方式与参与者进行联系，如果需要，还可以通过电话进行联系。所有研究数据都是通过参与者移动设备上运行的ClaimIt应用程序收集的。研究小组访问并审查了聊天机器人的对话记录。

在研究结束时，每位参与者都在ClaimIt应用程序中完成了可用性电子问卷(多媒体附件2)．问卷包括16个问题，包括封闭式(二进制或5点李克特量表)和开放式回答。参与者被要求分别对ClaimIt和聊天机器人组件的易用性和满意度进行评分。

封闭式问题的会话数据处理与描述性统计分析

计划样本量为40名参与者，以允许报告使用聊天机器人收集的分类和定量响应数据的描述性摘要统计数据。预期的辍学率为25%。如果尽管研究人员努力联系失去随访的参与者，但仍超过了这一阈值，最多可以再招募10名参与者来替代退出的参与者。退出的参与者完成的聊天机器人互动被包括在对话分析中。

每个原始聊天机器人对话都是通过将开放式回答与封闭式问题的回答以及适当编码的开放式问题(图1)．描述性统计数据用于总结可用性电子问卷和聊天机器人对话中的封闭式和编码开放式回答。连续数据使用平均值和标准差或范围表示，分类响应使用频率和百分比表示。描述性总结也按组(早产儿和早产儿)进行。无显著性检验。采用SAS 9.4进行统计分析。

聊天机器人对话的语义分析

我们使用潜狄利克雷分配(LDA) [15]方法来建模和提取语料库(文本主体)中关于语义主题的知识，这些知识来自聊天机器人对话数据中的开放式响应。在LDA上下文中，每个对话都表示为主题的混合，每个主题都与一组单词相关联。每个单词都以一定的概率表示为属于一个主题，会话中的不同单词可能属于不同的主题。目标是为每个主题找到一组具有代表性的单词。在基于ldap的主题建模中，不能从数据中自动推断出每个主题的实际语义。相反，主题与其语义(人类可以理解的概念)之间的联系必须由一个人根据主观判断来确定。然而，一个有效的主题模型使得将语义与主题联系起来成为一项微不足道的任务;例如，“海滩”、“沙滩”、“太阳”和“放松”这些词一旦被LDA算法组合在一起，大多数人就会很容易地把它们识别为“假日”的概念。

除了LDA，其他自然语言处理方法已被用于主题建模，包括潜在语义分析/索引(LSA/LSI) [16]，概率潜在语义分析[17]和非负矩阵分解(NMF) [18］．一般来说，这些方法通过将每个文档建模为主题的混合，从文档级单词共出现中推断主题。然而，当从短文本(例如社交网络平台上的文本)中学习时，这种推断受到单词共现模式稀疏性的限制。短文本遇到的其他问题包括俚语、拼写或语法错误，以及无意义或嘈杂的单词。

LSA/LSI是非概率的，它依赖于一个被称为奇异值分解的数学过程[19]，并且可以使用术语频率逆文档频率矩阵，该矩阵将较大的权重分配给文档中频繁出现但在语料库中很少出现的术语，反之亦然。由于LSA/LSI技术通常需要大量语料库才能生成准确的分组或主题模型，因此它们不被认为是本研究的合适方法。另一种方法，pLSA，用概率分解代替奇异值分解。尽管pLSA是LDA的有效替代方案，但当使用pLSA的基本形式时，过拟合是不太可控的[20.］．NMF使用矩阵分解方法同时对术语文档矩阵进行降维和术语聚类以提取主题[21］．

Albalawi等[22]评估了一些短文本的主题建模方法，并得出结论，LDA和NMF提供了最好的学习描述性主题，并解决了影响其他主题建模方法的局限性。与NMF相比，LDA得到了更一致的结果[22]并已被应用于各个领域的研究，有许多现成的工具包可用于其实施。基于这些考虑，LDA被认为是最适合分析聊天机器人对话数据的方法。

研究人员对聊天机器人的对话进行了压力、睡眠和饮食方面的独立分析。与在线应用程序一样，这项研究中用户生成的文本通常在长度上是有限的。因此，通过将研究期间从同一参与者收集的多个对话合并为每个领域的单个对话，平均对话长度增加了(多媒体)．然后将这些合并的对话用于LDA主题建模。

开放式回答的预处理

第一个预处理步骤是去除停止词(即那些不包含主题信息的词)。英语中的停止词[23]被删除，另外的停顿词也被确定为特定于正在考虑的3个领域。我们把合成词转换成单词;例如，“not well”被转换为“not_well”。本地术语(“想要”、“知道”、“需要”、“两次”、“not_well”、“well”、“需要”、“去了”、“不能”、“场合”、“不”、“babi”、“感觉”、“okai”、“carri”、“unab”、“veri”、“左”、“右”、“关心”、“影响”、“manag”、“everi”、“感觉”、“时间”、“有时”、“肯定”、“onli”和“通常”)也被添加到停止词列表中。

使用Gensim库对对话中的剩余单词进行词干提取[24］．只有长度大于3个字母的词干标记被保留;较短的令牌被丢弃。在一个域中出现在不到2个对话中的令牌也被丢弃了，出现在该域中50%以上对话中的令牌也被丢弃了。对于属于喂养域的对话，产品名称和品牌名称也被删除。由此产生的标记形成了会话语料库，供基于ldap的主题建模执行知识提取(Gensim 3.7.1实现[24])。为LDA机器学习推导语料库的预处理工作流如图所示多媒体．目的是在使用LDA从聊天机器人对话中提取主题时，获得一个减少的单词集(语料库)。

知识提取

对于每个域，执行8个建模会话，要提取的潜在主题的数量设置为2到9之间的值。因此，为每个设置创建一个模型(提取2到9个潜在主题)。为了获得每个模型，我们通过随机改变用于初始化LDA过程的随机种子的值(即将一个单词分配到一个主题)来执行10次学习运行，而所有运行的训练通过次数(以确定单词属于一个主题的概率)都设置为100次。每个领域的最佳模型不能基于困惑度测量而明确地确定[25]，因此使用领域专家的人工解释。人类专家认为具有3或4个主题的模型是最可解释的。主题使用LDAvis可视化[26］．

由于主题是语料库整个字典的概率分布，只有具有最高概率值的单词才被认为是该主题语义的代表。我们在一个主题中选择了3个概率最高的单词，它们最能代表与该主题相关的语义概念。简单来说，我们可以把这3个概率最高的单词看作是该主题中使用频率最高的单词。

参与者

共有48名家长接受了筛查。其中45名参与者参与了这项研究。这包括5名足月婴儿参与者，他们被招募来取代因不合规而退出研究的参与者。婴儿45例(女性23例，占51%;20名早产儿和25名足月婴儿)。共有19名参与者退出研究:13名(68%)参与者未能完成至少5次互动，4名(21%)参与者在研究者的决定下退出，2名(11%)参与者撤回同意。共有26名参与者，每组13人完成了研究(图2)．

父母均为女性(n=45)。参与者的平均年龄为31.7岁(SD 4.3岁)，婴儿的平均年龄为1.1个月(SD 1.3个月)。表1)．参与者与聊天机器人完成了256次互动，其中分别包括259次、257次和267次关于压力、睡眠和进食的对话。

表1。参与者的特征和聊天机器人的反应。

特征			术语(N = 25)		早产(N = 20)		总(N = 45)
性别(父母)，n (%)			25 (100)		20 (100)		45 (100)
性别(婴儿)，n (%)			13 (52)		10 (50.0)		23日(51)
父母年龄(年)，平均值(SD)			31.1 (4)		32.5 (5.0)		31.7 (4)
婴儿月龄，平均(SD)			1.1 (1)		1.2 (1)		1.1 (1)
已完成对话，n
	压力域	126		133		259
	睡眠域	125		132		257
	喂养域	130		137		267
交互作用(所有3个域)，n			125		131		256
LDA的合并对话^一个主题建模^bn
	压力域	17		22		39
	睡眠域	17		22		39
	喂养域	18		22		40

^一个LDA:潜狄利克雷分配。

^b在这3个域中，属于同一参与者的对话被合并为单个对话。退出的参与者完成的聊天机器人互动被包括在对话分析中。

聊天机器人的易用性和满意度

在45名家长中，有26人完成了研究和可用性电子问卷。这26名参与者的回答(李克特5分制;1=非常困难，5=非常简单)表明聊天机器人被评为“容易”使用(平均值4.08，标准差0.74)。完成研究的早产儿组和足月组父母的评分相似(早产儿:平均3.9,SD 0.86;term: mean 4.2, SD 0.60)。早产儿和足月组父母(早产儿:平均4.0,SD 1.0;早产儿:平均4.19,SD 0.85;term: mean 4.38, SD 0.65)。

家长们对聊天机器人“满意”(平均值3.81，标准差0.90;1=非常不满意，5=非常满意)以及ClaimIt应用程序(平均值3.81，标准差0.80)。早产儿组的参与者对聊天机器人(平均3.62,SD 0.96)和ClaimIt(平均3.69,SD 0.85)应用程序的评分介于“中性”和“满意”之间。足月组的参与者对聊天机器人(平均4.0,SD 0.82)和ClaimIt(平均3.92,SD 0.76)应用程序的评分平均值更高。

早产儿组感觉互动时长介于“长”与“中性”之间(均值2.92，标准差1.19;1=太长，5=易于管理)，而术语组认为互动长度介于“易于管理”和“易于管理”之间(均值4.31，标准差0.48)。此外，46%(6/13)的早产儿父母和23%(3/13)的足月父母在使用聊天机器人时遇到了技术问题。

总体而言，参与者并不担心分享他们的信息(平均4.04，标准差1.08;1=非常担心，5=完全不担心)，并且很可能再次使用聊天机器人(平均值3.35，标准差0.75;1=完全不可能，5=非常可能)。足月组和早产儿组的父母通常都不担心数据共享，并报告在“中性”和“可能使用”聊天机器人技术就类似主题提供输入之间。

回答关于压力、睡眠和饮食的封闭式问题

研究人员分析了45名家长的对话。与足月婴儿父母相比，早产儿父母更频繁地报告情绪压力(33次对24次)。足月婴儿的父母比早产儿的父母更频繁地报告身体压力(30次对10次)。当压力的原因与他们的婴儿没有直接联系时，足月婴儿的父母报告压力源的情况更多(早产儿组为27次对18次)。早产儿和足月父母共同经历的压力来源是母乳喂养、工作和人际关系。只有足月婴儿的父母报告了与乳房相关的问题(7次)。

一般来说，父母认为他们的睡眠质量是令人满意的，尽管早产儿组报告良好睡眠的频率略低于足月组(图3)．就每天的总睡眠时间而言，早产儿父母报告的平均睡眠时间为5.8小时，而足月父母报告的平均睡眠时间为6.1小时。

在母乳喂养婴儿的父母中，最常见的喂食频率是每天8到11次。早产组和足月组都是如此。在给婴儿喂食配方奶粉的父母中，早产儿和足月组最常见的喂食频率都是每天4至7次。喂养问题，如不规律的喂养，早产组父母比足月组父母更频繁地报告(分别为8次对2次)。

从聊天机器人对话语义分析推断知识

45名参与者对对话脚本的开放式回答被用于语义分析。由于原始对话的长度有限，属于同一参与者的对话被合并为单个对话。结果是，压力域有39次对话(17个学期，22个早产)，平均对话长度为27.4个单词;睡眠域有39次对话(17个学期，22个早产)，平均对话长度为28.5个单词;进食域有40次对话(18个学期，22个早产)，平均对话长度为16.9个单词(表1)．

对于压力和睡眠领域，在每个lda派生的模型中，每个主题的前3个最具代表性的单词在10次学习中是一致的。对于喂养领域，10个学习运行的主题组成具有高度可变性的特征;也就是说，每个话题中最具代表性的前3个单词在学习过程中有所不同。因此，无法从喂食领域的对话中学习到最佳且可重复的主题集。这可能是因为与压力和睡眠领域的对话相比，喂食对话的长度更短。

对于所有3个领域，具有3或4个语义主题的模型被人类专家认为是最可解释的。使用LDA主题建模推断的压力(4个主题)和睡眠(3个主题)领域的语义主题如下所示图4而且5,分别。每个主题只显示前3个最具代表性的单词。

压力域

在图4，话题1似乎与积极情绪和压力较小的情况有关。话题2和话题4都反映了适度幸福和疲劳的“复杂感觉”，而话题3似乎与身体不适的感觉有关。

当计算每组4个话题的对话分布时(图6)，与相反感觉相关的话题(话题1和话题3)在足月父母和早产父母中表现出不同的模式:话题1(积极)是足月父母对话中最常见的话题，而早产儿父母在对话中使用与此主题相关的词汇的频率较低。另一方面，话题3(身体不适)在足月父母的谈话中出现的频率较低，而早产儿父母则更多地使用属于这个话题的词汇。在早产儿组父母的对话中，经常出现与“不适”相关的代表性词汇(“疼痛”、“乳房”和“睡眠”)，这表明早产儿组的父母经历了更高程度的身体压力和不适。

睡眠域

在睡眠领域，主题1似乎与母乳喂养有关，主题2与一般意义上的喂养有关，主题3与使用奶泵喂养有关(图5)．这表明，当父母被要求评论他们的睡眠时，他们的回答围绕着喂养的某些方面，这表明喂养可能会干扰父母获得充足睡眠或休息的能力。当按组计算这3个话题的对话分布(即每个话题的流行程度)时，足月父母和早产儿父母在对话中没有表现出与压力域不同的语义模式。

喂养域

对于这个域，平均会话长度比其他2个域短，导致较小的馈电会话数据集。因此，无法为喂养领域学习到最优且可重复的主题集。尽管如此，有趣的是，与进食相关的词汇和话题主导了为睡眠这个不同领域收集的对话内容(图5)，表明父母在照顾婴儿时，认为这两个领域之间存在密切的相互作用。

主要研究结果

这项研究使用聊天机器人从早产儿和足月婴儿的父母那里收集了关于父母压力、睡眠和婴儿喂养的现实生活数据。完成研究的参与者对他们与聊天机器人的在线互动感到满意，并且发现聊天机器人易于使用。重要的是，他们并不担心通过互动工具分享这些信息，并且愿意在未来使用聊天机器人就类似主题提供输入。这一发现有助于验证在移动设备上使用聊天机器人作为一种方便和可访问的手段来支持新生儿的父母，并收集关于对婴儿和父母的健康和福祉很重要的主题的数据。

对于压力域，从语义分析中提取的首要对话话题显示了足月婴儿父母强烈的积极情绪。其他话题捕捉了适度幸福和疲劳以及总体不适的复杂感觉。早产儿的父母更有可能通过“疼痛”、“乳房”和“睡眠”等代表性主题词来表达身体不适和疲劳的经历。因此，语义分析揭示了早产儿父母的高物理压力状态。此外，与学期组父母相比，他们也更频繁地报告情绪压力。类似的经验在早期的研究中也有报道[2，3.]，特别是早产儿入住重症监护室的个案[5］．在我们的研究中，足月婴儿的父母比早产儿组的父母更频繁地表达积极的情绪。然而，她们并没有免除照顾婴儿的压力，报告身体压力的场合比早产儿组更多。随着家庭新成员的加入，在这项研究中，早产儿和足月组父母都报告了涉及工作和人际关系的非婴儿相关的压力源。

从我们对聊天机器人关于睡眠的语义分析中，有一个有趣的发现是，所有父母(包括足月组和早产儿组)最常见的三个话题都与喂养有关。这一观察表明，父母直观地将喂养活动与他们无法得到充分休息联系在一起。这可以解释为她们需要在白天和晚上有规律地喂养婴儿。事实上，最常见的母乳喂养频率是每天8 - 11次，婴儿配方奶粉喂养频率是每天4 - 7次。语义分析揭示了进食和睡眠之间的密切联系，为封闭式睡眠反应增加了另一个维度。尽管两组都报告了令人满意的整体睡眠质量，但早产儿组的父母报告良好睡眠质量的频率略低。早产儿组的父母也报告了喂养问题，如不规律的喂养，比足月组的父母更多。

局限性和未来工作

在45名参与研究的参与者中，共有11人(24%)因不合规(未能完成所需数量的聊天机器人交互)而退出研究。对于一些参与者来说，从注册到第一次与聊天机器人互动之间有延迟(长达29天)。这些延迟可能是由于父母所经历的压力和出院后在家照顾新生儿的额外责任。尽管提醒通知在每周的第一天发送，但如果参与者在第四天之前没有开始聊天，则只会在第四天触发下一个通知。高不合规率可能表明可用性有限;出于这个原因，可用性问卷的结果(仅由完成者回答)是描述性的，而不是试图进行统计测试。实现更早更频繁的提醒通知可以提高参与者对聊天机器人交互的依从性。在研究期间，通过电话和外部消息平台(WhatsApp和电子邮件)实施了手动提醒，以提高依从性，并获得了良好的反响。这些提醒可以在未来的工作中实现，同时进一步优化移动应用程序和聊天机器人的技术性能，以改善整体用户体验和提供实时数据的参与度。

单词模式的变化被认为传达了类似的结构，这可能会给完全无监督的分析带来一些问题。例如，在压力和睡眠脚本中，参与者被问及他们的感觉如何，并给出诸如“好”、“还不错”、“做得很好”、“上帝”和“好极了”等答案。直观地说，“好”、“还不错”和“做得不错”可以解释为回答的人感觉“不错”，然而，如果没有适当的人工预处理，“上帝”和“兜帽”等词可能无法被LDA算法适当处理。会话长度通过合并多个会话来增加，以提高前面讨论的LDA算法的效率。对于喂食域，平均合并对话长度(16.9个单词)远短于其他2个域(27-28个单词)。这导致了一个更小的输入对话数据集，并可能解释为什么不能为该领域学习可重复的主题集。未来的研究应该尝试用更大的对话数据集来验证这一探索性工作的发现，包括对话的数量或长度以及参与者的数量。还可以探索针对短文本数据的其他主题建模方法，以改进对短或可变对话长度的处理。

虽然3个聊天机器人脚本(压力、睡眠和进食)收集了大量的信息，但信息的深度是有限的。这些剧本探讨了父母的当务之急和他们高水平的日常活动，但需要进一步研究才能获得更深入的见解。未来的工作可能会扩大聊天机器人的范围，以检查与其他婴儿或家庭特征相关的对话主题模式，如单胎或多胎生育、父母的年龄或年龄组、主要照顾者的数量，或第一次做父母和有一个以上孩子的父母之间的差异。如果能够收集到不同地理区域的数据，对于探究不同地区父母之间的异同也会很有意义。

我们的研究表明，将机器学习应用于聊天机器人引发的开放式对话，可以提供比封闭式问卷回答或描述性统计所提供的更多见解。在人类专家解释的适当指导下，LDA等无监督分类方法可以揭示对话数据中可能没有预料到的链接或感兴趣的主题。此外，有人认为聊天机器人等会话代理也有助于满足其他情感需求。10］．在我们的环境中，与聊天机器人交谈可以帮助父母克服孤立感，应对负面情绪并获得鼓励，同时，在他们正在努力解决的日常问题上改善沟通过程。

结论

在这项研究中，一个聊天机器人成功地收集了关于父母压力、睡眠和婴儿喂养的实时、开放式对话数据。使用机器学习，我们对语义模式的分析揭示了早产儿和足月组父母在对话话题流行度方面的差异，尤其是在压力领域。足月婴儿的父母更常表现出积极的情绪，而早产儿的父母更常表现出不适和疲劳的感觉，这表明他们正经历着更高水平的压力。涉及婴儿喂养的话题主导了睡眠领域的对话内容。结合自我报告的睡眠质量和喂养问题的结果，睡眠和婴儿喂养之间的这些联系表明，早产儿父母可能更容易受到与频繁喂养或喂养问题相关的睡眠质量差的影响。总体而言，完成了关于聊天机器人可用性体验的研究的家长们给出了积极的反馈，他们表达了自己的想法和担忧。

致谢

研究发起人(达能纽迪西亚研究公司)负责研究设计、数据收集、数据分析，并决定是否将手稿提交发表。达能纽迪西亚研究公司为开展这项研究提供了资金。编辑支持由Tech Observer Asia Pacific提供，并由达能纽迪西亚研究公司资助。

作者的贡献

JW对研究的概念和设计、数据的分析和解释以及手稿的起草和修订做出了贡献。

ACF在研究概念和设计、数据分析和解释、手稿起草和修订等方面做出了贡献。

ST对数据的分析和解释，以及手稿的起草和修订做出了贡献。

EA对数据的分析和解释以及文稿的起草和修订做出了贡献。

RMVE对研究概念和设计、数据分析和解释以及手稿起草和修订做出了贡献。

CMC对研究概念和设计做出了贡献。她负责研究的实施，研究资源的获取，包括参与者招募，数据收集，分析和数据解释。她还参与了手稿的起草和修订。

所有作者都参与了手稿的写作和重要知识内容的重要修改，并批准了最终版本的出版。

利益冲突

在进行这项工作时，ACF隶属于新加坡达能纽迪西亚研究公司(Danone Nutricia Research)的精确营养D-lab。在进行这项工作时，JW隶属于新加坡达能纽迪西亚研究公司(Danone Nutricia Research)精准营养D-lab。在进行这项工作时，ST隶属于达能纽迪西亚研究公司，新加坡精密营养实验室，目前隶属于新加坡Cytel私人有限公司。在进行这项工作时，EA隶属于达能纽迪西亚研究公司，新加坡精密营养d -实验室，目前隶属于新加坡NLYTICS私人有限公司。RMvE在进行这项工作时隶属于达能纽迪西亚研究中心，目前隶属于荷兰阿姆斯特丹大学医学中心艾玛儿童医院;以及荷兰希尔弗瑟姆的营养4health。CMC没有利益冲突需要申报。

‎

多媒体附件1

聊天机器人的压力、睡眠和进食脚本。

DOCX文件，62 KB

‎

多媒体附件2

用于聊天机器人和ClaimIt应用程序的可用性e问卷。

DOCX文件，42 KB

‎

多媒体

会话预处理，提取潜在狄利克雷分配语料库。

DOCX文件，62 KB

M . Missler M . van Straten A . Denissen J . Donker T . Beijers R.心理教育干预对期望父母预防产后育儿压力、抑郁和焦虑的有效性:一项随机对照试验。BMC怀孕分娩2020年10月31日;20(1):658 [免费全文] [CrossRef] [Medline］
陈志伟，陈志伟，陈志伟，陈志伟。极端早产对家庭功能和孕产妇健康的影响。儿科学2010年7月;126(1):e81-e88。［CrossRef] [Medline］
杨强，王志刚，杨强。多胎早产儿与单胎早产儿的关系。新生儿网络2017年3月1日;36(2):77-88。［CrossRef] [Medline］
弗莱彻L, Pham T, Papaioannou H, Spinazzola R, Milanaik R, Thibeau S.父母对早产儿风险的认知。新生儿护理2017年8月17日(4):306-312。［CrossRef] [Medline］
波利克B，布比克A，梅斯托维克J，马基奇J，科瓦切维奇T，尤里奇M，等。晚期早产是后期生活中母亲压力的一个强有力的预测因素:学龄儿童的回顾性队列研究。儿科儿童健康杂志2016年6月;52(6):608-613。［CrossRef] [Medline］
Cattarius BG, Schlarb AA。从怀孕到产后三个月，夫妻的睡眠是如何变化的。睡眠科学2021;13:51 -261 [免费全文] [CrossRef] [Medline］
Gay CL, Lee KA, Lee S.新父母的睡眠模式和疲劳。生物学研究2004 april;5(4):311-318 [免费全文] [CrossRef] [Medline］
夏奇，伊可，马灿，汤普逊-维斯特拉J, Pearlstein TB。在有重度抑郁症(MDD)病史的女性中，婴儿睡眠和喂养模式与母亲的睡眠、压力和抑郁情绪有关。Arch women Ment Health 2016 april;19(2):209-218 [免费全文] [CrossRef] [Medline］
何涛，薛超，王涛。2岁前早产儿喂养方式与父母对喂养问题的认知。Am J占用Ther 2019;73(2):7302205030p1-7302205030p10。［CrossRef] [Medline］
肖尔滕先生，凯德斯，范吉杰。自我引导的基于web的干预:对用户需求的范围审查和嵌入式会话代理解决这些需求的潜力。J Med Internet Res 2017 11月16日;19(11):e383 [免费全文] [CrossRef] [Medline］
Fry JP, Neff RA。健康促进和健康行为干预的定期提示和提醒:系统审查。中国医学网络学报2009;11(2):e16 [免费全文] [CrossRef] [Medline］
Hall WA, Moynihan M, Bhagat R, Wooldridge J.婴儿行为睡眠问题干预前后父母睡眠质量、疲劳、婴儿睡眠认知与父母抑郁的关系。BMC妊娠分娩2017 Apr 04;17(1):104 [免费全文] [CrossRef] [Medline］
Rahman A, Al Mamun A, Islam A.聊天机器人的编程挑战:当前和未来展望。2017年出席:人道主义技术大会(R10-HTC);2017年9月30日- 10月2日;达卡,孟加拉国。［CrossRef］
陈杰，陈志强，陈志强，等。医疗保健中的对话代理:系统回顾。J Am Med Inform association 2018年9月01日;25(9):1248-1258 [免费全文] [CrossRef] [Medline］
李志强，李志强，李志强。潜狄利克雷分布的在线学习方法。在:神经信息处理系统的进展。2010发表于:第24届神经信息处理系统年度会议2010;2010年12月11日;加拿大温哥华，第856-864页。
潜在语义分析。安。启信息。科学。技术2005 9月22日;38(1):188-230。［CrossRef］
概率潜在语义索引。1999年发表于:第22届国际ACM信息检索研究与发展会议(SIGIR '99);1999年8月15日至19日;加州伯克利，第50-57页。［CrossRef］
Berry MW, Browne M.使用非负矩阵分解的电子邮件监视。计算数学组织理论2006年1月14日;11(3):249-264。［CrossRef］
Wall ME, Rechtsteiner A, Rocha LM。奇异值分解与主成分分析。见:微阵列数据分析的实用方法。马萨诸塞州波士顿:施普林格;2003:91 - 109。
张海红，李志强，李志强。基于连续观察的正则化概率语义分析方法。2012年发表于:第十一届机器学习与应用国际会议;2012年12月12日至15日;佛罗里达州博卡拉顿[CrossRef］
金俊，何勇，Park H.非负矩阵和张量分解算法:基于分块坐标下降框架的统一观点。《中国科学》2013年3月2日;［CrossRef］
李志强，李志强。基于主题建模方法的短文本数据分析。Front Artif Intell 2020;3:42 [免费全文] [CrossRef] [Medline］
斯通B，丹尼斯S，坎蒂斯PJ。单段相似度分析方法比较。Top cogsci 2011 1月;3(1):92-122 [免费全文] [CrossRef] [Medline］
Řehůřek R, Sojka P.大型语料库主题建模软件框架。2010年发表于:LREC关于NLP框架新挑战的研讨会;2010年5月22日;瓦莱塔,马耳他。［CrossRef］
Jelinek F, Mercer RL, Bahl LR, Baker JK。困惑度——衡量语音识别任务的难度。美国声学学会学报1977年12月;62(S1):S63。［CrossRef］
雪莉·k·戴维斯:一种可视化和解释主题的方法。2014年发表于:交互式语言学习、可视化和界面研讨会;2014年6月27日;马里兰州巴尔的摩[CrossRef］

‎

eQuestionnaire:电子问卷调查

加护病房:重症监护室

LDA:潜在狄利克雷分配

LSA /大规模集成电路:潜在语义分析/索引

NMF:非负矩阵分解

查询:概率潜在语义分析

G·艾森巴赫(G Eysenbach)编辑;提交09.06.21;Q Yang同行评审;作者评论02.07.21;接受19.09.21;发表26.10.21

©Jill Wong, Agathe C Foussat, Steven Ting, Enzo Acerbi, Ruurd M van Elburg, Chua Mei Chien。最初发表在JMIR儿科学与育儿(https://pediatrics.www.mybigtv.com)， 26.10.2021。

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用最初发表在JMIR儿科学和育儿杂志上的原创作品。必须包括完整的书目信息，https://pediatrics.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

让早产儿和足月婴儿的父母参与父母压力、父母睡眠和婴儿喂养的聊天机器人:可用性和可行性研究