JMIR
J医疗互联网服务
医学互联网研究杂志
1438 - 8871
卡塔尔世界杯8强波胆分析JMIR出版公司
加拿大多伦多
v16i9e216
25239002
10.2196 / jmir.3761
的观点
的观点
医学知识发现与创新的众包
Eysenbach
冈瑟
Sarafi内贾德
Afshin
Holzinger
安德烈亚斯
三通
Sim-Hui
附加评论
狮子座安东尼
Md, mph, ms
1
医学工程和科学研究所
计算生理学实验室
麻省理工学院
马萨诸塞大道77号
e25 - 505
剑桥,马萨诸塞州,02139
美国
1 617 253 7937
1 617 258 7859
lceli@mit.edu
2
http://orcid.org/0000-0001-6712-6626
使役动词
安德里亚
孟女士,
3.
http://orcid.org/0000-0003-2025-6591
蒙哥马利
罗伯特一个
医学博士
4
http://orcid.org/0000-0001-9914-6082
摩西
克里斯多夫
废话
5
http://orcid.org/0000-0003-4172-4446
石头
大卫J
医学博士
6
http://orcid.org/0000-0003-4855-4283
1
医学工程和科学研究所
计算生理学实验室
麻省理工学院
剑桥,麻
美国
2
贝斯以色列女执事医疗中心
肺,重症监护和睡眠医学部“,
哈佛医学院
波士顿
美国
3.
工程系统科
麻省理工学院
剑桥,麻
美国
4
贝斯以色列女执事医疗中心
医学系
哈佛医学院
波士顿
美国
5
Smart Scheduling公司
剑桥,麻
美国
6
UVA无线健康中心
麻醉科和神经外科
弗吉尼亚大学医学院
弗吉尼亚州夏洛茨维尔
美国
通讯作者:Leo Anthony Celi
lceli@mit.edu
09
2014
19
09
2014
16
9
e216
06
08
2014
27
08
2014
31
08
2014
31
08
2014
©Leo Anthony Celi, Andrea Ippolito, Robert A Montgomery, Christopher Moses, David J Stone。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2014年9月19日。
2014
这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
临床医生面临着困难的治疗决定,在这种情况下,根据研究制定的现有证据并没有很好地解决。医学数字化为临床医生与研究人员和数据科学家合作提供了一个机会,可以解决以前模棱两可和看似无法解决的问题。但这些群体往往在孤立的环境中工作,不能有效地沟通或互动。临床医生通常被埋在日常实践的杂草和紧急情况中,以至于他们没有认识到或采取行动来提高知识发现。研究人员可能无法识别临床知识的差距。对于数据科学家来说,主要的挑战是在一个既陌生又复杂的领域中识别什么是相关的。每种类型的领域专家都可以提供其他组无法提供的技能。由不同参与者共同参与的“健康黑客马拉松”和“数据马拉松”可以利用当前现成的数字数据来发现新知识。利用这些人才的互补技能和专业知识,但功能划分的群体,创新是在系统层面制定的。因此,知识发现过程同时得到了民主化和改进,真正的问题得到了解决,跨学科合作得到了支持,创新得以实现。
知识发现
众包
创新
这家网站
填补医学知识空白
1948年10月30日,英国医学研究委员会的奥斯汀·布拉德福德·希尔(Austin Bradford Hill)和他的同事发表了《链霉素治疗肺结核》[
1 ].利用抛硬币的力量(在这种情况下,随机抽取一个信封),希尔能够消除选择偏差,揭示出当时可能存在的最清晰的因果关系。通过这一简单的补充,他建立了随机对照试验(RCT)的基本框架,这是指导循证医学的新标准。自那以后的几年里,随机对照试验颠覆了许多临床实践,使医学领域组织成一个创造和传播新知识的系统。然而,在第一次随机对照试验65年后,只有10-20%的医疗决策是基于证据的[
2 ].而且,随着目标人群按照慢性疾病的排列和无数的遗传多态性进行细分,随着诊断工具变得更加个性化,随着治疗方案从对单个药物和设备的评估扩展到包括医疗保健交付网络本身,rct越来越明显地无法扩展到与医疗复杂性的指数级增长相匹配。虽然正在努力减少进行研究的浪费、成本和难度,但临床医生和患者目前都在应对一个不可接受的模糊系统[
3. -
6 ].
当面对复杂的诊断或治疗的不确定性时,患者和提供者都面临着一些困境。诊断和治疗困境的结合产生了困难决策的需要,这些决策存在于个体患者因素和实践环境中,并受到它们的强烈影响。一个人必须决定什么时候更深入地探索,什么时候退缩,不受干预地观察。基于目前的不确定性水平,试图让患者进一步参与决策过程是困难的,也许对医学界来说有点尴尬。在任何临床互动过程中,由于研究结果或临床文献翻译到床边的不完整,出现一个或多个问题或问题无法完全解决,但更常见的是由于医学知识的不完整状态。
医学教育很大程度上包括获得技能和信心,不仅是在导航方面,而且是在随后引导他人走过这条模糊的道路上。研究企业的关键目标之一是降低这种模糊性,以便实践更彻底地基于证据。随着数字文档几乎无处不在的实现,我们有可能回答更多目前尚未解决的问题,并将这些答案转换为实时工作流。
全职临床医生和知识发现
理想情况下,从我们每天已经创建并进一步生成的大量电子数据中,一线提供者应该更好地回答与个别患者有关的棘手问题。更好的信息可以让临床医生在更充分考虑患者参与的情况下做出更好的决定。然而,这种方法确实存在但可以克服的障碍。答案的浓缩版本是,我们需要更多精通数据的参与者,以及更精心设计的软件应用程序,作为临床数据分析过程的核心。临床医生不应该成为数据科学家,但对基本数据问题的适当认识和理解正迅速成为临床实践的重要元素。这并不代表当前和未来几代医学学生(他们在数字环境中长大)的绊脚石,它可能代表着年长的,有时抗拒的临床医生。
期望临床医生对临床数据进行查询以为每个患者生成证据/数据驱动的决策是不现实的。考虑到目前缺乏技术基础设施,使一线提供者能够在护理点实时或近乎实时地提出此类问题,这一点尤其如此。这揭示了我们当前知识生成系统的一个关键脆弱性:研究人员、数据系统工程师和临床医生之间的角色划分。这种分离对研究人员来说是有害的,它使得在临床决策中很难识别知识差距。对于工程师来说,这些问题包括在一个陌生而复杂的领域中识别什么是重要的,在不可互操作的专有竖井中工作,以及创建有效且用户友好的临床信息系统所涉及的困难。对于从业者来说,它削弱了与科学调查的联系感,并使忙碌的临床医生从建设性的询问和参与他们自己的临床数据系统中解脱出来。总的来说,这些系统缺陷限制了用于解决患者日常护理中遇到的无数问题的人员、想法和创新的原始数量。
民主化研究I:众包和开放数据
在认识到挑战的同时,我们认为找到使研究民主化或“众包”的方法很重要。2005年,《连线》杂志的编辑杰夫•豪和马克•罗宾逊在讨论企业如何利用互联网将工作外包给个人后,首次提出了“众包”一词。
7 ].
简单地说,众包是指公司或机构将原本由员工完成的功能以公开呼叫的形式外包给一个未定义的(通常是大型的)人员网络的行为。这可以采取对等生产的形式(当工作是合作完成的时候),但也经常是由个人承担的。关键的先决条件是使用公开呼叫格式和潜在劳动者的庞大网络。
医学领域的众包知识发现可以垂直地通过降低一线提供者的参与门槛来实现,也可以横向地通过将输入角色扩大到非传统但感兴趣的贡献者(如患者本身)来实现。当应用于一般的创新时,这一过程将允许人们与医疗系统互动,开发出他们想要的东西,而不是依赖于制造商充当他们(通常非常不完美)的代理人。此外,个人用户不应该从头开始构建一切或自己查询数据库:他们受益于与那些拥有他们所缺乏的技能的人合作,或者基于其他人开发并免费共享的解决方案。
将用户驱动的研究和开发嵌入社区可以建立连接,加速和增强创新过程,提高解决方案或新知识传播的速度和有效性[
8 ].这个概念已经在其他行业中得到了很好的证明。例如,美国国防高级研究计划局最初开发阿帕网是为了建立一个由研究人员和国防承包商组成的网络,以加速软件和数据的交换,这就演变成了我们所知道的互联网。
9 ].Linus Torvalds在1991年开发了LINUX,作为一个免费的开源操作系统,任何人(尽管有必要的技能)都可以为它的开发做出贡献。
10 ].
尽管医学给系统性变革和改进带来了一系列独特的挑战,但需要一种更加民主化的方法来支持和优化这些过程。卫生领域有许多项目采用了众包作为方法,包括我们在这里引用的三个项目。" FoodSwitch "是一款流动电话应用,透过应用内整合的众包功能,向消费者提供用户提供的营养资讯[
11 ].在另一篇论文中,布朗和同事描述了一种分发科学文献评估的方法,这是一项耗时的工作,需要数小时的编码和评级,通过使用亚马逊的“机械土耳其人”(Mechanical Turk)在线众包,在一个大群体中分发评估。
12 ].最后,古德和他的公司开发并评估了一款名为“治愈”的在线游戏,该游戏从玩家那里收集了关于基因的信息,用于预测乳腺癌的生存率[
13 ].他们的团队证明,众包游戏可以作为解决涉及领域知识的问题的一种手段。
众包和开放数据运动提供了一个机会,让一线提供者和患者参与加速创新,包括知识创造。与分散的众包网络不同,“黑客马拉松”和数据马拉松为那些在医疗一线的人提供了机会,他们最熟悉内部的痛点和困扰日常实践的信息差距,为迫切需要的医疗保健转型做出贡献。传统上,知识发现和创新仅限于那些在学术界从事研究或在工业界从事咨询工作的医生,或者那些放弃临床医学的医生。从事学术研究的资金和指导生物技术研究的机会很少提供给临床医生,他们大部分时间都在实践中度过。研究被认为是那些受过实验方法和/或数据分析培训的人的专利,而在生物医学创业或咨询方面,额外的商业学位更受欢迎。因此,研究和创新的重点与真正改善医疗服务和健康结果的解决方案之间总是存在一定程度的脱节。此外,执业临床医生几乎总是被日常的苦差事弄得筋疲力尽,对卫生保健系统的低效感到沮丧,很少有时间、机会和动力退一步解决系统层面的问题,包括医学实践中的知识差距。
民主化研究II:黑客马拉松和数据马拉松
传统上,黑客马拉松是创新过程前端的24至48小时活动,提供了一个可访问的论坛,以快速、迭代的方式提出复杂、困难的问题,并开发初始解决方案和原型。医疗黑客马拉松和数据马拉松为提供商提供了与工程师或数据科学家合作的机会,并通过提供围绕问题或信息差距的临床观点来快速产生影响。同样,这些活动为工程师和数据科学家提供了一个很好的论坛,可以接触到医学中的实际问题,并与拥有专业领域知识的利益相关者进行交流。通过工程师和数据科学家与临床医生的合作,黑客马拉松和数据马拉松为非临床医生提供了一个难得的机会来改变医疗保健。虽然真正新颖的发现或功能齐全的解决方案在活动结束时是罕见的结果,但我们相信,以医疗保健为重点的黑客马拉松和数据马拉松能够实现有价值和多样化的观点的众包,并建立新的个人联系,这将成为长期有效合作的基础。
本文作者帮助组织了许多黑客马拉松和数据马拉松,这些黑客马拉松和数据马拉松将工程师、数据科学家和临床医生(包括护士、药剂师和其他相关卫生人员)聚集在一起,以解决常规临床实践中发现的问题和问题,包括2014年1月在麻省理工学院(MIT)举行的关键数据马拉松(参见
多媒体附件1 ).迄今为止,麻省理工学院黑客医学已经在美国、印度、乌干达和西班牙组织了17场活动,合作伙伴包括麻省理工学院的计算生理学和萨那实验室、麻省总医院(MGH)的负担得起的医疗技术联盟(CAMTech)以及布里格姆妇女医院。这些活动产生了600多个创新想法,250多个团队开发了原型,推出了产品,并/或发表了论文。此外,许多其他组织和计划也在医疗保健界为这场黑客马拉松运动做出贡献,包括健康2.0、黑客健康和MedStar创新研究所。
在黑客松期间培育的合作产生的创新类型的一个例子是增强型婴儿复苏器(AIR) [
14 ].乌干达儿科医生、姆巴拉拉科技大学研究员Data Santorino博士介绍了低收入国家出现的因不当复苏技术导致新生儿死亡的问题。在麻省理工大学举办的一次黑客松上,他与麻省理工学院的一位工程师、麻省理工大学的另一位临床医生和一位企业家合作,开发出了AIR的原型。该项目此后获得了可观的投资,目前该设备正在乌干达进行实地试验。
在2014年1月举行的麻省理工学院关键数据马拉松(MIT Critical Data Marathon)中,参与者直接在一个名为MIMIC的大型开放临床数据库上工作,MIMIC是重症监护多参数智能监测(Multi-parameter Intelligent Monitoring in Intensive Care)的缩写。
15 ].该数据库是麻省理工学院波士顿贝斯以色列女执事医疗中心(BIDMC)和飞利浦医疗保健公司公私合作伙伴关系的产物。致力于存档bidmc重症监护室的所有可用数据,而不是当时认为相关的子集,研究人员随后去识别并发布数据库,以便免费访问。我们相信,向尽可能多的人提供数据是解锁电子健康记录中功能上的神秘信息,并将其转化为有价值的信息的最佳方法。MIMIC吸引了临床医生和数据科学家,他们合作进行了许多结果研究,其中包括实践变异性的检查、治疗效果的异质性、成本分析和预测建模等。通常没有从事过研究,但对信息差距以及医疗实践中涉及的要素有深刻理解的临床医生现在被授权为数据驱动的学习系统做出贡献并成为其中的一部分。
可实现的好处
我们之前曾评论过开放数据和众包如何解决问题,但同时也可能加剧不可靠和浪费研究的问题[
16 ].这个问题源于发表的东西的不可重复性,以及研究人员无法知道哪些东西没有发表。我们小组在2014年1月举办的数据马拉松会议上组织了一次会议,以解决这些问题[
16 ].来自学术界、政府和各行业的思想领袖聚集在一起,讨论席卷医疗保健的数据革命的陷阱和挑战。共识似乎是,成功将需要系统化和完全透明的数据询问,在处理相同或类似问题的不同调查小组之间自由共享数据和方法。科学发现的准确性的增加只是开放数据运动系统化的好处之一。另一个将是为各种教育水平和专业领域的个人提供为科学做出贡献的机会。
关键数据马拉松是实现MIMIC目标的一个例子:医学研究的民主化和知识发现的众包。我们看到临床医生兴奋地与数据科学家合作,将他们的问题转化为研究设计和方法;护士和医生为数据科学家提供必要但细致入微的临床情况;甚至还有建筑师和设计师协助可视化的发现。通过吸引临床医生和未来的临床医生,也就是医学生,我们使他们能够在系统层面上为创新做出贡献。关于如何扩展数据集以及支持使用这些数据集的基础设施,仍然存在一些悬而未决的问题。但是,尽管存在这些挑战,众包运动正在慢慢地将医学文化转变为研究和实践之间没有界限的文化。这些黑客马拉松和数据马拉松为一线卫生保健工作者提供了一个平台,为他们所面临的问题提供解决方案,通过吸引那些可能不认为自己是学者或企业家的人,使卫生保健领域的创新和研究民主化,并在更大范围内利用跨学科合作的力量。
多媒体附件1
首届MIT关键数据马拉松,2014年1月3-5日。照片由Andrew Zimolzak提供。
缩写
空气
增强婴儿复苏器
BIDMC
贝斯以色列女执事医疗中心
MGH
马萨诸塞州总医院
模仿
重症监护中的多参数智能监护
麻省理工学院
麻省理工学院
个随机对照试验
随机对照试验
没有宣布。
[
]1
医学研究委员会
链霉素治疗肺结核
Br医学J
1948
2
4582
769
782
2091872
[
]2
美国学习医疗保健系统委员会
医学研究所
史密斯
米
桑德斯
R
Stuckhardt
l
麦金尼斯
JM
以更低的成本获得最好的护理:在美国持续学习医疗保健的途径
2012
09
06
华盛顿特区
国家科学院出版社
[
]3.
《经济学人》
2013
10
19
2014-09-15
不可靠的研究:实验室的麻烦
http://www.economist.com/news/briefing/21588057-scientists-think-science-self-correcting-alarming-degree-it-not-trouble
6 scxiz9j1
[
]4
埃尼迪斯
摩根大通
格陵兰岛
年代
Hlatky
妈
库利
乔丹
麦克劳德
先生
莫赫
D
舒尔茨
KF
Tibshirani
R
在研究设计、实施和分析中增加价值和减少浪费
《柳叶刀》
2014
01
11
383
9912
166
75
10.1016 / s0140 - 6736 (13) 62227 - 8
24411645
s0140 - 6736 (13) 62227 - 8
[
]5
麦克劳德
先生
米奇
年代
罗伯茨
我
Dirnagl
U
查尔默斯
我
埃尼迪斯
摩根大通
Al-Shahi萨尔曼
R
陈
亚历山大-伍尔兹
Glasziou
P
生物医学研究:增加价值,减少浪费
《柳叶刀》
2014
01
11
383
9912
101
4
10.1016 / s0140 - 6736 (13) 62329 - 6
24411643
s0140 - 6736 (13) 62329 - 6
[
]6
陈
亚历山大-伍尔兹
首歌
F
维氏
一个
杰佛逊
T
Dickersin
K
Gøtzsche
个人电脑
Krumholz
嗯
Ghersi
D
范德沃普
乙肝
增加价值和减少浪费:解决不可接近的研究
《柳叶刀》
2014
01
18
383
9913
257
66
10.1016 / s0140 - 6736 (13) 62296 - 5
24411650
s0140 - 6736 (13) 62296 - 5
[
]7
豪
J
众包:一个定义
2014-08-31
http://crowdsourcing.typepad.com/cs/2006/06/crowdsourcing_a.html
6 sec6ae4b
[
]8
冯
E
民主化创新:用户创新的演变现象
JfB
2005
3.
55
1
63
78
10.1007 / s11301 - 004 - 0002 - 8
[
]9
瑞安
J
互联网和数字未来的历史
2010
英国伦敦
利益图书有限公司
[
]10
DiBona
C
Ockman
年代
开源:来自开源革命的声音
1999
塞瓦斯托波尔,
O ' reilly媒体
[
]11
Dunford
E
Trevena
H
古德塞尔
C
Ng
KH
韦伯斯特
J
米尔斯
一个
戈尔茨坦
年代
Hugueniot
O
尼尔
B
FoodSwitch:一个手机应用程序,使消费者能够做出更健康的食品选择,并众包全国食品成分数据
JMIR Mhealth Uhealth
2014
2
3.
e37
10.2196 / mhealth.3230
25147135
v2i3e37
PMC4147708
[
]12
棕色(的)
亚历山大-伍尔兹
埃里森
DB
利用众包评估已发表的科学文献:方法与实例
《公共科学图书馆•综合》
2014
07
9
7
e100647
10.1371 / journal.pone.0100647
24988466
玉米饼- d - 14 - 03892
PMC4079692
[
]13
好
BM
Loguercio
年代
格里菲思
OL
纳尼
米
吴
C
苏
人工智能
治愈:设计和评估一款用于乳腺癌生存预测基因选择的众包游戏
JMIR严肃游戏
2014
07
29
2
2
e7
10.2196 / games.3350
[
]14
DePasse
JW
卡罗尔
R
使役动词
一个
约斯特
一个
Santorino
D
楚
Z
奥尔森
基米-雷克南
更少的噪音,更多的黑客:如何部署麻省理工学院黑客医学的原则来加速医疗保健
国际J技术评估医疗保健
2014
08
6
1
5
10.1017 / S0266462314000324
25096225
S0266462314000324
[
]15
附加评论
拉
马克
RG
石头
DJ
蒙哥马利
类风湿性关节炎
重症监护室的“大数据”。关闭数据循环
J呼吸急救医疗吗
2013
06
1
187
11
1157
60
10.1164 / rccm.201212 - 2311
23725609
PMC3734609
[
]16
巴达维
O
布伦南
T
附加评论
拉
冯
米
Ghassemi
米
使役动词
一个
约翰逊
一个
马克
RG
Mayaud
l
喜怒无常的
G
摩西
C
瑙曼
T
皮门特尔
米
波拉德
TJ
桑托斯
米
石头
DJ
Zimolzak
一个
让大数据对医疗保健有用:首届麻省理工学院关键数据会议摘要
JMIR Med Inform
2014
08
22
2
2
e22
10.2196 / medinform.3447