审查
摘要
背景:药用大麻正越来越多地用于各种身心健康状况。社交媒体和基于网络的健康平台提供了有价值、实时和具有成本效益的监测资源,以收集关于将大麻用于医疗目的的个人的见解。考虑到药用大麻的最佳使用证据仍在出现,这一点尤其重要。尽管医用大麻在网络上向消费者进行营销,但目前还没有健全的监管框架来衡量临床健康益处或不良事件的个人经历。在之前的一项研究中,我们对包含大麻药用主题的研究进行了系统的范围综述,并使用了来自社交媒体和搜索引擎结果的数据。本研究分析了这些研究的方法方法和局限性。
摘要目的:我们旨在研究使用基于网络的用户生成文本来研究大麻作为药物的研究方法和研究方法。
方法:我们搜索了MEDLINE、Scopus、Web of Science和Embase数据库,以获取1974年1月至2022年4月的英语初级研究。如果研究的目的是了解基于网络的用户生成的与大麻作为药物使用的健康状况相关的文本,或者在与大麻相关的一般对话中提到健康的文本,那么研究就包括在内。
结果:我们纳入了42篇文章。在这些文章中,Twitter的使用率是其他计算机生成资源的3倍,包括Reddit、基于网络的论坛、GoFundMe、YouTube和谷歌Trends。分析方法包括情绪评估、主题分析(手动和自动)、社会网络分析和地理分析。
结论:这项研究首次回顾了消费者生成的文本研究中用于理解大麻作为一种药物的技术。越来越明显的是,消费者生成的数据为更好地理解个人行为和人口健康结果提供了机会。然而,使用这些数据的研究存在一些局限性,包括难以建立样本代表性和缺乏方法上的最佳实践。为了解决这些限制,去识别的带注释的数据源应该公开,研究人员应该确定帖子的来源(组织、机器人、高级用户或普通个人),并且应该使用强大的分析技术。
doi: 10.2196/35974
关键字
简介
药用大麻药物警戒
在整个人类历史上,大麻被广泛用于各种目的,包括药用用途。在上个世纪,它的使用在欧洲、北美和大洋洲被禁止。
]。自2016年起,这些司法管辖区已逐步批准在某些情况下使用医用大麻[ ]。鉴于公众对大麻作为药物的巨大兴趣,迫切需要更好地了解其安全性和有效性。然而,除了临床试验之外,关于药用大麻的功效和副作用的数据很少[
- ]。药物上市后安全监测的主要方法之一是使用已建立的药物警戒报告系统,该系统依赖于个人对不良事件的报告[ - ]。大麻使用者往往不知道这些系统或报告的重要性。他们可能觉得资料难以使用,或如有需要,他们可能不愿透露个人资料[ ]。使用者甚至可能不会考虑报告他们的副作用,因为他们认为这是大麻消费的固有体验,特别是如果他们没有使用经过批准的医用大麻产品。鉴于大麻的生长条件和生产规格千变万化,大麻是一种非标准化产品,因此有必要增加对药用大麻的功效和安全性的了解[
]。这包括气候、土壤(或其他生长介质)、水、光和其他影响植物生长的因素的变化。即使一个国家或州的大麻药品必须遵守强制性标准(良好生产规范),一些大麻使用者宁愿自己种植或进口大麻[ ]。这些因素使得对医用大麻的有效性及其副作用进行系统评估变得困难。社交媒体作为药物警戒数据源
为了进一步了解大麻的使用及其影响,研究人员现在转向社交媒体和基于网络的健康论坛。这些平台是患者和普通民众自由表达和交流经验的场所,从而为监测公共卫生提供了宝贵的额外数据源[
]。不同于其他形式的高度策划的数据收集方法,如调查或采访,社交媒体提供了人们日常思想、行为和活动的有机视图。因此,社交媒体有潜力提供超越目标调查界限的见解,包括突发事件、行为现象和亚文化的观察,以及对社会科学的见解[ ]。社交媒体对话中包含的信息是大量的,不仅潜在的内容丰富,而且复杂多样。作为非结构化原始数据源,可信信息可能稀疏且难以识别;数据来源或数据所代表的人群可能存在不确定性[
]。此外,很难解释社交媒体帖子的非正式语言和结构,这些帖子被许多相互竞争的来源混淆,如促销帖子、标签和社交媒体机器人[ , ]。社交媒体机器人会自动创建内容,并与社交媒体平台用户互动。 ]。一项研究发现,9%至15%的推特账户是机器人。 ]。尽管存在这些限制,但如果能够成功地克服这些复杂性,社交媒体有可能成为增加对大麻作为一种药物的理解的巨大资产。我们之前的系统范围回顾[
]使用PRISMA(系统评价和元分析首选报告项目)指南[ ]以了解基于网络的用户生成文本在深入了解大麻作为药物使用方面的效用。本文探讨了这些研究的技术、分析和局限性。本研究的目的是回顾使用用户生成的数据与计算方法相结合的研究,以了解大麻在人群中的药用作用。我们解决了以下研究问题:
- RQ1:用于研究大麻的消费者生成数据源是什么?
- 收集和分析数据的常用技术是什么?
- RQ3:这些研究面临的普遍限制和挑战是什么?
方法
我们搜索了在MEDLINE、Embase、Web of Science和Scopus数据库中检索并在2010年1月至2022年3月期间发表的英语研究。针对这4个数据库开发了文献数据库查询。见中表S1
[ - ],以查阅所使用的查册词的详情及 表S2为入选文献的纳入和排除标准。中显示了PRISMA流程图的摘要 [ ]。结果
概述
提供每篇文章的摘要,其中包括作者姓名、出版年份、数据源、数据收集、分析的持续时间以及分析的项数。
发表论文数量最多的年份是2020年(11/42,26%),其次是2017年和2021年(6/40,14%)。在42项研究中,有6项(12%)是在2015年和2019年进行的。每年出版的数量列于
.关于数据来源,40%(17/42)的综述研究使用Twitter,大约是使用Reddit或基于网络论坛的研究数量的3倍(14%(6/42)。GoFundMe、YouTube和谷歌Trends占总数的7%(3/42)。文本是83%(35/42)研究的重点,而其他研究则分析趋势、视频、搜索日志和图像。
显示每个数据源所选出版物的分布。研究 | 源(持续时间) | 分析 | 分析的项目数量 |
麦格雷戈等[ | ), 2014年基于网络的论坛、Facebook、Twitter和YouTube(不可用) |
|
3785件 |
Cavazos-Rehg等[ | ), 2015年Twitter(2014年2月至3月) |
|
7000条 |
daniel aitte等[ | ), 2015年Twitter(2014年10月至12月) |
|
125,255条推文(27,018条地理定位推文) |
冈萨雷斯-埃斯特拉达等人[ | ), 2015年YouTube(2014年6月4日至8日) |
|
观看次数最多的200个视频 |
克劳斯等人[ | ), 2015年YouTube(2015年1月22日) |
|
116个视频 |
汤普生等[ | ), 2015年Twitter(2012年3月至2013年7月) |
|
36,939条原创推文和10,000条转发 |
Cavazos-Rehg等[ | ), 2016年Twitter(2015年1月) |
|
5000条 |
拉米等[ | ), 2016年Twitter(2015年5月至7月) |
|
3000条 |
米切尔等人[ | ), 2016年网络论坛(2014年10月) |
|
268个线程 |
Andersson等[ | ), 2017年网络论坛(2016年4月18日至19日) |
|
32个话题 |
Dai和Hao [ | ), 2017年Twitter(2015年8月至2016年4月) |
|
66,000条大麻相关推文和31184条地理定位推文 |
格雷纳等[ | ), 2017年网络论坛(2014年11月至2015年3月) |
|
717个帖子 |
特纳和坎达尔季奇[ | ), 2017年Twitter(2015年8月至2016年4月) |
|
40509条定位推文 |
韦斯特马斯等人[ | ), 2017年网络论坛(2000年1月至2013年12月) |
|
468000个帖子 |
Yom Tov和Lev Ran [ | ), 2017年必应日志(2016年11月至2017年4月) |
|
不可用 |
Cavazos-Rehg等[ | ), 2018年YouTube(2015年6月10-11日) |
|
83个视频 |
格洛瓦基等人[ | ), 2018年Twitter(2016年8月至10月) |
|
73235条 |
米查姆等[ | ), 2018年Reddit(2010年1月至2016年12月) |
|
400000个帖子 |
利亚斯等[ | ), 2019年谷歌趋势(2004年1月- 2019年4月) |
|
不可用 |
米查姆等[ | ), 2019年Reddit(2017年1月至2019年12月) |
|
193个问题 |
纳斯拉等[ | ), 2019年推特(2015年1月至2019年2月) |
|
20609条 |
Pérez-Pérez等[ | ), 2019年推特(2018年2月至8月) |
|
24634条 |
史等[ | ), 2019年谷歌趋势和Buzzsumo(2011年1月至2018年7月) |
|
不可用 |
阿勒姆等[ | ), 2020年推特(2018年5月至12月) |
|
60861条非机器人推文和8874条机器人推文 |
Janmohamed等[ | ), 2020年博客、新闻、论坛和<1%其他(2019年8月至2021年4月) |
|
4,027,172份文件或博客 |
贾等[ | ), 2020年谷歌、Facebook和YouTube(2019年9月) |
|
51个谷歌网站,126个Facebook帖子,37个YouTube视频 |
利亚斯等[ | ), 2020年Reddit(2014年1月至2019年8月) |
|
104917个帖子 |
默顿等[ | ), 2020年Pinterest(2018年7月31日、8月18日和9月1日) |
|
1280针 |
马林斯等[ | ), 2020年Twitter(2017年6月至7月) |
|
941条 |
萨波斯尼克和胡贝尔[ | ), 2020年谷歌趋势(2004年1月- 2019年12月) |
|
不可用 |
宋等[ | ), 2020年GoFundMe(2012年1月至2019年12月) |
|
1474年活动 |
Tran和Kavuluru [ | ), 2020年Reddit和或FDA评论(2019年1月至4月) |
|
64099条Reddit和3832条FDA评论 |
van Draanen等[ | ), 2020年推特(2017年1月至2019年6月) |
|
1200127条 |
Zenone等人[ | ), 2020年GoFundMe(2017年1月至2019年3月) |
|
155年活动 |
庞等[ | ), 2021年推特(2019年12月至2020年12月) |
|
17238条 |
赖德努等[ | ), 2021年Reddit(2008年1月至2018年12月) |
|
974个帖子 |
斯莫列夫等人[ | ), 2021年Facebook(2018年11月至2019年11月) |
|
7694个帖子 |
苏利曼普尔等[ | ), 2021年推特(2019年7月) |
|
2200000条 |
Zenone等人[ | ), 2021年GoFundMe(2017年6月至2019年5月) |
|
164年活动 |
特纳等人[ | ] 2021推特(2019年10月至2020年1月) |
|
167,755条个人推文143,322条商业推文 |
阿勒姆等[ | ), 2022年推特(2020年1月至9月) |
|
353353条 |
米查姆等[ | ] 2022Reddit(2015年12月至2019年8月) |
|
阿片类药物恢复版块有908个帖子,阿片类药物使用版块有4224个帖子 |
一个注意力缺陷多动障碍。
bPTSD:创伤后应激障碍。
cCBD:大麻二酚。
d食品和药物管理局。
一年 | 计数,n (%) |
2014 | 1 (2) |
2015 | 5 (12) |
2016 | 3 (7) |
2017 | 6 (14) |
2018 | 3 (7) |
2019 | 5 (12) |
2020 | 11 (26) |
2021 | 6 (14) |
2022 | 2 (5) |
源 | 计数,n (%) |
推特 | 17 (41) |
6 (14) | |
网络论坛 | 6 (14) |
GoFundMe | 3 (7) |
YouTube | 3 (7) |
谷歌趋势 | 3 (7) |
谷歌,Facebook和YouTube | 1 (2) |
必应搜索引擎 | 1 (2) |
脸谱网 | 1 (2) |
1 (2) |
社交媒体数据收集策略
一些研究从reddit的一个特定子版块获得了所有相关数据。
, , ]或网上论坛[ ],然后对数据进行采样。在42项研究中,1项(2%)Twitter研究使用地理位置边界框收集推文,然后过滤与大麻相关的关键词[ ]。许多研究都使用了基于关键字的过滤。用于过滤的术语要么是词典(如《城市词典》)中大麻的常用表达,要么是基于该领域的类似研究。在42项研究中,1项(2%)研究[
他利用城市词典和网络论坛创建了一个包含123个与大麻消费相关术语的综合列表。另一项研究[ ]首先在Thesaurus.com网站上搜索到所有与大麻有关的术语,然后使用词汇嵌入相似性阅读软件[ 来生成同义词。在一项与大麻无关的研究中,从Twitter和Reddit数据集创建的词嵌入发现了用其他方法无法识别的同义词和俚语。该研究建议在任何基于关键字过滤的数据收集中预先使用这种同义词发现方法[
]。在42项研究中,3项(7%)以用户为中心,数据来自特定的极具影响力的用户[
]、阿片类药物依赖者[ ],或美国退伍军人专区reddit [ ]。研究人员手动标注的最大数据集是使用大麻相关关键词收集的,包括36,939条原始推文和10,000条转发[
]。除了这项研究,注释数据集的平均大小约为1450条记录。在42项研究中,2项(5%)研究[ , ]使用众包服务来注释推文,而其他人则在内部进行注释。数据收集时间从1个月到6年不等。在42项研究中,有2项(5%)研究将其注释数据提供给其他研究人员[ , ]。分析类型
概述
本文的研究采用了多种分析方法,包括定性分析、定量内容分析、机器学习、基于规则的分析和统计分析。分析类型包括情绪评估、主题分析、内容分析、命名实体识别、社会网络和地理分析。表S3
总结分析。发现主题
62%(26/42)的研究确定了主题。69%(18/26)的研究对主题进行了手工编码,或使用已有的类别,或通过观察数据样本并生成代码本[
, , , , , , , , , - , , - , ]。在26项研究中,2项(7%)研究使用了社交媒体数据分析公司的服务[ , ]。在26项研究中,4项(15%)研究使用主题建模来推断主题或主题[
, , , ]。这项任务的算法选择是潜在狄利克雷分配[ ]。主题数量的选择基于内在评价指标(如一致性和困惑度)和基于主题模型先前经验的迭代定性分析。在26项研究中,1项(4%)研究使用了时间主题建模技术来研究主题随时间的变化,目的是分析基于网络的电子烟叙事在COVID-19大流行期间的变化[ ]。在26项研究中,1项(4%)研究使用基于规则的方法确定主题。生成最常见的字母和字母的频率计数,并形成主题的基础[
]。另一项研究使用了SAS文本挖掘软件(一种文本主题节点算法)来发现主题[ ]。人口统计分析
26%(11/42)的研究对研究人群进行了社会经济和人口统计学分析。在这11项研究中,有2项(27%)研究使用了用户资料中提供的性别、年龄和其他用户特征,或从用户的帖子中推断出[
, ]。在这11项研究中,2项(27%)基于视频的研究在观看视频后使用了受试者的感知年龄和性别[ , ]。在11项研究中,2项(18%)使用社交媒体分析提供商的研究通过使用提供的分析获得年龄和性别数据[
, ]。在这11项研究中,2项(18%)基于twitter的研究使用了一种名为DemographicsPro的商业工具,该工具使用专有算法来推断用户的人口统计特征[ , ]。其他研究使用了现有的人口普查数据[ ]、从调查资料获得的人口资料[ ],以及一种基于性别名称词典和面部识别算法的两步方法,应用于用户的个人资料信息,以识别用户的性别[ ]。地理分析
40%(17/42)的研究进行了地理位置数据分析。52%(9/17)的研究使用了用户档案或信息元数据[
, , , , , , , , ]。在这17项研究中,有2项(12%)使用了社交媒体分析公司提供的信息[ , ]。5%(1/17)的研究使用了DemographicsPro工具[ ]。在这17项研究中,3项(17%)研究使用了谷歌Trends提供的位置信息[ , , ]。另一项(1/ 17,5%)研究从调查数据中收集地理信息[ ]。在17项研究中,1项(5%)基于视频的研究使用了视频频道的地理位置[ ]。情绪评估
一个人对一个话题的看法可以分为积极的、消极的或中性的情绪。对这些情绪的分析通常使用自动化语言工具进行,并被命名为“情绪分析”[
]。在进行情绪分析的12项研究中,5项(42%)使用了自动化方法。在这12项研究中,1项(8%)研究在1000个“大麻”相关推文样本上训练了一个二元朴素贝叶斯分类器,将帖子分为2种观点极性,积极和消极或中性[
]。另一项研究使用了一家社交媒体分析公司提供的情绪分析。 ]。在这12项研究中,3项(25%)研究使用了价感词典和情感推理器[ ],一个基于词汇和规则的情感分析工具[ , , ]。将VADER的性能与经过3000条人工编码的大麻相关推文训练的内部机器学习分类器进行了比较,结果显示VADER的性能提高了30%。尽管VADER被广泛用于一般的推文情绪分析,但在与物质使用相关的领域,它的性能受到了影响,在这些领域,负面词汇经常被用来表达积极的情绪。例如,“我服用了CBD油,那东西不好”[ 在这个句子中,“bad”实际上是好的意思。用户分析
为了进行用户分析,57%(24/42)的研究检查了帖子的主题,如来自个人或他人(即来自自我、零售、媒体或专业人士),或帖子是关于谁的(自我、他人或一般)[
, , - , , , - , , - , , , , , - ]。当进行手动数据标记时,确定海报和帖子的主题都是标记过程的一部分。自我报告和自我使用很容易通过观察视频来确定,大多数基于语言结构的文本也是如此。例如,一项研究[
首先确定推文的主题是关于自我、他人还是一般,然后确定这些推文是否与实际使用大麻有关。这项研究包括了语气、相关行为、感知影响和社会背景的进一步类别。自动标记方法寻找那些表明自我报告的短语。例如,一项关于阿片类药物成瘾的研究[ )在提及阿片类药物的语境中寻找“我上瘾了”和“我已经上瘾了”等短语。在另一项研究中使用了分类器[ ]将营销推文与非营销推文分开;然而,他们的重点是营销推文。没有一项研究使用先进的自然语言处理技术来确定主题和个人提及。社交媒体机器人是指在社交媒体平台上产生人工活动的自动账户。
]。机器人检测仅在4%(1/24)的研究中使用,这些研究使用Twitter作为数据源[ ]。其他分析
在42项研究中,有2项(5%)研究考察了对话参与者的社交网络。这允许识别目标社区和用户交互[
, ]。在42项研究中,有3项(7%)研究调查了政府大麻合法化政策对人们情绪和意见或社交媒体帖子数量的影响[ , , ]。12%(5/42)的研究进行了单词和短语的词频和计数分析[ , , , , ]。道德的考虑
机构审查委员会(或其同等机构)确保使用人类参与者的研究以合乎道德的方式进行[
]。机构审查委员会对研究的批准和监督确保研究人员采用道德上适当的研究方案,尊重社交媒体用户的权利和利益;62%(26/42)的研究提到了正在寻求伦理批准审查或研究免于伦理要求。38%(16/42)的研究没有提到伦理认可。外部效度
使用标准的报告系统,如美国食品和药物管理局的报告,有助于评估社交媒体研究结果是否可以推广到现实世界的数据。当没有合适的真实数据集时,在>1社交媒体平台上验证结果可以提高结果的泛化性和有效性。只有少数研究使用社交媒体数据源或通过其他数据源验证他们的发现。在42项研究中,2项(5%)研究使用食品和药物管理局的数据作为外部真实数据源来验证其结果[
, ]。在42项研究中,1项(2%)研究分析了几个基于网络的论坛[ ],另有2项(5%)研究使用多个社交媒体平台作为数据来源[ , ]。讨论
在这项研究中,我们回顾了同行评审的已发表作品的技术方面,这些作品使用社交媒体和其他形式的用户生成数据来了解大麻的药用作用。所有研究都得出结论,这些消费者生成的数据源是有用的,为研究大麻和使用大麻的医疗条件提供了补充资源。
主要研究结果
本研究的结果是通过回答rq来呈现的。
RQ1:哪些消费者生成的数据源用于研究大麻?
这些被回顾的研究使用的大麻研究消费者生成数据的来源包括社交媒体平台,如Twitter、Reddit和YouTube;搜索查询,包括谷歌趋势和必应查询日志;还有网络论坛、众筹平台、博客和网站。大多数研究都使用了Twitter。其中一项研究得出结论,与未经审核的平台相比,审核过的网站更注重基于证据的信息和受控制的误导性内容[
]。RQ2:收集和分析数据的常用技术是什么?
一些研究使用社交媒体分析公司进行部分或全部数据收集和处理任务。其他研究使用应用程序接口与Twitter和Reddit进行交互。尽管Facebook允许研究人员通过专用平台从公共页面访问公开帖子[
],占研究的2% (1/42)[ ]分析了Facebook的私人帖子——用于获取数据的方法没有被报道。大约一半的研究使用了<8000条记录的数据集,其中许多研究使用了1000条记录。这些研究要么集中于了解用户的特征和需求,要么集中于了解网络上信息的质量,要么是由RQ指导的,比如“个人是否在有循证治疗的可诊断疾病中使用CBD ?”这些分析在理解领域中起着关键作用,但很难复制和推广。
最近基于神经网络的自然语言处理技术还没有在本综述的研究中使用。这些现代机器学习方法的优点是,它们需要最少的数据准备,并具有学习语言细微差别的能力。然而,为了有效地运行,它们通常需要高质量的带注释的数据——这是一种稀缺而昂贵的资源。文本社交媒体数据非常适合这些技术。应鼓励在适当的道德、监管和法律框架内为此目的创建和共享未识别的带注释的数据集[
]。RQ3:研究面临的普遍限制和挑战是什么?
这些限制是按照频率的顺序被提到的。
样本的代表性
大多数关于社交媒体的研究使用可用数据的样本。然而,数据样本在多大程度上代表了一般人群往往是不清楚的。这些研究中提到的限制因素包括由于关键词选择、数据收集持续时间和总体偏差而引入的抽样偏差。
人口偏见通常是指使用社交媒体平台的人群的人口构成不同于一般人群,以及确定用户的人口特征的困难。在之前的研究中也提到了获取准确的地理位置。获取这些数据是有限的,因为即使用户明确地在他们的帖子或个人资料中包含人口统计信息(例如Facebook)或地理信息,这些信息也可能是捏造的。
平台的选择本身也有局限性。例如,特定于平台方的特性(如抽样策略)限制了可以收集的数据量以及用户的行为和对话,这取决于平台或上下文。在42项研究中,1项(2%)研究提到,他们调查的论坛可能非常大麻,可能居住着更有经验的大麻使用者[
]。另一项研究表明,在YouTube上发布大麻信息的人可能会寻求社交网络机会[ ]。此外,特定于平台的算法还会发现并进一步促进流行主题和用户故意管理行为,并吸引更多平台用户参与。这需要通过检测和计算算法以及从>1平台进行采样来改善。
方法的约束
一些研究使用的小数据集影响了结果的概括性,一些研究人员承认这一点,并表示计划使用更多数据和自动化方法来重复他们的研究。因此,我们观察到,尽管这类研究可能对社交媒体数据进行采样以生成假设,但它们没有利用社交媒体数据最重要的特征之一,即观察大数据的持续生成以创建长期以数据为中心的见解的能力[
]。研究中还提到了可能由主题选择引起的偏见。大多数研究人员试图通过创建注释指南、拥有1人标签数据和解决分歧来缓解这一问题。
实际使用检测
几项研究提到的一个局限性是,基于网络的搜索活动和含有大麻相关关键词的社交媒体帖子并不一定代表发布者实际使用了大麻。根据研究的背景和目标(例如,如果研究旨在研究吸食大麻的人群),需要先进的文本处理技术来确定何时可以推断出个人吸食大麻。对于这类研究,确定其用途应该是关键的第一步。然而,检测个人使用是具有挑战性的,特别是在小众社区使用的非正式的、多样化的和专门的语言中。
源识别
识别帖子的来源(即,它们是由个人用户或组织或机器人有机生成的)是一个经常被提及的限制。据了解,由卫生和商业组织、高级用户和非个人账户生成的内容构成了网络上相当数量的社交媒体帖子。
限制
本综述在检索过程中使用了4个文献数据库,以最大限度地覆盖现有出版物。但是,我们不能肯定我们已经涵盖了所有相关出版物。文献搜索关键词的选择也可能影响捕获该领域的所有相关研究,例如,infodemiology而且infoveillance都不在关键字里。本研究中纳入的文章采用系统方法选择,并进行了质量偏倚评估;然而,不可能完全避免偏见。这项研究也仅限于英语文章。
结论
在过去几年中,这一领域的研究数量稳步增加。社交媒体上的对话范围广泛,提供了通过正式信息收集无法获得的见解的机会。研究人员已经意识到社交媒体对话的价值,它是用户自由表达经验和担忧的地方,而不用冒着被评判或惩罚的风险,社交媒体是许多大麻药物用户分享他们对他们所经历和感知的益处和问题的见解的天然论坛。
人工定性分析、统计分析、有监督和无监督机器学习以及基于规则的方法都是这些研究中使用的方法。社交媒体数据的分析仅限于小数据样本,虽然提供了一种有效的假设生成手段,但很难可靠地重现和推广。在可能的情况下,应鼓励分享高质量的无标识注释数据,以便使用可推广的分析技术,以推动这一领域的发展。
为了提高研究的有效性和可泛化性,研究可以添加额外的社交媒体数据源,并根据现有的报告系统检查结果。研究可以利用利用大数据的新兴数据分析策略,如深度学习和基于迁移学习的方法。
致谢
本综述由澳大利亚大麻素临床和研究卓越中心支持,由国家卫生和医学研究委员会通过卓越研究中心计划资助(NHMRC CRE APP1135054)。
利益冲突
没有宣布。
辅助信息(综述关键词,纳入和排除标准,论文摘要)。
OCX文件,45kb参考文献
- 李霍奇金淋巴瘤。大麻在中国的考古和历史记载。经济学报1973年10月;28(4):437-448 [免费全文] [CrossRef]
- Hallinan CM, Gunn JM, Bonomo YA。澳大利亚医用大麻的实施:创新还是动荡?以医生为主要信息来源,进行定性分析。英国医学杂志公开赛2021年10月22日;11(10):e054044 [免费全文] [CrossRef] [Medline]
- 医用大麻治疗慢性疼痛:临床疗效和指南综述。加拿大渥太华:加拿大卫生药物和技术署;2019.
- 克里曼-福斯图伯LT,丹尼斯DA,詹宁斯JM。骨科手术中的药用大麻。美国骨科杂志2020年5月1日;28(7):268-277。[CrossRef] [Medline]
- 波留克C,周B,拉塞克SR,麦凯勒T,西登HH。儿科药用大麻使用的有效性和安全性:范围综述。儿科儿童健康2021年7月;26(4):228-233 [免费全文] [CrossRef] [Medline]
- Pratt M, Stevens A, Thuku M, Butler C, Skidmore B, Wieland LS,等。医用大麻的好处和危害:系统评价的范围审查。系统版本2019 12月10日;8(1):320 [免费全文] [CrossRef] [Medline]
- Martin JH, Lucas C.向治疗用品管理局报告药物不良事件。德国大屠杀2021年3月;44(1):2-3 [免费全文] [CrossRef] [Medline]
- EudraVigilance。欧洲MedicinesAgency。URL:https://www.ema.europa.eu/en/human-regulatory/research-development/pharmacovigilance/eudravigilance[2022-05-24]访问
- FDA不良事件报告系统(FAERS)公共仪表盘。美国食品和药物管理局,2021年。URL:https://tinyurl.com/yh22mc2c[2022-05-24]访问
- Al Dweik R, Stacey D, Kohen D, Yaya S.影响患者药物不良反应报告的因素:一项系统综述。中国临床药物学杂志,2017,04 (4):875-883 [免费全文] [CrossRef] [Medline]
- Chandra S, Lata H, ElSohly MA, Walker LA, Potter D.大麻种植:获得医用级产品的方法问题。Epilepsy Behav 2017 May;70(Pt B):302-312。[CrossRef] [Medline]
- Hakkarainen P, Frank VA, Barratt MJ, Dahl HV, Decorte T, Karjalainen K,等。种植药物:在6个不同国家用于医疗目的的小规模大麻种植。国际毒品政策杂志2015年3月26日(3):250-256。[CrossRef] [Medline]
- Paul MJ, Dredze M.公共卫生的社会监测。入:Marchionini G,编辑。信息概念、检索和服务综合讲座。圣拉斐尔,加州,美国:摩根和克莱普出版社;2017年8月31日:1-183。
- 张志刚,张志刚,张志刚,等。利用社交媒体进行定量社会科学研究的研究设计。PsyArXiv 2020:1-27。[CrossRef]
- 张志刚,张志刚,张志刚,等。使用社交媒体数据进行定量社会科学研究的数据采集、采样和数据准备考虑因素。PsyArXiv 2021 Mar 15:1-45。[CrossRef]
- 康威,胡敏,查普曼WW。利用自然语言处理,利用社交媒体和消费者生成的数据来解决公共卫生研究问题的最新进展。2019年8月;28(1):208-217 [免费全文] [CrossRef] [Medline]
- 阿利姆JP,费拉拉e,社交机器人会对公众健康构成威胁吗?美国公共卫生杂志2018年8月;108(8):1005-1006。[CrossRef] [Medline]
- Ferrara E, Varol O, Davis C, Menczer F, Flammini A.社交机器人的崛起。通讯ACM 2016 6月24日;59(7):96-104。[CrossRef]
- Varol O, Ferrara E, Davis CA, Menczer F, Flammini A.在线人机交互:检测,估计和描述。arXiv 2017。
- Khademi Habibabadi S, Bonomo YA, Conway M, Hallinan CM。关于大麻作为一种药物的社交媒体话语和互联网搜索查询:系统的范围审查。medRxiv 2022。[CrossRef]
- 李利提,陈志强,陈志强,陈志强,等。用于报告评估医疗保健干预研究的系统评价和元分析的PRISMA声明:解释和阐述。英国医学杂志2009 7月21日;339:b2700 [免费全文] [CrossRef] [Medline]
- McGregor F, Somner JE, Bourne RR, Munn-Giddings C, Shah P, Cross V.青光眼患者使用社交媒体:我们能学到什么?眼科物理Opt 2014 Jan;34(1):46-52。[CrossRef] [Medline]
- Cavazos-Rehg PA, Krauss M, Fisher SL, Salyer P, Grucza RA, Bierut LJ。推特上关于大麻的讨论。青少年健康杂志2015年3月;56(2):139-145 [免费全文] [CrossRef] [Medline]
- daniel aitte R, Nahhas RW, Wijeratne S, Carlson RG, Lamy FR, Martins SS,等。2015年10月1日,155:307-311[毒品酒精依赖]免费全文] [CrossRef] [Medline]
- 张志强,张志强,张志强,等。在YouTube上流行:关于哮喘信息教育质量的批判性评估。过敏哮喘杂志2015;36(6):e121-e126。[CrossRef] [Medline]
- Krauss MJ, Sowles SJ, Mylvaganam S, Zewdie K, Bierut LJ, Cavazos-Rehg PA。在YouTube上涂抹大麻提取物的视频。药物酒精依赖2015年10月1日;155:45-51 [免费全文] [CrossRef] [Medline]
- 汤普森L,里瓦拉FP,怀特希尔JM。2012-2013年Twitter上大麻相关流量的流行率:内容分析。网络心理健康网络2015 july;18(6):311-319 [免费全文] [CrossRef] [Medline]
- Cavazos-Rehg PA, Sowles SJ, Krauss MJ, Agbonavbare V, Grucza R, Bierut L.关于高效大麻的推文内容分析。药物酒精依赖2016年10月1日;166:100-108 [免费全文] [CrossRef] [Medline]
- Lamy FR, Daniulaityte R, Sheth A, Nahhas RW, Martins SS, Boyer EW,等。“那些可食用食品受到严重打击”:美国大麻可食用食品推特数据探索毒品酒精依赖2016年7月01日;164:64-70 [免费全文] [CrossRef] [Medline]
- Mitchell JT, Sweitzer MM, Tunno AM, collins SH, McClernon FJ。“我用大麻治疗多动症”:对大麻使用和多动症在线论坛讨论的定性分析。PLoS One 2016年5月26日;11(5):e0156614 [免费全文] [CrossRef] [Medline]
- Andersson M, Persson M, Kjellgren a .精神活性物质作为最后的手段——偏头痛和丛集性头痛自我治疗的定性研究。危害减少J 2017 Sep 05;14(1):60 [免费全文] [CrossRef] [Medline]
- 利用大麻治疗创伤后应激障碍的社交媒体数据。计算人类行为2017年5月;70(C):282-290。[CrossRef]
- 格雷纳C,查顿A,哈扎尔Y.在线自助论坛大麻:内容评估。患者教育计数2017年10月;100(10):1943-1950。[CrossRef] [Medline]
- 特纳J, Kantardzic M.基于大麻相关推文时空动态的地理社会分析。2017年信息系统与数据挖掘国际会议论文集,ICISDM '17;2017年4月1日至3日;查尔斯顿,南卡罗来纳州,美国,第28-38页。[CrossRef]
- Westmaas JL, McDonald BR, Portier KM。美国癌症协会癌症幸存者网络(CSN)吸烟和戒烟相关帖子的主题建模:对吸烟的癌症幸存者戒烟治疗的影响。尼古丁Tob Res 2017 Aug 01;19(8):952-959。[CrossRef] [Medline]
- Yom-Tov E, Lev-Ran S.与大麻消费相关的不良反应,从搜索引擎查询中明显可见。JMIR公共卫生监测2017年10月26日;3(4):e77 [免费全文] [CrossRef] [Medline]
- Cavazos-Rehg PA, Krauss MJ, solles SJ, Murphy GM, Bierut LJ。大麻产品评论的曝光率和内容。科学通报2018 Feb;19(2):127-137 [免费全文] [CrossRef] [Medline]
- Glowacki EM, Glowacki JB, Wilcox GB。对公众对阿片类药物危机反应的文本挖掘分析。导刊2018;39(2):129-133。[CrossRef] [Medline]
- Meacham MC, Paul MJ, Ramo DE:通过在线大麻社区了解大麻使用的新兴形式:相对发帖量和主观高度评级的分析。毒品酒精依赖2018年7月01日;188:364-369 [免费全文] [CrossRef] [Medline]
- Leas EC, noble AL, Caputi TL, Dredze M, Smith DM, Ayers JW。美国大麻二酚(CBD)网络搜索趋势2019年美国医学会网络公开赛10月02日;2(10):e1913853 [免费全文] [CrossRef] [Medline]
- Meacham MC, Roh S, Chang JS, Ramo DE.在在线大麻社区讨论论坛中关于涂抹浓缩物的常见问题。国际毒品政策2019年12月;74:11-17 [免费全文] [CrossRef] [Medline]
- Nasralah T, El-gayar O, Wang Y.社交媒体可以告诉我们关于阿片类药物成瘾者的信息:Twitter数据案例分析。见:第25届美洲信息系统会议论文集,2019年发表于:AMCIS '19;2019年8月15日至17日;Cancún,墨西哥第15页。
- Pérez-Pérez M, Pérez-Rodríguez G, Fdez-Riverola F, Lourenço A.使用Twitter了解人类肠道疾病社区:关键主题的探索性分析。J Med Internet Res 2019 Aug 15;21(8):e12610 [免费全文] [CrossRef] [Medline]
- Shi S, Brant A, Sabolch A, Pollom E.大麻治疗癌症的假消息。Cureus 2019 1月19日;11(1):e3918 [免费全文] [CrossRef] [Medline]
- Allem JP, Escobedo P, Dharmapuri L.用Twitter数据监测大麻:新兴话题和社交机器人。美国公共卫生杂志2020年3月;110(3):357-362。[CrossRef] [Medline]
- 张文杰,张文杰,张文杰,等。网络电子烟叙事与COVID-19的交叉:主题建模研究。J Med Internet Res 2020年10月30日;22(10):e21743 [免费全文] [CrossRef] [Medline]
- 贾JS, Mehran N, Purgert R, Zhang QE, Lee D, Myers JS,等。大麻和青光眼:社交媒体内容分析。眼科青光眼2021;4(4):400-404。[CrossRef] [Medline]
- Leas EC, Hendrickson EM, Nobles AL, Todd R, Smith DM, Dredze M,等。自我报告大麻二酚(CBD)的使用情况。2020年10月01日;3(10):e2020977 [免费全文] [CrossRef] [Medline]
- Merten JW, Gordon BT, King JL, Pappas C.大麻二酚(CBD):来自pinterest的观点。Subst Use误用2020;55(13):2213-2220。[CrossRef] [Medline]
- Mullins CF, french-O'Carroll R, Lane J, O'Connor T.分享痛苦:Twitter和爱尔兰痛苦的观察分析。注册麻醉疼痛医学2020年8月;45(8):597-602。[CrossRef] [Medline]
- 萨普斯尼克,胡贝尔,JF。在过去15年里,关于自闭症病因和治疗的网络搜索趋势:探索性信息流行病学研究。JMIR儿科家长2020年12月07日;3(2):e20913 [免费全文] [CrossRef] [Medline]
- 宋s, Cohen AJ, Lui H, Mmonu NA, Brody H, Patino G,等。使用GoFundMe®众筹癌症补充和替代医学治疗。中华肿瘤学杂志2020年7月号;46(7):1857-1865。[CrossRef] [Medline]
- Tran T, Kavuluru R.大麻二酚(CBD)产品感知治疗效果的社交媒体监测。国际毒品政策2020年3月;77:102688 [免费全文] [CrossRef] [Medline]
- 范德拉宁J,陶华,古普塔S,刘山。推特上大麻对话的地理差异:信息流行病学研究。JMIR公共卫生监测2020年10月05日;6(4):e18540 [免费全文] [CrossRef] [Medline]
- Zenone M, Snyder J, Caulfield T.众筹大麻二酚(CBD)治疗癌症:GoFundMe上的炒作和错误信息。Am J Public Health 2020 10月;110(S3):S294-S299。[CrossRef] [Medline]
- 庞rd, Dormanesh A,黄勇,朱明,Allem JP。关于怀孕和产后使用大麻的推特帖子:内容分析。2017; 26(7):1074-1077。[CrossRef] [Medline]
- Rhidenour KB, Blackburn K, Barrett AK, Taylor S.调解医用大麻:探索退伍军人如何在Reddit上讨论他们被污名化的物质使用。卫生公共2022年9月;37(10):1305-1315。[CrossRef] [Medline]
- 朱娥,刘志强,刘志强,等。“药丸推销者和CBD油”——对创伤性臂丛神经损伤后疼痛的社交媒体互动的主题分析。J Hand Surg Glob Online 2021 Jan;3(1):36-40 [免费全文] [CrossRef] [Medline]
- Soleymanpour M, Saderholm S, Kavuluru R.推特上大麻二酚(CBD)营销信息中的治疗声明。生物信息学学报(英文版)2021年12月;2021:3083-3088 [免费全文] [CrossRef] [Medline]
- Zenone MA, Snyder J, Crooks VA.影响人们出于医疗目的使用大麻二酚的信息途径是什么?J大麻决议2021年5月06日;3(1):13 [免费全文] [CrossRef] [Medline]
- Allem JP, Majmundar A, Dormanesh A, Donaldson SI。通过使用医学词典识别Twitter上关于大麻使用的健康相关讨论:推文内容分析JMIR Form Res 2022年3月25日;6(2):e35027 [免费全文] [CrossRef] [Medline]
- Turner J, Kantardzic M, Vickers-Smith R.关于大麻二酚的个人和商业推文的信息流行病学检查:术语和情感分析。J Med Internet Res 2021 12月20日;23(12):e27307 [免费全文] [CrossRef] [Medline]
- Meacham MC, Nobles AL, Tompkins DA, Thrul J。“我有一堆大麻来帮助我戒毒”:在线阿片类药物和阿片类药物康复社区论坛报告的自然主义大麻使用。PLoS One 2022 Feb 8;17(2):e0263583 [免费全文] [CrossRef] [Medline]
- 博伊德RL。WELP:词嵌入相似性细读(v1.03)。瑞安·博伊德,2018年。URL:https://github.com/ryanboyd/WELP[2022-10-30]访问
- Adams N, Artigiani EE, Wish ED。为社交媒体药物研究选择您的平台,并改进您的关键字过滤列表。J药物问题2019年3月13日;49(3):477-492。[CrossRef]
- 布利DM,吴艾,Jordan MI。潜狄利克雷分配。J Mach Learn Res 2003;3:993-1022 [免费全文] [CrossRef]
- 刘波,张磊。意见挖掘与情感分析综述。在:阿加瓦尔CC,翟C,编辑。挖掘文本数据。美国纽约州纽约:施普林格;2012:415 - 463。
- Hutto CJ, Gilbert E. VADER:一个简约的基于规则的社交媒体文本情感分析模型。见:第八届国际AAAI博客和社交媒体会议论文集。2014年发表于:AAAI '14;2014年6月1日至4日;安娜堡,密歇根州,美国。
- 刘志刚,陈丽丽,陈志刚,陈志刚,陈志刚,陈志刚。“什么时候‘坏’就是‘好’”:识别与毒品相关的推文中的个人交流和情绪。JMIR公共卫生监测2016年10月24日;2(2):e162 [免费全文] [CrossRef] [Medline]
- 机构审查委员会:目的和挑战。胸部2015年12月;148(5):1148-1155 [免费全文] [CrossRef] [Medline]
- CrowdTangle |使内容发现和社交监控变得容易。URL:https://www.crowdtangle.com/[2022-05-30]访问
- Gonzalez-Hernandez G, Sarker A, O'Connor K, Savova G.捕捉患者的视角:健康相关文本的自然语言处理进展综述。Yearb Med Inform 2017 Aug;26(1):214-227 [免费全文] [CrossRef] [Medline]
- Sarker A, DeRoos A, Perrone J.为处方药滥用监测挖掘社交媒体:一个以数据为中心的框架的审查和建议。美国医学通报协会2020年2月01日;27(2):315-329 [免费全文] [CrossRef] [Medline]
缩写
棱镜:系统评价和元分析的首选报告项目 |
中移动:研究问题 |
维德:价感字典和情感推理器 |
G·艾森巴赫(G Eysenbach)编辑;提交24.12.21;同行评议作者:A Dormanesh, K O'Connor, J Thrul;对作者26.03.22的评论;修订版本收到16.06.22;接受27.07.22;发表16.11.22
版权©Sedigheh Khademi Habibabadi, Christine Hallinan, Yvonne Bonomo, Mike Conway。最初发表在医疗互联网研究杂志(//www.mybigtv.com), 16.11.2022。
这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。