发表在第17卷第11期(2015):11月

利用Twitter数据洞察电子烟营销和使用地点:一项信息监视研究

利用Twitter数据洞察电子烟营销和使用地点:一项信息监视研究

利用Twitter数据洞察电子烟营销和使用地点:一项信息监视研究

原始论文

1RTI国际,研究三角园,北卡罗来纳州,美国

2蒸馏网络(研究期间在RTI国际公司),美国北卡罗来纳州罗利

3.美国圣迭戈大学雷迪管理学院

4佛罗里达州无烟草局,佛罗里达州卫生部,美国佛罗里达州塔拉哈西

通讯作者:

杰米·吉洛里博士

RTI国际

康沃利斯路东3040号

研究三角园,NC 27709

美国

电话:1 91931 63725

传真:1 91954 16683

电子邮件:jguillory@rti.org


背景:电子烟和其他电子尼古丁输送装置的营销和使用近年来呈指数级增长,部分原因是通过社交媒体平台(如Twitter)进行的营销和口头传播。

摘要目的:本研究调查了2008年至2013年之间关于电子烟的推特帖子,以深入了解(1)销售和推广电子烟的营销趋势和(2)人们使用电子烟的地点。

方法:我们使用关键词收集了2008年7月1日至2013年2月28日之间关于电子烟的推文。将随机选择的推文子集手工编码为广告(如市场营销、广告、销售、促销)或非广告(如个人用户、消费者),并训练分类算法将剩余数据编码为这两类。采用人工编码和自然语言处理相结合的方法来指出人们使用电子烟的地点。另外的元数据被用来分析那些最频繁发关于电子烟的推文的用户。

结果:在2008年至2013年期间,我们发现了大约170万条关于电子烟的推文,其中大多数是广告(93.43%,1,559,508/1,669,123)。2009年至2010年间,关于电子烟的推文增加了十倍以上,这表明电子烟的受欢迎程度和营销努力正在迅速增长。关于电子烟最频繁的推文是电子烟品牌、联盟营销人员和电子烟产品经销商的组合。在提及特定地点的471条电子烟推文中,提到电子烟使用最多的是课堂(39.1%,184/471),其次是家庭/房间/床(12.5%,59/471)、学校(12.1%,57/471)、公共场所(8.7%,41/471)、浴室(5.7%,27/471)和工作场所(4.5%,21/471)。

结论:Twitter正被不同类型的实体用来推广电子烟,而且在线市场比线下产品供应和广告策略更加多样化。电子烟也被用于公共场所,如学校,这凸显了教育和执行禁止在公共场所使用电子烟政策的必要性。Twitter数据可以为电子烟提供新的见解,帮助为未来的研究、监管、监控和执法工作提供信息。

中国医学网络杂志2015;17(11):e251

doi: 10.2196 / jmir.4466

关键字



自2006年进入市场以来,电子烟越来越受欢迎。美国及海外成年人对电子烟的认识很高(73%)[1-3.].曾使用电子烟的美国成年人比例从2010年的1.8%迅速上升至2013年的10.0%,其中年轻成年人和当前吸烟者的使用率最高[4].如今,使用电子烟的美国青少年多于使用传统香烟的美国青少年[5-7];全国范围内,9%的8年级学生、16%的10年级学生和17%的12年级学生报告在过去30天内使用电子烟,而8年级的4%、10年级的7%和12年级的14%的学生报告在过去30天内使用过香烟[5].

消费者对电子烟的兴趣和使用可能受到来自社会来源的广告和信息共享的影响。2010年至2013年,电子烟广告支出在电视、杂志、户外、广播和网络等媒体渠道上大幅增长[8-10].从2011年到2013年,电子烟电视广告增长了256% [9从2012年到2013年,在电子烟和烟草在线广告上的花费超过200万美元[10].成人及青少年容易接受电子烟电视广告[811],接触电子烟与青少年使用电子烟的意愿有关[11].然而,研究表明,大多数人是从网上(41%)或从个人接触(35%)听说电子烟的[12大多数尝试电子烟的消费者都是出于好奇,或因为朋友或家人向他们提供了电子烟[13].最近的研究表明,电子烟信息可以从品牌网站、电子烟用户论坛、营销以及Twitter和YouTube等社交媒体网站上的用户生成内容中广泛获得[1410].因此,了解电子烟是如何营销的,以及消费者分享了关于电子烟的哪些信息,有助于为正在进行的监督和监管工作提供信息。

社交媒体是我们日常生活中重要的信息来源。在美国,近81%的年轻人[15和74%的成年人[1617使用某种形式的社交媒体。Twitter,一个社交网络微博,越来越受欢迎,目前(2015年9月17日)有超过3.16亿活跃用户[18].注册用户可以发布不限数量的140字符的帖子(“tweet”),这些帖子默认是对公众可见的。截至2015年9月,用户每天创造超过5亿条推文[18].由于推文是公开的,推特已成为监测公共卫生问题和洞察新出现现象的丰富数据源[19-26].

研究人员已经开始探索推特上的电子烟对话[27-29].黄及同事[29]分析了2012年5月至6月的电子烟推文,发现90%的推文与商业/广告相关,这些推文来自相对较小的极端活跃用户群体。此外,大多数推文(94%)包含url,在许多情况下用于促销或销售电子烟。在另一项研究中,研究人员发现推特被用来反对通过电子烟法规[28].在芝加哥市议会计划就电子烟作为烟草产品进行投票的前一周,大多数推特提到芝加哥公共卫生部(59%)反对该政策,并将电子烟作为香烟的更健康替代品和戒烟的辅助手段。这项研究的发现表明,这些推文中有14%是使用旨在就某个问题(如电子烟的健康益处)达成共识的账户创建的。这些研究表明,Twitter数据可能对电子烟营销和政策问题的监控有用。

美国食品和药物管理局(FDA)目前没有对电子烟进行监管,但FDA已经发布了一项规定,扩大了他们监管电子烟的权力。研究人员认为,需要对电子烟广告做出迅速回应[30.].如果FDA对电子烟的营销方式进行监管,包括公司可以提出的声明类型,那么就需要对电子烟的营销实践进行持续监控,并对潜在违规者实施执法。由于电子烟在网上做广告,识别和监控这些实体对监管执法工作至关重要,特别是在社交媒体等平台上,在这些平台上可以在不验证真实身份的情况下开设多个账户。因此,识别在网上做电子烟广告的营销人员对这些努力至关重要。

地方和州政府出台了更为积极的法规,包括禁止向未成年人销售电子烟[31通过修改室内清洁空气法,将电子烟包括在内,禁止在公共场所使用电子烟。然而,这些法律的执行程度在很大程度上是未知的。在一项针对1201名美国成年吸烟者的网上调查中,我们发现35.0%的人表示看到他人在公共场所“经常”或“非常经常”使用电子烟,例如餐馆(31.6%)、公园和海滩(43.7%)和工作场所(21.0%)[32].由于社交媒体被消费者广泛使用,分析社交媒体数据可能会提供更多洞察消费者对电子烟政策的行为和反应,有助于为未来的监管行动提供信息。

我们的研究通过挖掘推特(推特的完整样本)多年(2008-2013年)的推特数据,探索了关于电子烟的见解。本研究建立在以往研究的基础上,通过几种重要方式研究了推特上的电子烟营销[29].首先,我们的推特数据和分析代表了一个关键时期(2008-2013年),用于理解电子烟营销、广告、销售和使用的快速增长。这些分析捕捉到了电子烟使用开始普及期间的推文。其次,这项研究确定了可能表明垃圾邮件或虚假消费者(如购买追随者)的营销趋势,这对优先考虑电子烟营销的监管工作具有重要意义。第三,这项研究从推特中提取了人们报告使用(和看到其他人使用)电子烟的地方,这有助于阐明政策制定者应该考虑通过禁止使用电子烟的法规的地方。


数据源

推特数据来自Radian6 [33],这是一个领先的社交媒体监测工具,从社交网站(如,Twitter, Facebook, YouTube),论坛,博客和主流新闻收集超过4亿个来源的数据。Radian6提供了从2008年7月1日起的Twitter历史数据,并为用户提供了从Twitter firehose访问所有可用tweet的完整权限。

关键字搜索

为了识别关于电子烟的推文,我们开发了一个包含55个搜索关键词的搜索语法,包括一般的电子烟术语(如,电子烟,eCig),特定的电子烟品牌名称(如,blu, NJoy,绿色烟雾),以及关于电子烟使用的术语(如,vaping)。我们审查了最初的搜索结果,并修改了语法,以排除其他烟草或毒品术语(例如,大麻,水烟)。最终的搜索语法被输入到Radian6中,以识别从2008年7月1日到2013年2月28日(进行搜索时)的相关tweet。搜索结果从Radian6下载到Microsoft Excel中,包括推文的日期和时间、推文句柄、推文全文(包括url、标签)以及推文发布时的关注人数。

推文分类与分析

数据处理是用Python编程语言完成的。我们使用正则表达式从文本中提取标签和链接[34].对于标签,我们使用正则表达式#[a-zA-Z][a-z-A-Z0-9_]。对于url,我们使用+:/ {2 }[-]+(.[-]+)(?:(?:/[^ s /))) (34].因为很多链接都是URL缩短器(例如bit。我们使用unshort提供的应用程序编程接口(api)对url进行了反缩短。我和unshortenit . ![35].

广告推文分类

我们从Radian6语料库中随机选择了507条tweet,并手动将它们分类为广告或非广告。如果一条推文提到特定品牌或网站,并列出价格、促销优惠和“购买”等词,就会被编码为电子烟广告。通过使用Python中的scikit-learn模块[36,我们构建了一个分类算法来标记剩下的推文是否为广告。我们使用了推文的文本内容和分类算法中的5个元数据特征:推文时的关注者数量、推文时的关注者数量、推文时的推文数量、表示该推文是否包含URL的二进制特征和表示该推文是否为转发的二进制特征。

将推文文本转化为特征矩阵[37,我们使用了scikit-learn的CountVectorizer方法[36].CountVectorizer为每个单词创建一个特征,在本例中,为长度为1到4的每个n-gram创建一个特征[37].对于每个tweet,如果tweet包含n-gram,则该特征的值为1,否则为0。最初,我们有15,313个n-gram特性以及5个元数据特性。

由于特征的数量是数据点数量的30倍,我们在训练分类模型之前进行了特征选择[3839].我们训练了一个极随机化的树模型[39](在scikit-learn中作为ExtraTreesClassifier实现),并只选择特征重要性非零的特征。这就产生了2167个特性。然后,我们用10棵树的随机森林模型(由scikit-learn实现)来拟合减少后的数据。根据精确度指标(正确分类的比例),我们用十倍交叉验证对我们的模型进行评分。(因为我们关心的是两个类别的正确分类,精度和召回率在这里是不够的指标。)10个交叉验证的平均准确性为0.907。因为训练数据中78%的推文是广告,将所有内容都标记为广告的朴素分类器的准确率为0.78。我们的模型比这个基线提高了16%。该分类器具有较高的准确率(91%)和召回率(93%)。

人们使用电子烟的分类

通过使用自然语言处理和人工分类相结合的方法,我们提取了指示人们使用电子烟或观察到其他人使用电子烟的介词短语。我们从归类为非广告的推特语料库开始。

首先,我们选择了包含这些单词的推文的子集吸烟特许经销商抽烟特许经销商烟熏,特许经销商这表明电子烟的使用十分活跃。其次,我们根据一系列迭代开发的规则清理每条推文,以最大限度地提取介词短语的数量。这些规则包括删除@提及和话题标签,删除各种感叹词(如“lol”,“smh”和各种咒骂词),删除常见的从句短语(如“在中间”,“在前面”),纠正常见的拼写错误和在基于文本的交流中常用的俚语(如“ur”到“you’re”)。第三,我们用自然语言工具包(NLTK)库中的词性标记符[40].标记者试图用词性给文档(如推文)中的每个单词贴上标签。第四,为了从推特中提取介词短语,我们提取了每个介词和下一个动词、介词或“wh-”副词之前的所有后续单词(例如,“无论何时”、“哪里”)。用于介词短语提取的统计方法,如Stanford Parser [41都有。然而,由于Twitter上普遍存在糟糕的拼写和语法,斯坦福解析器在正确提取介词短语方面被证明是无效的。研究了100条包含介词短语的推文样本,我们确定了表示电子烟使用地点的3个主要介词是“in”(62条推文)、“at”(12条推文)和“on”(11条推文)。其次最常见的介词是“around”(3条推文)和“during”(3条推文)。因此,我们将进一步的分析限制在包含前3个介词之一的推文上。最后,我们手工编制了一个名词列表,这些名词通常出现在介词短语中,但不涉及物理位置(例如,在“晚上”,在“生活”)。包含这些词作为宾语的介词短语被排除在我们的分析之外。一旦包含这些宾语的介词短语被排除在外,我们就会得到一个推文列表,其中包含在物理场所使用电子烟的相关信息。


从2008年7月1日到2013年2月28日,我们共识别了1,669,123条关于电子烟的推文(图1).关于电子烟的推文数量从2008年的82条(仅5月至12月)增加到2009年的10,870条,2010年的141,405条,2011年的746,541条,2012年的643,900条,2013年的64,734条(仅1月至2月)(表1).在这160万条推文中,93.43% (n=1,559,508)为电子烟广告,而只有6.57% (n=109,615)为非广告推文(表1).大约28.70%(447,579/1,559,508)的广告推文被转发,而11.60%(12,715/109,615)的非广告推文被转发。作为图1结果显示,广告推文在观察期间急剧增加,有急剧增加的时期,也有急剧下降的时期,而非广告推文的增长最少,且以相对稳定的速度增长。

我们不知道任何事件可以解释观察到的峰值。我们研究了2011年10月和11月前后的高峰,并注意到从那时起开始发布电子烟内容的Twitter帐户数量有所增加,但在2012年初停止了。我们认为这可能是一场协同营销/垃圾邮件行动,因为许多Twitter账户都是随机数字和字符。

表1总结了广告推文和非广告推文的特点。大约10%的广告推文描述了与价格相关的促销活动,包括优惠券(7.69%,119,904/1,559,508)、折扣(7.61%,118,616/1,559,508)和折扣(0.89%,13,952/1,559,508)。大约14.99%(233,712/1,559,508)提到了我们编码的32个电子烟品牌中的一个,其中blu(5.99%, 93,404 /1,559,508)、V2(2.05%, 31,983/1,559,508)和绿烟(1.78%,27,778/1,559,508)是最常提到的品牌。在研究期间,最活跃的5个推特账户发布了32141到88424条推文。在这5个句柄中,有两个包含了与电子烟相关的词汇(例如,蒸汽和电子烟)。最多产的句柄属于一个在线电子烟供应商,他在Twitter上的个人资料如下:“在[蒸汽神网站],超过125种口味的电子烟可供选择。我们还提供风味实验室,在那里你可以创造自己的果汁口味!”截至2015年3月7日,该账号有15601名粉丝,发布了107739条推文,但自2012年11月5日以来,只发布了10条推文。他们的许多推文都是这样的,广告上有不同的口味:“尝尝我们美味的香草纸杯蛋糕味电子烟液!使用优惠券代码(twitter[蒸汽神网站])结账时可享受8折优惠(2012年11月5日)。” In contrast, the other active Twitter handles had limited information on their profile (ie, no description, custom background, picture, or URL), and the name given for the account was generic (eg, “moou,” “alejandro”). These Twitter handles also had few followers (132-1340) compared with the most prolific Twitter handle, yet they had a large number of total tweets (eg, one account posted 132,242 tweets as of March 7, 2015). Most tweets were short fragments of text promoting e-cigarettes (eg, “Review e-cigarette” and “Best vapor 7.5mm ecigs”) often with a link that redirected to an inactive page at the time of last review (March 7, 2015). Tweets also contained e-cigarette promotional phrases within nonsensical strings of words (eg, “Buy Electronic smoke The e cigarette bass viol safeguarding brace the healthiness but the...e-Cigarettes On Sale”). This pattern suggests that an automated computer program, rather than a human, may have been generating tweet content and posting it online. None of these Twitter handles appeared to be active as of December 2013 and one account was suspended by Twitter. The most common links shared in advertising tweets are summarized in表1.气化神网站的连结[42的帖子被89068条推特转发,其中大部分是由电子烟广告推特上最活跃的推特账号转发的。最常被独特的Twitter句柄分享的前3个链接[43-45似乎是关于电子烟的新闻和评论的附属网站,包括电子烟品牌的广告和免费电子烟入门包的链接。

本文还总结了109,615条非广告电子烟推文的特征表1.在4244条非广告推文中提到了特定品牌,其中提到最多的是blu(979条,0.89%)、Vapor4life(803条,0.73%)、Volcano(718条,0.66%)、NicStick(605条,0.55%)和eSmoke(311条,0.28%)。在非广告推文中,最活跃的推文在424到1224条之间。所有这些推特句柄中都包含与电子烟相关的术语(如,vape, ecigs)。非广告推特的关注人数(51-2705)明显少于电子烟广告推特。根据该公司的推特资料,最多产的非广告推特名称是“全球电子烟制造商和零售商”,但这家零售商在推特上发布与电子烟相关的政策和新闻故事,并与关注者互动,而不是为其产品做广告。另一份资料写道,他是“丈夫,四个孩子的父亲,护士和电子烟工”,“喜欢科技,一有机会就出去走走。和孩子们在一起、钓鱼是我最喜欢做的事情。”

表1。电子烟推文的数量和特征,2008年5月1日至2013年2月28日(N=1,669,123)。
特征 微博
推文数量,n

2008年(只限7月至12月) 82

2009 10870年

2010 141405年

2011 746541年

2012 643900年

2013年(仅1月至2月) 64734年

合计,n (%) 1669123 (100)


广告推文 1559508 (93.43)


广告推文 109615 (6.57)
广告推文,n (%)

促销活动 152812 (9.80)

优惠券 119904 (7.69)

从百分比 118616 (7.61)

折扣 13952 (0.89)

提到品牌 233712 (14.99)


的客人 93405 (5.99)


V2 31983 (2.05)


绿色的烟雾 27778 (1.78)


溢价 11112 (0.71)


设计师小金 9337 (0.60)

最活跃的Twitter帐户一个


最活跃句柄(16160关注者) 88424 (5.67)


第二活跃的句柄(1393个粉丝) 50651 (3.25)


第三活跃句柄(136名粉丝) 41032 (2.63)


第四活跃句柄(145名粉丝) 36694 (2.35)


第五活跃句柄(149名粉丝) 32141 (2.06)

在推特上分享的最常见链接


VaporGod [42 89068 (5.71)


http://aan.atrinsic.com/z/873949/9092/&subid1=9546 75580 (4.85)


http://bestcelebrex.blogspot.com/p/e-cigarette.html 42751 (2.74)


南滩烟 14718 (0.94)


http://ECigarettesStarterKits.com [43 8351 (0.54)
非广告推文,n (%)

提到品牌 4244 (3.87)


的客人 979 (0.89)


Vapor4Life 803 (0.73)


火山 718 (0.66)


NicStick 605 (0.55)


eSmoke 311 (0.28)

最活跃的Twitter帐户


最活跃句柄(2705个关注者) 1224 (1.11)


第二活跃的句柄(646个粉丝) 899 (0.82)


第三活跃句柄(702粉丝) 737 (0.67)


第四活跃句柄(51个粉丝) 547 (0.50)


第五活跃句柄(246名粉丝) 424 (0.39)

推特中提到的地方 471 (0.43)


184 (39.07)


房子/室/在床上 59 (12.53)


学校 57 (12.11)


公共场所 41 (8.70)


浴室 27日(5.73)


工作 21日(4.46)


在某人面前 12 (2.55)


11 (2.34)


餐厅 10 (2.1)


电影院 9 (1.91)


飞机/机场 8 (1.70)


商店 7 (1.49)


酒吧/俱乐部 6 (1.27)


宿舍 6 (1.27)


图书馆 4 (0.85)


购物中心 3 (0.64)


保龄球馆 2 (0.42)


咖啡馆/咖啡店 2 (0.42)


医院 1 (0.21)


更衣室 1 (0.21)

一个2013年12月12日粉丝数

对于发布电子烟推文的最活跃用户的子集,我们探索了额外的元数据,以了解如何描述这些用户。具体来说,我们调查了7个最活跃的推特用户随时间累积的粉丝数量(图2).在短时间内积累大量关注者(这种情况发生在某些用户身上),可能会让人联想到一个营销人员或垃圾邮件制造者购买了一系列Twitter用户名作为关注者,而合法品牌或企业则会随着时间的推移稳步积累关注者。事实上,对推特上关于电子烟的推文飙升至最高水平(2011年11月- 2012年2月)期间的历史活动的进一步研究表明,大量的垃圾邮件账户在这个时期开始发布推文,其句柄由随机字符组成,并在2012年初被推特关闭。

我们对用户提到使用电子烟或看到他人使用电子烟的地方进行了编码。在471条提到特定地点的推文中,39.1%(184/471)提到了在课堂上使用电子烟,而12.5%(59/471)提到了在家里/房间/床上使用,12.1%(57/471)提到了在学校使用,8.7%(41/471)提到了在公共场合使用,5.7%(27/471)提到了在浴室使用,4.5%(21/471)提到了在工作中使用。有些推特确实是关于在学校等公共场所使用电子烟的个人(例如,“我的老师每天都因为我在课堂上吸电子烟而对我大喊大叫……和“在浴室抽电子烟#管它呢”),以及在卧室等私人空间方便的地方抽电子烟(例如,“我真的很喜欢又能在自己的房间里抽了,天哪!”# ecig”)。然而,大多数推特都来自于人们对其他人在公共场所使用电子烟表示怀疑(例如,“这家伙真的在课堂上抽电子烟吗?”#是的# wtf”)。人们还注意到,看到别人在传统上禁止吸烟的地方抽电子烟很奇怪(例如,“我办公室的人在抽电子烟,在室内,在办公室,在白天看到烟很奇怪”),并对在公共场所使用电子烟是否被允许感到困惑(例如,“我的教授刚刚在课堂上抽电子烟,这是违法的吗?”和“高中生在我的#地铁站抽电子烟。”@Wmata这允许吗?#刑警# defnothealthy”)。

图1。从2008年7月1日到2013年2月28日,每周按类型(广告和非广告)分列的电子烟推文数量。
查看此图
图2。多产电子烟广告推特处理的追随者数量。
查看此图

主要结果

总之,我们发现,近年来,Twitter上关于电子烟的对话急剧增加。这种模式与最近电子烟广告支出的上升相一致[8]及青少年使用电子烟的情况[46]和成人[47].大多数推文似乎都与广告有关,这并不奇怪,因为在新产品推出的早期,人们往往会宣称新产品的成本效益更高(例如,声称电子烟比烟草香烟和尼古丁替代疗法更便宜)[48].此外,因为任何人都可以创建一个Twitter账户并开始发布内容,电子烟供应商可以通过Twitter向超过3.16亿的月活跃用户自由地“宣传”他们的产品,而本身没有广告成本。这也意味着任何人——无论是合法品牌、只在网上销售的供应商、附属营销人员,还是电子烟用户/爱好者——都可以发布内容。事实上,我们对最活跃的Twitter句柄的观察表明,实际的在线供应商和潜在的联盟营销人员正在网上推广电子烟,其中一些可能使用计算机程序自动生成和发布推文内容。这种做法并不是电子烟独有的,多年来,Twitter一直试图识别垃圾邮件账户,这些垃圾邮件是由计算机程序自动生成的内容,而不是真实的个人。这种类型的“垃圾邮件”表明存在一个电子烟在线市场,在那里个人可以通过驱使客户访问电子烟供应商的网站来赚钱。这也意味着在线市场比传统的实体市场更加多样化;在推特上提到的顶级品牌,除了blu eCigs,都不是在其他媒体渠道(如电视)上做广告或在零售商店销售的领先品牌[8].

在网上发布用户生成的内容并在Twitter等社交媒体平台上分享这些信息的便利性表明,Twitter用户可能比非Twitter用户接触到更多的电子烟品牌和在线供应商。尽管只有约23%的美国成年人使用Twitter,但18至29岁的年轻人使用Twitter的比例最高[17],近年来在年轻人中越来越多[1749].年轻人上推特并不一定意味着他们会接触到这些推文。你必须关注这些推特账户,或者通过他们的社交网络(即,关注者或他们关注的人)或通过搜索看到这些推文。这项研究并不是为了调查可能接触过这些电子烟推文的受众;然而,最近的研究表明,电子烟用户是从互联网等来源了解电子烟的。因此,监测电子烟如何在Twitter等社交媒体平台上被讨论是很重要的,特别是如果多个Twitter用户频繁地发布关于电子烟的推文,可能会给消费者一种错误的认知,即电子烟很容易获得,使用比实际情况更普遍。先前的研究表明,制造共识错觉的策略已被用来反对通过电子烟政策[28].我们还从文献中了解到,年轻人高估了青少年吸烟的流行程度,因此频繁接触有关电子烟的推特和人们通过照片吸电子烟的视觉线索,可能会影响他们对电子烟使用的兴趣和感知的社会规范[50].

我们对最活跃的Twitter用户的推文模式的分析也揭示了一些重要的模式(例如,账户在短时间内获得了许多关注者),这表明一些最活跃的账户可能参与了购买关注者等行为。此前的研究表明,发帖行为的异常模式(例如,短时间内大量发帖)是垃圾邮件或虚假消费者的标志[51].在这种情况下,一个特定的与电子烟相关的推特账号的粉丝激增很可能意味着垃圾邮件。在这一领域还需要进行更多的工作,因为将合法的电子烟公司/供应商与垃圾邮件发送者/附属营销人员区分开来将有助于确定优先次序并为未来的监管工作提供信息。

我们对非广告推文的分析表明,关于电子烟的有机对话正在网上发生,这可以提供对消费者使用行为的洞察。有趣的是,我们发现关于电子烟在公共场所使用的帖子,最受关注的是班级。尽管其中一些推文表明学生(以及某些情况下的教职员工)在课堂上使用电子烟,但大多数推文来自不使用电子烟的人,他们对看到其他人在公共场合使用电子烟表示惊讶或鄙视,并对这是否被允许感到困惑。从这些推文中,我们不知道这些推文是关于高中班级还是大学班级的年轻人还是年轻人,未来的研究应该研究如何确定推文用户的人口统计数据。不管怎样,这些结果表明,青少年和年轻人可能在日常生活中接触到电子烟的使用,而工作人员不采取行动可能会让他们觉得使用电子烟是允许的,而且不像卷烟那样有害。这是公共卫生专业人员关注的一个问题,越来越多的地方政府引进了[52和通过[53禁止在公共场所和学校使用电子烟的政策(例如,[54])。

限制

这项研究有几个局限性。尽管我们试图使用综合搜索策略来识别关于电子烟的所有推文,但我们可能会错过一些相关的推文。此外,我们试图描述最活跃的推特用户,但我们的分析主要基于他们的个人资料中发布的信息,这可能不能反映他们的真实身份或他们在推特上发布电子烟内容的动机。在进行Twitter研究时,这是一个普遍的挑战,需要更先进的计算方法来挖掘任何给定Twitter句柄的个人资料描述和推文内容,以确定个人的人口统计学特征。此外,我们不知道推特用户接触电子烟推文的程度。最后,鉴于电子烟市场、品牌广告策略、电子烟政策和消费者行为可能发生的变化,本研究中提供的数据可能具有有限的影响。

与之前工作的比较

这项研究建立在之前评估推特上电子烟营销的基础上。29])。一个关键优势是,我们分析了多年的数据,以描述Twitter上电子烟对话的新兴趋势。我们使用一个可以访问完整Twitter示例和历史tweet的数据源。相比之下,大多数使用Twitter数据的研究只考察了短得多的时间段(例如,几个月),使用的是从Twitter API免费获取的数据,只提供了所有推文的1%。这里展示的Twitter数据和分析也帮助我们理解电子烟营销的一个关键时期(2008-2013年),当时电子烟开始流行起来。这项研究还确定了使用电子烟的地点,并建议需要更好地执行在学校等公共场所限制电子烟使用的政策。

结论

总之,Twitter可以为电子烟等新产品的信息如何通过社交媒体传播提供有价值的见解。我们的研究结果表明,Twitter正在被用来推广电子烟,而且在线市场比线下实体产品和广告策略更加多样化。鉴于任何人都可以很容易地建立多个社交媒体账户,无需身份验证,就可以向全球消费者宣传自己的产品,因此监控和监管这些在线实体将是一项挑战。因此,重要的是,不仅要检查电子烟广告推文的内容,还要检查营销人员的其他特征,如推文行为的频率和获得关注者的模式,以确定州和联邦政府可能需要监控和监管的实体。例如,执行广告限制可能对实体电子烟品牌公司和在线电子烟零售商的附属营销人员产生不同的影响。我们的研究结果还强调,电子烟正在学校等公共场所使用,并强调了教育和执行禁止在公共场所使用电子烟政策的必要性。总之,Twitter数据可以为电子烟等快速发展的公共卫生现象提供新的见解,帮助为未来的研究、监管、监测和执法工作提供信息。

致谢

这项工作由RTI国际的一项内部研究基金资助,部分是根据RTI对佛罗里达州卫生部佛罗里达无烟局的评估。

作者的贡献

AK提出了研究的概念,并领导了研究的实施、研究结果的解释和手稿的撰写。TH负责数据分析并协助撰写稿件。SS协助数据分析。JN协助解释研究结果和审稿。AL和HH协助数据收集。JG和LP协助撰写和审稿。

利益冲突

没有宣布。

  1. gregory S, Fong GT, Cummings KM, Yan M, Quah AC, Borland R,等。10个国家对电子烟的认识、试验和使用现状:来自ITC项目的调查结果。国际环境研究与公共卫生2014年11月;11(11):11691-11704 [免费全文] [CrossRef] [Medline
  2. 多克瑞尔M,莫里森R,鲍德L,麦克尼尔A.电子烟:在英国的普及和态度。尼古丁Tob Res 2013年10月15日(10):1737-1744 [免费全文] [CrossRef] [Medline
  3. Brown J, West R, Beard E, Michie S, Shahab L, McNeill a .英国电子烟使用者的患病率和特征:来自吸烟者一般人口调查的发现。成瘾者行为2014年6月;39(6):1120-1125 [免费全文] [CrossRef] [Medline
  4. McMillen RC, Gottlieb MA, Shaefer RM, Winickoff JP, Klein JD。美国成年人使用电子烟的趋势:吸烟者和非吸烟者使用电子烟的人数都在增加。尼古丁Tob Res 2014年11月6日;17(10):1195-1202。[CrossRef] [Medline
  5. Johnston L, O 'Malley P, Miech R, Bachman J, Schulenberg J.监测青少年药物使用的未来国家结果:主要发现概述。密歇根州安娜堡:密歇根大学社会研究所;2014.
  6. L . Porter, Duke J, Hennon M, Dekevich D,曲肖E, Homsi G,等。2011-2014年,佛罗里达州初高中学生中电子烟和传统香烟的使用情况。PLoS One 2015;10(5):e0124385 [免费全文] [CrossRef] [Medline
  7. willt, Knight R, Williams R, Pagano I, Sargent J.青少年纯电子烟使用和双电子烟和烟草使用的风险因素。儿科;2015年1月(135)。10.儿科0760;135 (1):E43-E51。
  8. Kim AE, Lee YO, Shafer P, Nonnemaker J, Makarenko O.成年吸烟者对电子尼古丁输送系统电视广告的接受度。2015年3月24日(2):132-135。[CrossRef] [Medline
  9. Duke JC, Lee YO, Kim AE, Watson KA, Arnold KY, Nonnemaker JM,等。青少年和青年接触电子烟电视广告的情况。儿科学2014 7月;134(1):e29-e36。[CrossRef] [Medline
  10. 网络上的烟草:在线烟草和电子烟广告的监视和特征。Tob Control 2015 july;24(4):341-347。[CrossRef] [Medline
  11. Farrelly MC, Duke JC, Crankshaw EC, Eggers ME, Lee YO, Nonnemaker JM,等。电子烟电视广告对使用电子烟意愿影响的随机试验。2015年6月29日;49(5):686-693。[CrossRef] [Medline
  12. 道金斯L,特纳J,罗伯茨A,苏萨K。“电子烟”简介和偏好:一项针对电子烟用户的在线调查。成瘾2013年6月;108(6):1115-1125。[CrossRef] [Medline
  13. Pepper JK, Ribisl KM, Emery SL, Brewer NT.开始和停止使用电子烟的原因。国际环境研究与公共卫生2014;11(10):10345-10361 [免费全文] [CrossRef] [Medline
  14. 朱凯,斯德胡A,瓦伦蒂T.电子烟在线营销:多站点、多产品比较。JMIR公共卫生和监测2015;1(2):e11。[CrossRef
  15. 皮尤研究中心。青少年情况说明网址:http://www.pewinternet.org/fact-sheets/teens-fact-sheet/[访问2015-03-06][WebCite缓存
  16. 皮尤研究中心。社交网络情况说明网址:http://www.pewinternet.org/fact-sheets/social-networking-fact-sheet/[访问2015-10-29][WebCite缓存
  17. Duggan M, Ellison NB, Lampe C, Lenhart A, Madden M.主要社交网络平台的人口统计。华盛顿特区:皮尤互联网与美国生活项目;2015年1月09日URL:http://www.pewinternet.org/2015/01/09/demographics-of-key-social-networking-platforms-2/[访问2015-03-06][WebCite缓存
  18. Twitter。关于网址:http://www.webcitation.org/6WplPQ8Cl[2015-10-29]访问
  19. Bosley JC, Zhao NW, Hill S, Shofer FS, Asch DA, Becker LB,等。解码Twitter:心脏骤停和复苏通信的监测和趋势。复苏2013 Feb;84(2):206-212 [免费全文] [CrossRef] [Medline
  20. 推特时代的流行病:2009年H1N1爆发期间推特的内容分析。PLoS One 2010;5(11):e14118 [免费全文] [CrossRef] [Medline
  21. Aslam AA, Tsou M, Spitzberg BH, An L, Gawron JM, Gupta DK,等。推特作为季节性流感监测的辅助方法的可靠性。J Med Internet Res 2014;16(11):e250 [免费全文] [CrossRef] [Medline
  22. Bhattacharya S, Tran H, Srinivasan P, Suls J.用Twitter进行信念监控。在:第四届ACM Web科学年会论文集。2012年发表于:WebSci '12 ACM Web科学会议;2012年6月22-24日;埃文斯顿,伊利诺斯州,2012-2016年。[CrossRef
  23. Kendra RL, Karki S, Eickholt JL, Gandy L.在推特圈中描述抗生素讨论的特点:什么是更大的图景?J medical Internet Res 2015;17(6):e154 [免费全文] [CrossRef] [Medline
  24. 普列托VM, Matos S, Álvarez M, Cacheda F, Oliveira JL。Twitter:一个检测健康状况的好地方。PLoS One 2014 1月;9(1):e86191 [免费全文] [CrossRef] [Medline
  25. Tighe PJ, Goldsmith RC, Gravenstein M, Bernard HR, Fillingim RB。痛苦的推文:与痛苦相关的推文的文本、情感和社区结构分析。J medical Internet Res 2015;17(4):e84 [免费全文] [CrossRef] [Medline
  26. Weeg C, Schwartz H, Hill S, Merchant R, Arango C, Ungar L.使用Twitter测量公众对疾病的讨论:一个案例研究。JMIR公共卫生和监测2015;1(1):e6。[CrossRef
  27. Myslín M, Zhu S, Chapman W, Conway M.使用twitter研究吸烟行为和对新兴烟草产品的认知。J Med Internet Res 2013;15(8):e174 [免费全文] [CrossRef] [Medline
  28. Harris JK, moland - russell S, Choucair B, Mansour R, Staub M, Simmons K.在推特上支持和反对公共卫生政策:对芝加哥公共卫生部电子烟推特运动的回应。J medical Internet Res 2014;16(10):e238 [免费全文] [CrossRef] [Medline
  29. 黄杰,Kornfield R, Szczypka G, Emery SL.电子烟在推特上营销的横断面研究。Tob Control 2014年7月;23日增补3:iii26-iii30 [免费全文] [CrossRef] [Medline
  30. 电子烟的推广:烟草营销的再造?BMJ 2013; 347: f7473。[Medline
  31. 威尔逊·r·华盛顿邮报,2013年10月29日。等待美国食品及药物管理局制定自己的电子烟法规网址:https://www.washingtonpost.com/blogs/govbeat/wp/2013/10/29/awaiting-fda-states-pursue-their-own-e-cigarette-rules/[访问2015-10-29][WebCite缓存
  32. RTI国际,佛罗里达州无烟草局。2014年烟草行业监测在线吸烟者调查。佛罗里达州塔拉哈西:佛罗里达州无烟草局;2014.
  33. Gothelf A. Salesforce营销云。2013年7月11日。Salesforce Radian6将拓展新浪微博、VK.com社交听力http://www.exacttarget.com/blog/social-listening-radian6-sina-weibo-vk[访问2015-03-06][WebCite缓存
  34. 堆栈溢出。2008 9月17日。如何匹配文本中的uri ?URL:http://stackoverflow.com/questions/82398/how-to-match-uris-in-text/83378[访问2015-03-06][WebCite缓存
  35. Unshorten.It !URL:http://www.unshorten.it/[访问2015-10-29][WebCite缓存
  36. Pedregosa F, Varoquaux G, Gramfort A. Scikit-learn: Python中的机器学习。机器学习研究学报2011;12:2825-2830。
  37. Manning C, Schütze H.统计自然语言处理基础。马萨诸塞州剑桥:麻省理工学院出版社;1999.
  38. Hastie T, Tibshirani R, Friedman J.《统计学习的要素:数据挖掘推理和预测》第二版。纽约:施普林格;2009.
  39. Geurts P, Ernst D, Wehenkel L.极端随机树。机器学习2006;63:3-42。
  40. 伯德S,罗佩尔E,尤恩克。使用Python进行自然语言处理。塞瓦斯托波尔,加州:O 'Reilly Media, Inc;2009.
  41. 斯坦福自然语言处理小组。斯坦福解析器:一个统计解析器http://nlp.stanford.edu/software/lex-parser.shtml[访问2015-03-06][WebCite缓存
  42. 蒸汽的神。URL:http://www.vaporgod.com/[访问2015-10-29][WebCite缓存
  43. ECigarette入门套件。URL:http://ecigarettesstarterkits.com/[访问2015-03-06][WebCite缓存
  44. ECig品牌入门套件。URL:http://ecigbrandstarterkit.com/[访问2015-10-29][WebCite缓存
  45. 免费Ecigarette入门套件。URL:http://freeecigarettestarterkits.com/[访问2015-10-29][WebCite缓存
  46. 疾病控制和预防中心来自该领域的笔记:电子烟在初高中学生中的使用-美国,2011-2012。MMWR Morb Mortal Wkly Rep 2013年9月6日;62(35):729-730 [免费全文] [Medline
  47. 皮尔逊JL,理查森A, Niaura RS, Vallone DM,艾布拉姆斯DB。美国成年人的电子烟意识、使用和危害认知。Am J公共卫生2012年9月102(9):1758-1766 [免费全文] [CrossRef] [Medline
  48. Grana RA, Ling PM。“吸烟革命”:电子烟零售网站内容分析。Am J Prev Med 2014 04;46(4):395-403 [免费全文] [CrossRef] [Medline
  49. 卡夫卡P. All Things Digital. 2013年12月2日。随着Twitter的发展,它的用户不再URL:http://allthingsd.com/20131202/as-twitter-grows-up-its-users-dont/[访问2015-03-06][WebCite缓存
  50. Davis KC, Nonnemaker JM, Farrelly MC.国家吸烟预防运动与美国青少年吸烟患病率之间的关系。青少年健康杂志2007年11月41(5):430-436。[CrossRef] [Medline
  51. 金达尔,刘斌。观点垃圾信息与分析。2008年Web搜索和数据挖掘国际会议论文集。2008年2月11-12日;斯坦福大学,CA。
  52. Byrne J. Chicago Tribune, 2014年1月14日。芝加哥禁止室内吸电子烟网址:http://articles.chicagotribune.com/2014-04-29/news/chi-chicago-indoor-ecigarette-smoking-ban-takes-effect-today-20140428_1_effect-today-indoor-public-places-ban[访问2015-10-29][WebCite缓存
  53. 纽约每日新闻。2013年12月30日。彭博市长签署室内电子烟禁令,吸烟者点烟http://www.nydailynews.com/new-york/bloomberg-bans-e-cigarettes-indoors-smokers-light-article-1.1562010[访问2015-10-29][WebCite缓存
  54. 《今日美国》2014年7月02日。各学区采取行动禁止在校园内吸电子烟网址:http://www.usatoday.com/story/news/nation/2014/07/02/ecigarettes-school-district-bans-policies/11761125/[访问2015-10-29][WebCite缓存


API:应用程序接口
食品药品监督管理局:食品和药物管理局


G·埃森巴赫编辑;提交25.03.15;G Promoff, Y Wang, S Bhattacharya同行评议;对作者19.06.15的评论;修订版收到18.09.15;接受09.10.15;发表06.11.15

版权

©Annice E Kim, Timothy Hopper, Sean Simpson, James Nonnemaker, alicia J Lieberman, Heather Hansen, Jamie Guillory, Lauren Porter。最初发表于《医学互联网研究杂志》(//www.mybigtv.com), 2015年11月6日。

这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。


Baidu
map