这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR研究协议上的原创作品。必须包括完整的书目信息,http://bioinform.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
新型冠状病毒的RNA基因组正在快速突变,人传人率正在上升。因此,对其进化动态的时间解剖,不同菌株之间变异的本质,以及了解地方性环境中的单核苷酸多态性至关重要。描绘这种新型病毒的异构基因组星座将有助于我们了解它在特定地理区域的复杂行为。gydF4y2Ba
这是对2020年前6个月(1月至6月)全球共享所有流感数据倡议(GISAID)存储库中提供的95个印度SARS-CoV-2基因组序列的综合分析。分析了印度12个不同邦流行的SARS-CoV-2毒株的进化动力学、基因特异性系统发育以及9个结构和非结构基因中新出现的共进化突变。gydF4y2Ba
从GISAID数据库中下载了印度提交的95条SARS-CoV-2核苷酸序列。利用分子进化遗传学分析(Molecular Evolutionary Genetics Analysis, version X)软件,根据SARS-CoV-2基因的核苷酸序列构建9个系统进化树图。与来自中国武汉的SARS-CoV-2原型进行了共进化突变分析。与A97V突变相关的RNA依赖RNA聚合酶/非结构蛋白NSP12的二级结构被预测。gydF4y2Ba
系统发育分析揭示了与蝙蝠严重急性呼吸综合征样冠状病毒遗传接近的“L”型SARS-CoV-2毒株的“基因组型簇”进化和适应性选择。这些毒株与穿山甲或中东呼吸综合征相关的冠状病毒毒株有亲缘关系。关于新型共进化突变,目前在印度已发现2个群体,“主要群体”(66/95,69.4%)和“次要群体”(21/95,22.1%),分别存在4个和5个共存突变。“主要群体”突变落在A2a分支中。除11083G>T (L37F, NSP6基因)外,其余小群突变均为印度菌株所特有。gydF4y2Ba
这项研究强调了快速进化的SARS-CoV-2病毒以及多个分支和亚分支的共循环。这项全面的研究为监测病毒基因组中的新突变、解释病毒发病机制的变化以及设计疫苗或其他治疗方法提供了潜在的资源。gydF4y2Ba
2019年12月,由新型SARS-CoV-2引起的COVID-19大流行最初在中国武汉被报道,但在3个月内就蔓延到世界各地[gydF4y2Ba
2020年1月,喀拉拉邦报告了头3例有武汉旅行史的印度病例[gydF4y2Ba
通过这种基因组分析和系统发育方法,我们试图将重点放在SARS-CoV-2从人畜共患宿主中现有的祖先的自然进化上。此外,分析武汉毒株(分支O)在一段时间内积累在病毒基因组内的新突变将强调它们对病毒蛋白质结构和功能的影响。gydF4y2Ba
从GISAID数据库下载了2020年1月至6月印度提交的95条SARS-CoV-2核苷酸序列,用于系统发育分析和新突变筛选。从其他几个国家提交的GenBank数据库下载了SARS-CoV-2以及其他类型冠状病毒的其他几个参考基因序列,用于树状图构建和进一步的谱系分析。gydF4y2Ba
以2个结构基因(刺突和核衣壳)和7个非结构基因(非结构蛋白[NSP]2、NSP3、NSP4、NSP6、NSP7、NSP8和NSP12)为对象构建了9个系统发育谱系图。使用MUSCLE v3.8.31 (drive5)对所有相应的基因序列进行多序列比对。氨基酸序列通过TRANSEQ (EMBL-EBI)进行推导。系统进化树状图由分子进化遗传学分析X (MEGAX)构建,使用最大似然统计方法(1000次自举重复),并对每个树状图使用最佳拟合核苷酸替代模型。通过MEGAX的模型测试参数确定最佳拟合模型。将印度毒株与武汉SARS-CoV-2原型毒株(MN908947.3/SARS-CoV-2 Wuhan- hu -1)进行了不同的新型共存突变分析。gydF4y2Ba
我们使用Chou和Fasman二级结构预测(CFSSP)在线服务器预测带有新型A97V突变的RNA依赖RNA聚合酶(RdRP)/NSP12的二级结构[gydF4y2Ba
在印度研究的95株分离株中,93株在同一谱系内聚集在一起gydF4y2Ba
核衣壳(N)基因的系统发育树状图显示,在95个印度研究分离株中,92株聚集在同一谱系gydF4y2Ba
RdRP/NSP12基因的系统发育树状图显示,在95个印度研究分离株中,93株聚集在同一谱系内gydF4y2Ba
这6个基因的树状图显示出相似的模式。所有95株印度菌株均聚集在2个亚簇中(A=39株,B=56株)gydF4y2Ba
在8782 (NSP4基因)和28144(开放阅读框[ORF]8)位点的SNPs在所研究的印度分离株之间显示完全连锁。在这两个位点,有93株菌株表现为“CT”单倍型(编码ORF8蛋白第84位氨基酸亮氨酸的密码子位置t28144为“L”型),只有2株(来自喀拉拉邦的1株,EPI_ISL_413523和德里的1株,EPI_ISL_435111)表现为“TC”单倍型(编码ORF8蛋白第84位丝氨酸的密码子位置c28144为“S”型)。gydF4y2Ba
为探究95株SARS-CoV-2毒株之间的突变,我们参照SARS-CoV-2原型毒株(MN908947.3/SARS-CoV-2/HUMAN/CHN/ wuhan - hul -1/2019),从基因组水平和不同蛋白质的氨基酸水平,特别是S糖蛋白、N蛋白、NSP2、NSP3、NSP4、NSP6、NSP7、NSP8、RdRP/NSP12进行了深入的序列分析。在95份样本中,2份(2.1%)未发现显著的“L”型突变(EPI_ISL_435111和EPI_ISL_413523)。在93个“L”型样本中,6个(6.3%;EPI_ISL_481156、EPI_ISL_476840、EPI_ISL_476023、EPI_ISL_458080、EPI_ISL_431101和EPI_ISL_413522)均无突变,为野生型。对其余87株菌株的突变分析显示,在印度有两个主要的“群体”,即“主要群体”和“次要群体”。在95个分离株中,“主要组”包括66个(69.4%),揭示了4个共存的SNPs: 5 ' UTR中的241C>T, NSP3基因中的3037C>T (F106F), NSP12基因中的14408C>T (P323L)和S基因中的23403A>G (D614G) (gydF4y2Ba
2020年1月至6月印度各地SARS-CoV-2主要毒株(n=66)相关的单核苷酸多态性。gydF4y2Ba一个gydF4y2Ba
州和加入号gydF4y2Ba | 穗糖蛋白(21,563-25,384 nts/1273个氨基酸)gydF4y2Ba | RdRPgydF4y2BabgydF4y2Ba蛋白质(13442 - 16236 nts/932个氨基酸)gydF4y2Ba | 规划的gydF4y2BacgydF4y2Ba3蛋白(2720-8554 nts/1945个氨基酸)gydF4y2Ba | 5 ' utrgydF4y2BadgydF4y2Ba(1 - 265元)/非编码gydF4y2Ba | NgydF4y2BaegydF4y2Ba蛋白质(28274 - 29533 nts/419个氨基酸)gydF4y2Ba | NSP2蛋白(806-2719 nts/638个氨基酸)gydF4y2Ba | ||||||||||||||||||||||||||||
|
Q271RgydF4y2BafgydF4y2Ba | D614GgydF4y2BaggydF4y2Ba | G1124VgydF4y2BahgydF4y2Ba | D294DgydF4y2Ba我gydF4y2Ba | P323LgydF4y2BajgydF4y2Ba | F106FgydF4y2BakgydF4y2Ba | A994DgydF4y2BalgydF4y2Ba | K1249KgydF4y2Ba米gydF4y2Ba | 241 c > TgydF4y2Ba | S194LgydF4y2BangydF4y2Ba | RG203KRgydF4y2BaogydF4y2Ba | R41RgydF4y2BapgydF4y2Ba | T393IgydF4y2Ba问gydF4y2Ba | T85IgydF4y2BargydF4y2Ba | ||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 482498 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
ep_isl_ 435069 (n=5)gydF4y2Ba |
|
✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 435070, EPI_ISL_ 435071 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 435063, EPI_ISL_ 435064 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
✓gydF4y2Ba | |||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 458032, EPI_ISL_ 458033, EPI_ISL_ 458044, EPI_ISL_ 458040 (n=4)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
Epi_isl_ 479493, Epi_isl_ 479510, Epi_isl_ 479553, Epi_isl_ 479533, Epi_isl_ 479538, Epi_isl_ 479497, Epi_isl_ 479550, Epi_isl_ 479554, Epi_isl_ 479557, Epi_isl_ 479560, Epi_isl_ 479562, Epi_isl_ 479571, Epi_isl_ 479564 (n =13)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 430466, EPI_ISL_ 430467 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 430465 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 430468, EPI_ISL_ 430464 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 458107, EPI_ISL_ 483878, EPI_ISL_ 476869, EPI_ISL_ 469036, MT576031 (n=5)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 461484, EPI_ISL_ 476864 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 471637 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 475058 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 426414, EPI_ISL_ 426415 (n=2)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 481154, EPI_ISL_ 481157 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 481115, EPI_ISL_ 463078, EPI_ISL_ 481177, EPI_ISL_ 481180, EPI_ISL_ 481186 (n=5)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 476884, EPI_ISL_ 476842 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 458080, EPI_ISL_ 431101 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 431117 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 471588 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 471629 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 477207, EPI_ISL_ 477250 (n=2)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|||||||||||||||||||
|
EPI_ISL_ 477255, EPI_ISL_ 477237, 477239 (n=3)gydF4y2Ba |
|
✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
EPI_ISL_ 435060 (n=1)gydF4y2Ba |
|
✓gydF4y2Ba |
|
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
一个gydF4y2Ba与武汉-胡-1 (MN908947.3)进行基因突变分析。gydF4y2Ba
bgydF4y2BaRdRP: RNA依赖的RNA聚合酶。gydF4y2Ba
cgydF4y2BaNSP:非结构蛋白。gydF4y2Ba
dgydF4y2Ba5 ' UTR: 5 '未翻译区域。gydF4y2Ba
egydF4y2BaN:核衣壳。gydF4y2Ba
fgydF4y2Ba22374 > G。gydF4y2Ba
ggydF4y2Ba23403 > G。gydF4y2Ba
hgydF4y2Ba24933 g > T。gydF4y2Ba
我gydF4y2Ba22444 c > T。gydF4y2Ba
jgydF4y2Ba14408 c > T。gydF4y2Ba
kgydF4y2Ba3037 c > T。gydF4y2Ba
lgydF4y2Ba5700 c >。gydF4y2Ba
米gydF4y2Ba6466 G >。gydF4y2Ba
ngydF4y2Ba28854 c > T。gydF4y2Ba
ogydF4y2Ba28881 - 28883年GGG > AAC。gydF4y2Ba
pgydF4y2Ba28396 g > A。gydF4y2Ba
问gydF4y2Ba29451 c > T。gydF4y2Ba
rgydF4y2Ba1059 c > TgydF4y2Ba
2020年1月至6月,印度SARS-CoV-2小群菌株(n=21)的单核苷酸多态性。gydF4y2Ba一个gydF4y2Ba
州和加入号gydF4y2Ba | 穗糖蛋白(21,563-25,384 nts/1273个氨基酸)gydF4y2Ba | RdRPgydF4y2BabgydF4y2Ba蛋白质(13442 - 16236 nts/932个氨基酸)gydF4y2Ba | NgydF4y2BacgydF4y2Ba蛋白质(28274 - 29533 nts/419个氨基酸)gydF4y2Ba | 规划的gydF4y2BadgydF4y2Ba3蛋白(2720-8554 nts/1945个氨基酸)gydF4y2Ba | NSP6蛋白(10,973-11,842 nts/290个氨基酸)gydF4y2Ba | ||
|
Y789Y (23929 c > T)gydF4y2Ba | A97V (13730 c > T)gydF4y2Ba | P13L (28311 c > T)gydF4y2Ba | S1197R (6310 c >)gydF4y2Ba | T1198K (6312 c >)gydF4y2Ba | L37F (11083 g > T)gydF4y2Ba | |
|
|||||||
|
- EPI_ISL_435096, EPI_ISL_435084, EPI_ISL_435087 (n=6)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
EPI_ISL_435091, EPI_ISL_435092 (n=2)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_435077 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_463017 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
EPI_ISL_463010 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_476848 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_431103 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_486399, EPI_ISL_486394, EPI_ISL_486408, EPI_ISL_MT396248 (n=4)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_435100, EPI_ISL_435099, EPI_ISL_435082 (n=3)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
|
|||||||
|
EPI_ISL_435112 (n = 1)gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba |
一个gydF4y2Ba与武汉-胡-1 (MN908947.3)进行基因突变分析。gydF4y2Ba
bgydF4y2BaRdRP: RNA依赖的RNA聚合酶。gydF4y2Ba
cgydF4y2BaN:核衣壳。gydF4y2Ba
dgydF4y2BaNSP:非结构蛋白。gydF4y2Ba
“主组”S基因除23403A>G (D614G)外,还发现23374A>G (Q271R)、24933G>T (G1124V)、22444C>T (D294D) 3个不常见突变(gydF4y2Ba
RdRP是病毒RNA复制和维持基因组保真度的关键酶。因此,RdRP结构的任何显著变化都可能影响其功能,导致基因组突变率的增加。我们在RdRP蛋白中发现了2个错义突变:P323L与“主组”分离株相关,A97V与“小组”分离株相关。P323L对RdRP二级结构的影响已被描述[gydF4y2Ba
多个科学小组基于全基因组测序研究了全球SARS-CoV-2大流行毒株的分子和遗传特征[gydF4y2Ba
SARS-CoV-2的起源仍未确定,但迫切需要鉴定其中间宿主,以防止在不久的将来进一步传播和种间传播。因此,我们启动了这项研究,作为印度首次破译在该地方病环境中流行的SARS-CoV-2菌株的基因系统发育的研究之一。结果描述了95个印度分离株的基因组型簇,包括结构基因S和N以及非结构基因RdRP/NSP12。通过对不同分支特异性菌株的聚类研究,建立了基因组型聚类的发展。尽管每个基因都存在DNA同源性变异,但据推测,这些来自蝙蝠和马来亚穿山甲衍生的SARS-CoV-2株最近发生了分叉,随后通过所有9个树状图描述了人畜共患传播给人类。此外,SARS-CoV-2菌株与MERS-CoV和其他人类冠状病毒距离较远。这一结论与其他将蝙蝠和穿山甲确定为SARS-CoV-2近源的系统发育研究一致[gydF4y2Ba
我们的研究强调,印度研究分离株的S基因与一些蝙蝠源性毒株(如bat- sl - covzc45和bat- sl - covzxc21)的序列相似性较低,而与蝙蝠sars样冠状病毒(SARSr-CoV/RaTG13)的同源性最高。这一观察结果与一份报告一致,该报告显示,在中国流行的SARS-CoV-2毒株的S基因与蝙蝠毒株(如SL-CoVZC45和SL-CoVZXC21)的序列同源性最低(近70%),而与蝙蝠sars相关冠状病毒(SARSr-CoV/RaTG13)的同源性为96.2%。所有印度SARS-CoV-2和穿山甲衍生菌株S基因S1亚基内的rna结合域在进化上是保守的,在系统发育上比蝙蝠RaTG13更接近,强调了两者之间熟悉的发病模式。印度SARS-CoV-2分离物也具有一个多碱基切割位点(RRAR;根据Andersen等人的报道,在S蛋白S1和S2亚基交界处的氨基酸位置682-685)[gydF4y2Ba
卷积突变分析还发现印度两组SARS-CoV-2突变株共循环。SARS-CoV-2毒株的“主要类群”(66/ 95,69.4%)代表了先前在非洲、南美洲、大洋洲、南亚和西亚报道的A2a分支,包括具有共同进化突变的菌株,如241 C>T (5 ' UTR)、3037 C>T (F106F, NSP3)、14403 C>T (P323L, RdRP/NSP12)和23403 A>G (D614G, S糖蛋白)[gydF4y2Ba
印度SARS-CoV-2“小群”(21/ 95,22.1%)由5种共进化突变株组成:13730C>T (A97V, RdRP/NSP12)、23929C>T (Y789Y, S)、28311C>T (P13L, N)、6312C>A (T1198K, NSP3)和11083G>T (L37F, NSP6)。除了11083G>T (L37F, NSP6)之前被报道为来自澳大利亚、日本、荷兰和其他一些欧洲国家的罕见突变外,所有“小群”突变在印度分离株中都是新的[gydF4y2Ba
RdRP/NSP12蛋白的任何显著突变都可能改变复制机制,从而损害病毒RNA复制的保真度和随后可能的新突变的积累。RdRP中的错义突变14408C>T (P323L)于2020年2月在意大利(伦巴第)首次被观察到。自2020年2月以来,来自欧洲和北美的少数菌株显示,在RdRP基因内含有14408C>T (P323L)突变的SARS-CoV-2基因组中出现了3037C>T (F106F, NSP3)、23403A>G (D614G)和28881-28883GGG>AAC (R203K和G204R, N)等突变,这表明与来自亚洲的病毒基因组相比,14408C>T (P323L)可能存在关联或共存,并出现了更多的新点突变[gydF4y2Ba
在国家生物技术信息中心和GISAID等公开服务器上免费提供基因组序列,使基因组研究发生了革命性变化,从而实现了对突变、重组事件的持续监测、分子诊断技术的发展、疫苗毒株的鉴定等。持续的致命大流行需要记录完整的患者元数据以及SARS-CoV-2毒株的全基因组序列,以便更好地了解这种病毒的流行病学和毒性。开发新的技术,除了完整的病毒基因组序列外,还可以帮助记录其他信息,如特定疾病特征(共病、呼吸评分、基本血液参数)、治疗、住院或门诊治疗的要求、治疗结果、危及生命的并发症或死亡率。这也有助于就治疗方式作出基于地理区域的决定,以及在疫苗配方中纳入高毒力亚型毒株。gydF4y2Ba
印度人口密度高,贫困线以下人口众多,医疗设施负担过重,因此新冠肺炎社区传播的风险更大。因此,严格监测和监测病毒流行病学和新病毒的遗传多样性可以为更好的卫生保健策略和疫苗设计铺平道路。这项研究全面分析了在印度不同地区流行的SARS-CoV-2毒株的祖先、进化动态、分支特异性遗传变异,以及独特的共进化突变的发展。由于缺乏患者元数据,无法确定新突变对临床结果的影响或印度两组不同的流行菌株的毒力差异。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株S基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为gamma分布具有不变位点的一般时间可逆模型(GTR+G+I)。斯派克。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株N基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为gamma分布具有不变位点的一般时间可逆模型(GTR+G+I)。N:核衣壳。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株RdRP/NSP12基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为gamma分布的一般时间可逆模型(GTR+G)。NSP12:非结构蛋白12;RdRP: RNA依赖的RNA聚合酶。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP2基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为gamma分布的一般时间可逆模型(GTR+G)。NSP2:非结构蛋白2。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP3基因核苷酸序列与其他已知的各自基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为一般时间可逆模型(GTR)。NSP3:非结构蛋白3。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP4基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。构建系统发育树状图的最佳拟合模型为具有不变位点的一般时间可逆模型(GTR+I)。NSP4:非结构蛋白4。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP6基因核苷酸序列与其他已知的各自基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。用于构建系统发育树状图的最佳拟合模型为具有不变位点的Tamura-3模型(T92+I)。NSP6:非结构蛋白6。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP7基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。构建系统发育树状图的最佳拟合模型为gamma分布的Tamura-3模型(T92+G)。NSP7:非结构蛋白8。gydF4y2Ba
最大似然法分子系统发育分析。基于2020年初在印度流行的SARS-CoV-2毒株NSP8基因核苷酸序列与其他已知基因型毒株的系统发育树状图。有代表性的印度品系已用实心圈标出。比例尺设为每个位点0.1个核苷酸取代。引导值小于70%时不显示。建立系统发育树状图的最佳拟合模型为gamma分布具有不变位点的一般时间可逆模型(GTR+G+I)。NSP8:非结构蛋白8。gydF4y2Ba
A97V突变对RdRP/NSP12蛋白二级结构的影响(A) SARS-CoV-2武汉分离物97a(丙氨酸)残基附近RdRP的二级结构。(B)印度分离物第97 V(缬氨酸)残基附近RdRP的二级结构。NSP12:非结构蛋白12;RdRP: RNA依赖的RNA聚合酶。gydF4y2Ba
Chou和Fasman二级结构预测gydF4y2Ba
共享所有流感数据全球倡议gydF4y2Ba
分子进化遗传学分析,第十版gydF4y2Ba
中东呼吸综合征相关冠状病毒gydF4y2Ba
核衣壳gydF4y2Ba
非结构蛋白gydF4y2Ba
开式阅读架gydF4y2Ba
依赖RNA的RNA聚合酶gydF4y2Ba
斯派克gydF4y2Ba
严重急性呼吸系统综合症gydF4y2Ba
单核苷酸多态性gydF4y2Ba
五撇非平移区域gydF4y2Ba
这项研究得到了印度新德里印度医学研究委员会的校内拨款支持。作者对科学家和实验室工作人员在COVID-19检测和下一代基因组测序实验室的辛勤工作和奉献精神表示感谢。gydF4y2Ba
RS和ML分别得到了印度大学教育资助委员会和科学与工业研究理事会的奖学金支持。gydF4y2Ba
没有宣布。gydF4y2Ba