这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用首次发表在JMIR生物信息学和生物技术上的原创作品。必须包括完整的书目信息,https://bioinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
近期新冠肺炎疫情在全球引发了严重的公共卫生危机。COVID-19的病原是新型冠状病毒SARS-CoV-2。在开发针对这种紧急病毒性疾病的有效疫苗方面进行更多的研究确实是当前的需要。
这项研究的目的是确定有效的候选疫苗,为抗击COVID-19提供一个新的里程碑。
我们使用反疫苗学方法探索了在印度突出的SARS-CoV-2菌株的基因组。预测抗原表位,通过分子对接和模拟验证候选抗原肽与宿主蛋白相应氨基酸残基的分子相互作用。
从SARS-CoV-2表面糖蛋白中提取的一种有前景的抗原肽GVYFASTEK(蛋白加入号QIA98583.1)被预测能与human major histocompatibility complex (MHC) class human leukocyte antigen (HLA) A*11-01等位基因相互作用,保持率高达90%,具有较高的抗原性价值。经过大量分析,预测该肽是一个合适的表位,能够诱导针对SARS-CoV-2的强烈细胞介导免疫反应。
这些结果可能有助于在不久的将来为疫苗生产管道选择SARS-CoV-2表位。这项新研究必将为建立一个快速、可靠、有效的平台铺平道路,及时提供应对这种导致COVID-19大流行的危险病毒的对策。
COVID-19始于2019年12月,当时中国武汉市爆发了一种新型病毒[
由于COVID-19几乎影响了全世界的人口,将混杂的表位与各种人类白细胞抗原(HLA)等位基因结合对于更广泛的传播至关重要。为此,在硅片方法将非常有用,有助于尽快开发治疗方法[
在反向疫苗学中,通过研究病原体的遗传组成和可能导致识别良好表位的基因,各种硅生物工具被用来发现新的抗原。因此,反向疫苗方法提供了一个快速和具有成本效益的疫苗发现平台[
在此,我们探索了印度地理区域突出的SARS-CoV-2株对抗人类宿主的蛋白质组,以确定能够有效引发对抗病毒的细胞介导免疫应答的潜在抗原蛋白和表位。通过这种方法,我们从SARS-CoV-2的表面糖蛋白(蛋白连接号QIA98583.1)中鉴定出一种很有前景的抗原肽GVYFASTEK,预计它能与人类主要组织相容性复合体(MHC)等位基因相互作用,并显示出高达90%的保持性和显著的抗原性。分子对接分析进一步证实了主要抗原肽与MHC i类HLA-A*11-01等位基因残基的分子相互作用
方法的图解表示。MHC:主要组织相容性复合体。
选择SARS-CoV-2高毒株进行硅内分析。SARS-CoV-2的完整基因组可在国家生物技术信息中心数据库中获得,参考文献NC_045512.2。
以下12条SARS-CoV-2病毒蛋白序列从ViPR数据库中检索(宿主:人类,国家:印度)[
ExPASy在线工具ProtParam [
VaxiJen v2.0 [
通过免疫表位数据库(Immune Epitope Database, IEDB)预测所选表面糖蛋白序列的B细胞和T细胞表位,IEDB数据库包含大量表位和抗体的实验数据[
利用VaxiJen v2.0预测蛋白抗原性。在抗原性分析中,阈值维持在0.4 [
使用TMHMM v2.0服务器预测所选表位的跨膜螺旋[
表位守恒分析通过IEDB服务器的表位守恒分析工具进行[
采用MHCcluster 2.0进行聚类分析[
PEP-FOLD3在线工具[
进行分子对接,描述抑制剂与相应蛋白的结合模式。预对接由UCSF Chimera进行[
确定了SARS-CoV-2毒株,并从ViPR数据库中检索了针对印度人类宿主的12个病毒蛋白序列,并选择用于可能的候选疫苗鉴定(
SARS-CoV-2(宿主:人类,国家:印度)病毒蛋白序列鉴定和通过ViPR数据库检索。
基因符号 | 蛋白质的名字 | GenBank核苷酸接入 | GenBank蛋白接入 |
orf10 | Orf10蛋白质 | MT050493 | QIA98591.1 |
orf8 | Orf8蛋白质 | MT050493 | QIA98589.1 |
orf7a | Orf7a蛋白质 | MT050493 | QIA98588.1 |
orf6 | Orf6蛋白质 | MT050493 | QIA98587.1 |
orf3a | Orf3a蛋白质 | MT050493 | QIA98584.1 |
米 | 膜糖蛋白 | MT050493 | QIA98586.1 |
E | 包膜蛋白 | MT050493 | QIA98585.1 |
年代 | 表面糖蛋白 | MT050493 | QIA98583.1 |
年代 | 表面糖蛋白 | MT012098 | QHS34546.1 |
N | 核衣壳蛋白 | MT163715 | QII87776.1 |
N | 核衣壳蛋白 | MT163714 | QII87775.1 |
N | 核衣壳磷蛋白质 | MT050493 | QIA98590.1 |
分析了12种蛋白质的理化性质,包括氨基酸、分子量、理论等电点(pI)、消光系数(M-1厘米-1)、估计的半衰期(在哺乳动物细胞中)、不稳定性指数、脂肪指数和亲水性总平均(GRAVY)进行预测(
SARS-CoV-2病毒蛋白的理化性质。
基因符号 | 氨基酸 | 分子量 | 理论π一个 | 消光系数(M-1厘米-1) | 哺乳动物细胞的半衰期(小时) | 不稳定指数 | 脂肪指数 | 肉汁b |
orf10 | 38 | 4449.23 | 7.93 | 4470 | 30. | 16.06(稳定) | 107.63 | 0.637 |
orf8 | 121 | 13804 .93点 | 5.42 | 16305年 | 30. | 46.24(不稳定) | 94.13 | 0.181 |
orf7a | 121 | 13744 .17 | 8.23 | 7825 | 30. | 48.66(不稳定) | 100.74 | 0.318 |
orf6 | 61 | 7272.54 | 4.60 | 8480 | 30. | 31.16(稳定) | 130.98 | 0.233 |
orf3a | 275 | 31122 .94 | 5.55 | 58705年 | 30. | 32.96(稳定) | 103.42 | 0.275 |
米 | 222 | 25146 .62 | 9.51 | 52160年 | 30. | 39.14(稳定) | 120.86 | 0.446 |
E | 75 | 8365.04 | 8.57 | 6085 | 30. | 38.68(稳定) | 144.00 | 1.128 |
年代 | 1273 | 141206点 | 6.24 | 148960年 | 30. | 33.01(稳定) | 84.82 | -0.077 |
年代 | 1272 | 140972年10 | 6.16 | 147470年 | 30. | 32.78(稳定) | 85.05 | -0.071 |
N | 88 | 9827.08 | 10.23 | 8480 | 4.4 | 36.54(稳定) | 61.14 | -1.067 |
N | 133 | 14363 .88点 | 11.37 | 8480 | 1 | 58.97(不稳定) | 44.21 | -1.170 |
N | 419 | 45625 .70 | 10.07 | 43890年 | 30. | 55.09(不稳定) | 52.53 | -0.971 |
一个pI:等电点。
b肉汁:总的平均亲水性。
SARS-CoV-2病毒蛋白的抗原性预测(阈值:0.4)。
蛋白质的名字 | 抗原性的分数 | 抗原性 |
Orf10蛋白质 | 0.7185 | 抗原 |
Orf8蛋白质 | 0.6063 | 抗原 |
Orf7a蛋白质 | 0.6441 | 抗原 |
Orf6蛋白质 | 0.6131 | 抗原 |
Orf3a蛋白质 | 0.4945 | 抗原 |
膜糖蛋白 | 0.5102 | 抗原 |
包膜蛋白 | 0.6025 | 抗原 |
表面糖蛋白 | 0.4654 | 抗原 |
表面糖蛋白 | 0.4687 | 抗原 |
核衣壳蛋白 | 0.5767 | 抗原 |
核衣壳蛋白 | 0.6235 | 抗原 |
核衣壳磷蛋白质 | 0.5059 | 抗原 |
采用IEDB服务器的NetMHCpan EL 4.0预测方法确定MHC I类T细胞表位,序列长度设置为9。根据抗原性评分和百分位评分进一步分析服务器生成的表位,随机选择前10位的潜在表位进行抗原性、致敏性、毒性和保护性测试。服务器将预测的表位按百分比分数升序排列(
SARS-CoV-2表面糖蛋白主要组织相容性复合体I类表位(QIA98583.1)。
抗原决定基 | 开始 | 结束 | 拓扑结构 | 抗原性 | 抗原性的分数 | 变应原性 | 毒性 | 最小身份(%) | 保护(%) |
GVYFASTEK | 19 | 27 | 内部 | 是的 | 0.7112 | Nonallergen | 无毒 | 11.11 | One hundred. |
VTYVPAQEK | 15 | 23 | 内部 | 是的 | 0.8132 | 过敏原 | 无毒 | 22.22 | One hundred. |
ASANLAATK | 40 | 48 | 内部 | 是的 | 0.7041 | 过敏原 | 无毒 | 22.22 | One hundred. |
TLADAGFIK | 57 | 65 | 内部 | 是的 | 0.5781 | Nonallergen | 无毒 | 22.22 | One hundred. |
TLKSFTVEK | 22 | 30. | 内部 | 没有 | 0.0809 | 过敏原 | 无毒 | 11.11 | One hundred. |
NSASFSTFK | 20. | 28 | 内部 | 没有 | 0.1232 | 过敏原 | 无毒 | 11.11 | One hundred. |
TEILPVSMTK | 24 | 33 | 内部 | 是的 | 1.4160 | 过敏原 | 无毒 | 10.00 | One hundred. |
SSTASALGK | 29 | 37 | 外 | 是的 | 0.6215 | 过敏原 | 无毒 | 22.22 | One hundred. |
GTHWFVTQR | 49 | 57 | 内部 | 没有 | 0.0723 | 过敏原 | 无毒 | 11.11 | One hundred. |
EILPVSMTK | 25 | 33 | 内部 | 是的 | 1.6842 | 过敏原 | 无毒 | 11.11 | One hundred. |
SARS-CoV-2表面糖蛋白的主要组织相容性II类表位(QIA98583.1)。
抗原决定基 | 开始 | 结束 | 拓扑结构 | 抗原性 | 抗原性的分数 | 变应原性 | 毒性 | 最低 |
保护(%) |
SNFRVQPTESI | 36 | 46 | 内部 | 是的 | 0.9897 | 过敏原 | 无毒 | 11.11 | One hundred. |
NFRVQPTESIV | 37 | 47 | 内部 | 是的 | 1.0669 | Nonallergen | 无毒 | 22.22 | One hundred. |
FRVQPTESIVR | 38 | 48 | 内部 | 没有 | 0.3493 | 过敏原 | 无毒 | 9.09 | One hundred. |
VYYHKNNKSWM | 3. | 13 | 内部 | 没有 | 0.3726 | 过敏原 | 无毒 | 18.18 | One hundred. |
LGVYYHKNNKS | 1 | 11 | 内部 | 是的 | 0.8696 | 过敏原 | 无毒 | 9.09 | One hundred. |
GVYYHKNNKSW | 2 | 12 | 内部 | 是的 | 0.6685 | 过敏原 | 无毒 | 9.09 | One hundred. |
LLIVNNATNVV | 47 | 57 | 内部 | 是的 | 0.4166 | Nonallergen | 无毒 | 9.09 | One hundred. |
LIVNNATNVVI | 48 | 58 | 内部 | 没有 | 0.2045 | Nonallergen | 无毒 | 9.09 | One hundred. |
IVNNATNVVIK | 49 | 59 | 内部 | 没有 | 0.2274 | 过敏原 | 无毒 | 9.09 | One hundred. |
VFVSNGTHWFV | 44 | 54 | 外 | 没有 | 0.0957 | 过敏原 | 无毒 | 18.18 | One hundred. |
SARS-CoV-2表面糖蛋白的B细胞表位预测(QIA98583.1)。
所选表位的拓扑由TMHMM v2.0服务器确定。
SARS-CoV-2表面糖蛋白B细胞表位(QIA98583.1)。
抗原决定基 | 拓扑结构 | 抗原性 | 变应原性 |
RTQLPPAYTNS | 内部 | 抗原 | 过敏原 |
SGTNGTKRFDN | 内部 | 抗原 | 过敏原 |
LTPGDSSSGWTAG | 外 | 抗原 | Nonallergen |
VRQIAPGQTGKIAD | 内部 | 抗原 | Nonallergen |
YQAGSTPCNGV | 内部 | Nonantigen | Nonallergen |
QIAPGQTGKIAD | 内部 | 抗原 | Nonallergen |
YGFQPTNGVGYQ | 外 | 抗原 | 过敏原 |
RDIADTTDAVRDPQ | 内部 | 抗原 | 过敏原 |
QTQTNSPRRARSV | 内部 | Nonantigen | Nonallergen |
ILPDPSKPSKRS | 外 | 抗原 | Nonallergen |
所选T细胞表位具有高抗原性、非致敏性、无毒性,保护率大于90%。在10个选择的MHC I类表位和10个选择的MHC II类表位中,根据上述标准共选择了4个表位:GVYFASTEK、TLADAGFIK、NFRVQPTESI和LLIVNNATNV。
可能与预测表位相互作用的MHC I类等位基因的聚类分析是通过在线工具MHCcluster 2.0进行的,该工具生成了等位基因的系统进化集群。结果显示在
主要组织相容性复合体(MHC)类聚类分析。(A)热图。(B)特异性树。红色区域表示强相互作用,黄色区域对应较弱相互作用。
使用PEP-FOLD3服务器对所有T细胞表位进行三维结构预测,用于肽蛋白对接(
通过PEP-FOLD3服务器生成t细胞表位的三维结构。表位表示:(A) GVYFASTEK, (B) TLADAGFIK, (C) NFRVQPTESI, (D) LLIVNNATNV。
进行分子对接,以确定所有鉴定的表位是否都能与MHC I类和MHC II类分子结合。所选表位与HLA-A*11-01等位基因(PDB ID 5WJL)和HLA-DRB1*04-01等位基因(PDB ID 5JLZ)对接。对接使用PatchDock在线对接工具完成,并由FireDock在线服务器进行细化。HPEPDOCK服务器还对结果进行了分析(见中图S1)
(A)通过LigPlot进行对接位分析(GVYFASTEK表位对接HLA-A*11-01等位基因[PDB ID: 5WJL])。分子对接结果显示蛋白质与配体相互作用。氧(O)、氮(N)和碳(C)原子分别用红色、蓝色和黑色圆圈表示。(B)分子对接分析显示,我们研究中配体(GVYFASTEK表位)的对接位点与HLA-A*11-01等位基因(PDB ID: 5WJL)晶体结构中使用的配体相似。
GVYFASTEK表位与HLA-A*11-01等位基因(PDB ID 5WJL)的对接复合物的分子动力学模拟成功执行了50 ns。在整个模拟过程中,配合物趋于稳定,RMSD从初始位置波动0.3 ~ 1.0 nm (
分子动力学模拟。(A)码头复合体(GVYFASTEK表位与HLA-A*11-01等位基因对接[PDB ID: 5WJL])的均方根偏差(RMSD)和均方根波动(RMSF)图。
疫苗是一种非常必要和广泛形成的治疗产品。每年有数百万婴儿、儿童和成人接种疫苗。然而,疫苗的开发和研究过程是昂贵的,有时需要无数个月的时间来准备和推进一种合适的候选疫苗,以消除病原体。目前有无数的免疫信息学、计算机辅助药物设计、生物信息学和正/反疫苗学等工具和方法,广泛推进疫苗的设计和制备,从而有助于缩短疫苗扩展的持续时间和成本投资[
本研究通过理化分析发现,SARS-CoV-2表面糖蛋白QIA98583.1的消光系数最高,为148,960 M-1厘米-1在所鉴定的病毒蛋白中,GRAVY值最低,为-0.077。此外,所选表面糖蛋白具有较高的稳定性(不稳定性指数<40)和抗原性。蛋白的抗原性由VaxiJen V2.0服务器检测。如果一种化合物的可变性指数大于40,就意味着该产物被认为是不平衡的[
两种主要的免疫细胞是B淋巴细胞和T淋巴细胞,它们在人体中起着防御作用。一旦被抗原提呈细胞(APC;例如,树突状细胞和巨噬细胞),抗原可被存在于apc表面的MHC II类分子接触到辅助T细胞。随后,辅助T细胞在其表面获得CD4+片段,称为CD4+ T细胞。一旦被APC刺激,辅助T细胞随后刺激B细胞,产生产生抗体的浆B细胞和记忆B细胞。血浆B细胞收集多种抗体,记忆B细胞在长期免疫记忆中发挥作用。此外,巨噬细胞和CD8+细胞毒性T细胞也被辅助性T细胞触发,最终消灭靶抗原[
所选SARS-CoV-2病毒蛋白可能的B细胞和T细胞表位由IEDB服务器识别[
此外,对MHC I类和II类等位基因进行类似的聚类分析,以对它们之间的关联进行分类,并根据它们的功能和预测的特异性对它们进行分组[
面对COVID-19大流行造成的痛苦、死亡和社会困境的巨大悲剧,开发有效和安全的疫苗至关重要。生物信息学、反疫苗学和相关技术被广泛应用于疫苗设计和开发,因为这些技术可以减少成本和时间。在这项研究中,我们首先从印度的菌株中鉴定出属于SARS-CoV-2对抗人类宿主的蛋白质。然后通过稳健的过程确定了能够有效引发与这些选定蛋白质相关的细胞介导免疫反应的潜在B细胞和T细胞表位。潜在的T细胞表位(GVYFASTEK)和B细胞表位(LTPGDSSSGWTAG, VRQIAPGQTGKIAD, QIAPGQTGKIAD和ILPDPSKPSKRS)可以在新的亚单位和多表位疫苗的开发中发挥重要作用。总之,反向疫苗学被证实是一种识别新型候选疫苗及其后续应用的可靠手段。这项研究可以激励进一步研究,朝着创新和高效的方向发展,为寻找由SARS-CoV-2引起的COVID-19的有效及时治疗提供快速、可靠和重要的平台。
FASTA格式SARS-CoV-2蛋白序列和HPEPDOCK服务器对接结果(图S1)。
抗原呈递细胞
亲水性的大平均
人白细胞抗原
免疫表位数据库
主要组织相容性复合体
蛋白质数据库
等电点
均方根偏差
均方根波动
世界卫生组织
RM感谢印度新德里生物技术系Ramalingaswami奖学金的财政支持和奖励。RN和EG感谢阿米提生物技术研究所,阿米提大学拉贾斯坦,斋浦尔,和博士B.拉尔生物技术研究所。
EG:研究方案、数据管理、软件、分析验证、初稿撰写;RKM:撰写、审核、编辑初稿;RRKN:概念化、协议设计、监督、审查、编辑和最终确定原始草案。
没有宣布。