您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2024
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

SARS-Cov-2潜在T细胞表位的生物信息学预测

 二维码
发表时间:2020-06-28 15:02作者:武汉新启迪生物Xinqidibio来源:www.qidibio.com

SARS-Cov-2潜在T细胞表位的生物信息学预测

为了控制和预防当前的COVID-19大流行,新型疫苗的开发是一个紧急的问题。此外,我们需要开发可以测量/监视T细胞和B细胞反应的工具,以了解我们的免疫系统如何响应这种有害病毒。但是,目前尚缺乏有关新型冠状病毒(SARS-CoV-2)诱导宿主免疫应答的免疫靶表位的信息。通过对SARS-CoV-2序列衍生的潜在表位进行全面的生物信息学筛选,确定日本人群中常见的HLA,我们确定了2013和1399种可能具有高亲和力的肽表位(<0.5%-和2% -HLA I类和II类分子,分别诱导CD8 +和CD4 +T细胞反应。这些表位分布在结构蛋白(穗蛋白,包膜蛋白,膜蛋白和核衣壳蛋白)和非结构蛋白(对应于六个开放阅读框的蛋白)中;但是,我们发现了几个高亲和力表位显着富集的区域。通过将这些预测的T细胞表位与其他冠状病毒的序列进行比较,我们确定了与SARS-CoV具有高度同源性的781个HLA I类和418个HLA II类表位。为了进一步选择适用于较大人群的通用表位,我们根据HLA分子的等位基因频率计算了人群覆盖率,并发现了2个HLA I类表位,覆盖了日本人口的83.8%。

介绍

2019年12月,在中国湖北省武汉市发现了几例病因不明的严重肺炎病例。此后不久,一种新型的β-冠状病毒SARS-CoV-2被鉴定为引起严重急性呼吸道疾病的病原微生物。世界卫生组织(WHO)宣布2019年的冠状病毒病(COVID-19)爆发是国际关注的突发公共卫生事件,并于1月30日提出了一系列临时建议。当前的COVID-19爆发已接近根据世界卫生组织的数据,截至2020年4月27日,全球已确诊的病例有300万,死亡人数超过200,000。据报道,SARS-CoV-2的基因组序列由〜30,000个核苷酸组成,与甜菜冠状病毒具有高度序列相似性包括严重急性呼吸综合征冠状病毒(SARS-CoV的; 79%)和中东呼吸综合征冠状病毒(MERS-CoV的50%)[ 123 ]。与其他冠状病毒一样,SARS-CoV-2基因组也编码多种结构和非结构蛋白。结构蛋白包括刺突蛋白(S),包膜蛋白(E),膜糖蛋白(M),核衣壳磷蛋白(N),非结构蛋白包括开放阅读框1ab(ORF1ab),ORF3a,ORF6,ORF7a,ORF8和ORF10。先前的研究已经表明,SARS-CoV的-2具有推定的类似单元进入机构和人细胞受体使用[ 45 ]。

目前正在进行许多研究,以开发有效的干预措施来控制和预防COVID-19大流行,包括治疗药物,例如RNA依赖性RNA聚合酶或病毒蛋白酶的抑制剂,病毒细胞膜融合阻滞剂以及疫苗,和大规模的临床试验才刚刚开始[ 67 ]。对于针对SARS-CoV-2的疫苗设计和候选疫苗的免疫原性评估,重要的是预测SARS-CoV-2的表位并检测其对SARS-CoV-2的免疫反应。但是,目前很少有关于SARS-CoV-2序列的哪些部分对我们的免疫反应重要的信息。

因此,在本研究中,我们使用生物信息学工具从SARS-CoV-2序列中全面筛选了潜在的T细胞表位,并评估了这些表位在不同冠状病毒物种(包括SARS-CoV和MERS-CoV)中的保守性。

方法

冠状病毒序列

SARS冠状病毒-2(登录号MN908947和MN996527-MN996531)的全长病毒的核苷酸序列12 ],SARS冠状病毒(登录号AY274119,AY278488和AY390556),蝙蝠衍生SARS样冠状病毒(BAT- SL-CoV)RaTG13(登录号MN996532)和MERS-CoV(登录号JX869059)从NCBI GenBank下载。

冠状病毒序列比较

使用Genetyx软件(版本8.0.0)进行下载序列的比对。使用SimPlot软件(3.5.1版)[ 8 ] 可视化序列之间的相似性,并从武汉-Hu-1(MN908947)分离出的SARS-CoV-2共有序列作为查询。

SARS-CoV-2的T细胞表位预测

使用参考SARS-CoV-2_Wuhan-Hu-1(登录号MN908947)的S,E,N,M和ORFs(对应于登录号QHD43415-QHD43423,QHI42199)的预测蛋白质进行表位预测。为了预测HLA I类表位,我们分别选择了人类白细胞抗原A(HLA-A)HLA-BHLA-C等位基因的7、10、8,据报道它们以超过5%的频率存在在日本人口中(补充表   1)[ 9 ]。对于HLA II类表位的预测,我们分别选择了HLA-DPA1-DPB1HLA-DQA1-DQB1的 5和6个单倍型,以及HLA-DRB1的 7个等位基因了在日本人群体(补充表经常观察到   1)[ 910 ]。

至HLA I类分子的结合亲和力,计算用于使用NetMHCv4.0和NetMHCpanv4.0软件[SARS-CoV的-2蛋白所有9-和10-聚体肽1112 ]。我们根据预测得分选择排名最高的0.5%的表位作为强结合表位。使用NetMHCIIpanv3.1软件计算了SARS-CoV-2蛋白中所有15-mer肽对HLA II类分子的结合亲和力[ 13 ]。我们根据预测得分将排名最高的2%抗原决定簇的阈值用作强结合物。

变异分析

为了鉴定SARS-CoV-2的突变,我们在不同区域使用了总共6421个SARS-CoV-2序列,包括来自亚洲的587个序列,来自北美的1918个,来自欧洲的3190个以及来自大洋洲地区的726个序列。存于2020年4月18日的全球禽流感数据共享倡议中。我们首先使用BLAT软件将这些SARS-CoV-2序列与参考序列SARS-CoV-2_Wuhan-Hu-1(登录号MN908947)比对[ 14 ]。比对后,我们提取对应于SARS-CoV-2单个蛋白的核苷酸序列,将其翻译为氨基酸序列,然后将其与SARS-CoV-2_Wuhan-Hu-1的参考氨基酸序列进行比较(登录号QHD43415- QHD43423,QHI42199)。

统计分析

Fisher精确检验用于分析表位的富集和分离自不同地区的SARS-CoV-2突变率的差异。使用R统计环境3.6.1版进行统计分析。

结果

我们首先使用netMHC4筛选了可能在某些HLA I类分子,HLA-A,B和C分子上呈现的潜在表位,这些分子在日本人群中普遍观察到(频率超过5%)[ 9 ]。 0.0和netMHCpan4.0算法[ 1112 ]。我们选择了来自SARS-CoV-2蛋白序列的前0.5%排名(高亲和力)肽,并获得了2013年总共的独特预测表位(图   1,表   1和补充表   2)。预测的表位富含M蛋白(P  = 0.00062,优势比= 1.64),而富含N蛋白(P = 0.0074,优势比= 0.69)。然后,我们对HLA II类候选肽表位进行了筛选,这些表位对HLA-DPA1,DPB1,DQA1,DQB1和DRB1具有高度亲和力,而HLA-DPA1,DPB1,DQA1,DQB1和DRB1在日本人群中很常见(频率超过5%)[ 910 ],使用netMHCIIpan3.1算法[ 13 ]。选择排名靠前的2%肽后,我们总共发现了1399种可能的HLA II类表位(图   1,表   1和补充表   3)。预测的HLA II类表位富含M蛋白(P  = 0.000051,比值比= 1.92),ORF3a(P  = 0.0000016,比值比= 2.00)和ORF6(P = 0.000000039,比值比= 4.22),而N蛋白富集程度较低(P  = 0.00031,比值比= 0.53)。

图。1
图1

SARS-CoV-2衍生的T细胞表位的摘要。一个 I和II SARS-CoV的-2- dreived HLA-类表位的分布与来自SARS-CoV的-2蛋白序列(SARS-CoV的-2_Wuhan-HU-1)[导出的高结合亲和力1 ]。红色条代表对于每个HLA分子分别具有<0.5%等级和2%等级的与HLA I类和II类的强结合亲和力表位。b SARS-CoV-2的基因组组织。ORF,开放阅读框,S尖峰,E包膜,M膜,N核衣壳蛋白。c基于SARS-CoV-2的全长基因组序列的相似性图。比较SARS-CoV-2_WIV02(登录号MN996527),SARS-CoV_GZ02(AY390556)和Bat-CoV_RaTG13(MN996532)的基因组序列与SARS-CoV-2_Wuhan-Hu-1(MN908947)

表1对HLA分子具有高度亲和力的SARS-CoV-2衍生T细胞表位

由于据报道,SARS-CoV的-2具有约79%和50%的核苷酸序列同源性SARS-CoV的和MERS-CoV的,分别[ 123 ],我们比较预测的SARS-CoV的-2表位的同源性序列至3个SARS-CoV(BJ01,GZ02和Tor2)和MERS-CoV,以评估其交叉反应性(表   2和补充表   23))。在所有三个SARS-CoV序列中,有781个(38.8%)2013 HLA I类抗原决定簇是保守的。其中633(81.0%)位于ORF1ab中,58(7.4%),15(1.9%),28(3.6%)和33(4.2%)肽位于S,E,M和N蛋白质。HLA I类抗原决定簇中有36个(1.8%)与MERS-CoV蛋白序列具有100%的序列同一性,其中33个和3个分别位于ORF1ab和S蛋白中。SARS-CoV和MERS-CoV共有ORF1ab中的30个表位。在1399种可能的HLA II类表位中,有418种(29.9%)与所有三个SARS-CoV都具有100%的序列同一性。分别在ORF1ab,S,E,M和N蛋白中分别有362(86.7%),40(11.0%),4(1.1%),4(1.1%)和7(1.9%)位于。十个(2.4%)表位均在ORF1ab中,在MERS-CoV中也保守。

表2 SARS-CoV或MERS-CoV共有的SARS-CoV-2衍生T细胞表位

T细胞表位可能普遍存在于多个HLA分子上,可以覆盖更大比例的个人/患者。因此,我们估计SARS-CoV的-2衍生,HLA-I类和的人口覆盖率II-呈现的等位基因/单倍型频率的基础上,具有高结合亲和力的表位的HLA(表   3和补充表   456)。预测ORF1ab中的两个表位ORF1ab2168-2176和ORF1ab4089-4098与HLA-A * 24:02,HLA-A * 02:01和HLA-A * 02:06具有强亲和力日本人口的83.8%。还预测ORF1ab2168-2176是与四个HLA-C分子结合的表位,包括HLA-C * 01:02,HLA-C * 08:01,HLA-C * 12:02和HLA-C * 14:02 ,其中日本人占76.5%。S蛋白中的两个表位S268-277和S448-457覆盖了70%以上的日本人。具有这些肽的HLA-寡聚体也可用于监测患者和沉默感染的个体中的CD8 + T细胞反应。

表3基于HLA-A频率的SARS-CoV-2衍生的HLA I类表位在日本人群中具有较高覆盖率

所有复制病毒,包括冠状病毒,都会积累一些由于自然选择而持续存在的突变,这些突变有助于逃避免疫应答。因此,我们最终调查了从亚洲,北美,欧洲和大洋洲四个不同地区的患者/个体分离出的6421个SARS-CoV-2基因组序列中的突变率,并确定了总共156个氨基酸突变频率超过0.5%(图   2,表   4和补充表   7)。ORF1ab P4715L和S D614G,以前报道的[ 1516],通常在所有四个区域中都可以找到,尽管在亚洲国家中ORF1ab 4715L和S 614G类型的频率明显低于其他国家(15.4%对52.6-73.7%;P  = 3.81×10 -125)。ORF1ab P5828L和ORF1ab Y5865C仅在北美占主导地位(分别为30.6%与其他人的0–7.8%;P  = 3.26×10 -237和31.4%与0–8.1%; 5.54×10 -246)。与其他地区相比,仅在大洋洲经常观测到N P13L(10.5%,其他地区为0.13–1.7%;P  = 4.41×10 -64),在大洋洲和欧洲观测到的N R203K / G204R频率更高(14.7–27.6) %与3.6–5.3%;P  = 2.56×10 −105)。我们发现上述表位序列中没有突变。

图2
图2

SARS-CoV-2突变率的分布。从四个不同区域分离出的共有6421个SARS-CoV-2序列;将来自亚洲地区的587种病毒,来自北美地区的1918种,来自欧洲国家的3190种以及来自大洋洲地区的726种病毒与SARS-CoV-2_Wuhan-Hu-1的参考蛋白序列进行了比较[ 1 ]。绘制了至少在一个区域中以超过0.5%的频率观察到的156个氨基酸突变

表4从四个不同区域分离出的SARS-CoV-2中经常观察到的突变(≥10%)

讨论区

为了控制当前的COVID-19大流行并在不久的将来防止第二次大流行,新药物和疫苗的开发以及研究患者或无声感染者的免疫反应的工具的建立是紧迫的问题。特别是,有效的疫苗接种或免疫疗法可以在抑制病毒扩散方面发挥重要作用。由于抗体识别细胞表面蛋白,因此基于抗体的疫苗的靶标受到限制。病毒感染后,病毒蛋白在被感染的细胞中表达,并被蛋白酶体加工成小肽。这些肽然后由HLA分子呈递到被感染细胞的表面,并被T细胞通过其T细胞受体识别。从而,潜在的T细胞表位可以来源于任何病毒结构蛋白和非结构蛋白。在这项研究中,我们使用生物信息学工具全面筛选了潜在的SARS-CoV-2衍生,HLA I和II级抗原决定簇的表位,共43种HLA等位基因在日本人群中很常见,分别识别了2013年和1399个表位。781 HLA I类和418 HLA II类表位被认为在SARS-CoV-2和SARS-CoV之间是常见的(表   2)。我们发现SARS-CoV-2的四个表位S1060-1068,S1220-1229,N222-230和N315-324具有与报告为HLA-A * 02:01的免疫原性SARS-CoV衍生表位完全相同的序列中,对应于S1042-1050,S1203-1211,N223-231和,分别SARS冠状病毒的N317-325 [ 1718]。有趣的是,SARS-CoV-2衍生的S1060-1068表位也被预测为HLA-A * 02:06(属于同一HLA-A * 02家族),HLA-B * 52:01和HLA-A * 02:06的高亲和力表位。 HLA-C * 12:02。在日本人群中,HLA-A * 24:02是最常见的HLA-A分子,等位基因频率为37.8%(这意味着61.3%的日本人至少有一种HLA-A * 24:02等位基因),其次分别是HLA-A * 02:01和HLA-A * 02:06的12.3%和9.6%。预测ORF1ab中的两个表位,ORF1ab2168-2176和ORF1ab4089-4098(后者在SARS-CoV中保守)与HLA-A * 24:02以及HLA-A * 02:01和HLA-A * 02:06。基于它们的等位基因频率,这些表位可以覆盖83.8%的日本人。由于在我们确定的这些表位序列中未发现突变,因此这些潜在的候选表位可能会导致对针对SARS-CoV-2的合理设计的基于表位的肽疫苗的开发做出贡献。如果这些表位具有免疫原性,我们可以将HLA-寡聚体与这些肽中的每一个一起使用,以监测患者和无声感染个体的T细胞反应。此外,1920 ]。这些HLA低聚物可能有助于预测和监测导致这些危及生命的症状的COVID-19患者的急性T细胞反应。

总之,通过生物信息学筛选,我们鉴定了大量潜在的T细胞表位,其中一些可以覆盖其他冠状病毒香料,包括SARS-CoV。这些肽可能覆盖很大比例的日本人口。尽管需要进一步的实验证据来评估预测的肽的免疫原性,但我们希望我们在当前研究中的发现能够有助于设计疫苗(DNA或RNA疫苗,灭活的病毒疫苗或肽疫苗)并评估这些疫苗以及免疫监测SARS-CoV2感染患者。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297