这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用首次发表在JMIR生物信息学和生物技术上的原创作品。必须包括完整的书目信息,https://bioinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
长链非编码RNA (lncRNAs)是长度大于200个核苷酸的非编码RNA转录物,已知在调节参与重要细胞功能的基因转录中发挥作用。我们假设异常鞘质病变的疾病过程与lncrna和信使rna (mRNAs)的异常表达有关。
在本研究中,我们比较了野生型和dysferlin缺陷小鼠成肌细胞(C2C12细胞)之间lncRNA和mRNA的表达谱。
使用微阵列进行LncRNA和mRNA表达分析。采用实时定量聚合酶链式反应对几种差异表达的lncrna进行了验证。进行基因本体(GO)分析,以了解差异表达mrna的功能作用。进一步的生物信息学分析探讨差异表达lncrna的潜在功能、lncRNA-mRNA相关性以及潜在靶点。
我们发现3195个lncrna和1966个mrna存在差异表达。差异表达的lncrna和mrna的染色体分布是不平等的,2号染色体的lncrna数量最多,7号染色体的差异表达mrna数量最多。对差异表达基因的通路分析表明,涉及多种信号通路,包括PI3K-Akt、Hippo和调节干细胞多能性的通路。差异表达基因也富集了GO项,
到目前为止,我们的研究结果表明,鞘质异常与多种lncrna的异常表达有关,其中许多可能在疾病过程中具有特定的功能。GO术语和网络分析表明这些lncrna具有肌肉特异性作用。为了阐明这些异常表达的非编码rna的具体作用,需要对其表达进行进一步的工程研究。
肌营养不良是肌肉营养不良的一种类型,是一组以进行性肌肉无力为特征的遗传性肌肉退行性疾病。它是由失联蛋白缺乏引起的,失联蛋白是一种在骨骼肌和心脏中高度表达的II型跨膜蛋白。Dysferlin作为支架与多种蛋白质相互作用,在骨骼肌钙依赖性膜修复中发挥关键作用[
近年来,科学家们发现了一组异质RNA分子,称为非编码RNA (ncRNAs),参与许多生理功能和疾病过程。有趣的是,只有2%的真核生物基因组被转录为功能蛋白,其余98%被认为是非蛋白质编码rna或ncrna [
本文介绍了利用微阵列分析野生型和dysferin缺陷小鼠成肌细胞之间lncrna表达谱的结果。为了证实我们的微阵列结果,我们借助定量实时聚合酶链式反应(qRT-PCR)验证了一些差异表达的lncrna。此外,本文还利用生物信息学,对这些lncRNAs可能的细胞功能和相互作用进行了注解。
C2C12细胞系是麻省大学神经学系Robert H. Brown博士的慷慨礼物[
按照制造商的说明,使用RNeasy plus试剂盒(Qiagen)从野生型和dysferin缺陷C2C12细胞中提取总RNA。采用NanoDrop ND-1000分光光度计测定RNA样品的质量和定量。通过琼脂糖凝胶电泳检测RNA样品的完整性。
使用包含21486个LncRNA和18921个mRNA探针的Arraystar Mouse LncRNA Microarray V3.0进行LncRNA和mRNA表达分析。lncRNA探针是基于来自著名转录组公共数据库的信息创建的,如Refseq, UCSC已知基因,Ensembl和标志性出版物。为每一类lncrna制备探针的百分比为
每种类型设计的lncRNA探针的百分比。
LncRNA类别 | 设计探头,n (%) |
双向 | 993 (4.6) |
外显子sense-overlapping | 7451 (34.7) |
基因间的 | 9183 (42.7) |
基因内区sense-overlapping | 497 (2.3) |
Intronic反义 | 1425 (6.6) |
自然反义 | 1937 (9) |
总计 | 21486 (100) |
样本标记和阵列杂交根据安捷伦单色微阵列基因表达分析协议(安捷伦技术)进行微小修改。简单地说,首先从总RNA样本中去除核糖体RNA,然后使用mRNA- only真核mRNA分离试剂盒(Epicentre Biotechnologies)纯化mRNA。然后,使用低聚物(dT)和随机引物混合方法(Arraystar Flash RNA标记试剂盒)扩增纯化的样品,沿转录本的整个长度无3 '偏倚转录成荧光互补RNA (cRNA)。然后按照制造商的说明使用RNeasy Mini Kit (Qiagen)进行cRNA纯化。采用NanoDrop ND-1000分光光度计测定标记cRNA的浓度和比活性(pmol Cy3/μg cRNA)。将5 μL 10 × Blocking Agent和1 μL 25 × Fragmentation Buffer加入到1 μg标记后的cRNA中进行裂解,60℃加热30分钟。加入25 μL的2 × GE杂化缓冲液,以达到预期的稀释效果。用50 μL杂交液在微阵列载玻片上组装探针。载玻片在Agilent杂交箱中65°C孵育17小时。使用安捷伦DNA微阵列扫描仪(零件号G2505C)对杂交阵列进行清洗、固定和扫描。
使用Agilent Feature Extraction软件(version 11.0.1.1)获取阵列图像并进行分析。genspring GX软件包(版本12.1;安捷伦技术公司)用于进一步的数据处理和分位数规范化。对当前或边际(“所有目标值”)值有标记的样本进行进一步分析。差异表达的lncrna和mrna通过样品间的fold change (FC)筛选进行鉴定。截断值为|FC|≥2,其中FC值为线性尺度(不是对数尺度)2尺度)根据归一化强度计算。
GO分析源自基因本体[
按照制造商的说明,使用RNeasy Mini Kit (Qiagen)从野生型和dysferin缺陷成肌细胞中提取总RNA。然后使用反转录试剂盒(QuantaBio)进行反转录,并使用SYBR Green FastMix (QuantaBio)和StepOnePlus RT-PCR仪完成qRT-PCR分析。本研究所用引物的序列见
定量实时聚合酶链式反应所用引物清单。
长链非编码RNA | 引物序列(5 ' - 3 ') |
TnnT3 | Fwd - AGCTCCAAGCCCTCATTGAC |
段H19 | 转发- ATCCTGGAGCCAAGCCTCTA |
XLOC_011052 | Fwd - CCAGGAAGTTGAAGCAGGAG |
XLOC_008220 | Fwd - TTTCACTTGCTGGCTTTTGA |
AK085239 | 前进- CCATCCCTACACTGCAGCAA |
AK032137 | Fwd - CCTTGGAGTGAAGTGGCCAT |
Trak2 | Fwd - CCTAGCTCCGGTTTCCCATC |
MetaCore软件(2021年版;GeneGo Inc)用于网络分析。根据敲除(KO)与野生型lncrna之间的fc,从数据集中选择前25个上调和前25个下调的lncrna (
该芯片显示,在检测的19744个lncrna中,与野生型细胞相比,dysferin缺陷细胞中有3195个lncrna表达差异。在这些lncrna中,上调的有1035个,下调的有2160个(
基于微阵列数据的差异表达lncRNAs。与正常对照相比,dysferlin缺陷小鼠成肌细胞中差异表达lncrna的散点图。红点表示失铁素缺乏成肌细胞中lncrna的上调,绿点表示lncrna的下调,其折叠变化大于2.0。柯:淘汰赛;LncRNA:长链非编码RNA;WT:野生型。
差异表达的lncrna在dysferin缺陷成肌细胞中的染色体分布,显示每条染色体上的lncrna上调(蓝色)和下调(橙色)。lncRNA:长链非编码RNA。
lncrna是根据其与附近蛋白质编码基因的相对位置进行分类的。在这项研究中,我们发现了差异表达的lncrna分布在4个不同的类别中:意义、基因间、反义和双向。有义和反义lncrna分别从DNA的有义和反义链转录而来。基因间lncrna来源于基因之间的DNA序列,双向lncrna使用与蛋白质编码基因相同的启动子,但转录方向相反[
在微阵列筛选的15633个mrna中,1966个在失联素缺陷细胞中与野生型细胞相比表达差异。在1966年的mrna中,1233个表达上调,733个表达下调(
基于微阵列数据的差异表达mrna。与正常对照相比,失联蛋白缺乏小鼠成肌细胞中差异表达mrna的散点图。红点表示异常铁素缺乏成肌细胞中mrna表达上调,绿点表示lncrna表达下调,其折叠变化大于2.0。柯:淘汰赛;mRNA:信使RNA;WT:野生型。
dysferin缺陷成肌细胞中差异表达mrna的染色体分布,显示每条染色体上mrna上调(蓝色)和下调(橙色)。mRNA:信使RNA。
为了证实微阵列结果的可靠性,我们从微阵列结果中随机选取了6个差异表达的lncRNAs-3 (TnnT3、H19和XLOC_011052)和4个差异表达的lncRNAs-3 (XLOC_008220、AK085239、AK032137和Trak2)。分析结果与微阵列结果的变化方向一致(
实时定量聚合酶链式反应(qRT-PCR)验证微阵列结果。柱状图显示了敲除样本与野生型相比的折叠变化。误差条表示SD (N=3)。柯:淘汰赛;WT:野生型。
进行GO分析以了解差异表达mrna的功能作用(
基因本体论(GO)分析和京都基因和基因组百科全书(KEGG)分析上调基因。mRNA:信使RNA。
基因本体论(GO)分析和京都基因与基因组百科(KEGG)分析下调基因。mRNA:信使RNA。
对lncrna进行网络分析,评估其与转录因子、受体、蛋白质复合物、小分子和生化途径的关系。选择上调率最高的25个lncRNAs (humanlincRNA0955、Trak2、4930480G23Rik、AK078726、AK037210、AK085419、mouselincRNA0086、Tnnt3、AK038305、Filip1、Gm20485、Fam189a1、AK135257、Myh6、Coro2b、H19、AK045129、Enpep、AK144424、AK143389、Gm5401、AK035065、AK009210、humanlincRNA1720、AK034241)进行网络分析。在这25个lncrna中,有13个lncrna (Trak2、4930480G23Rik、AK085419、Tnnt3、Filip1、Fam189a1、AK135257、Myh6、Coro2b、H19、Enpep、AK009210和AK034241)被MetaCore识别出来,这些特定的lncrna被用于网络分析。从上调的lncRNAs中共鉴定出8个具有统计学意义的网络对象(
从13个上调的长链非编码rna中获得了具有统计学意义的网络。网络对象的顺序基于网络上规范路径片段的数量进行优先级排序。
不。,name, Gene Ontology processes (%; |
总节点 | 种子节点 |
|
||||
|
50 | 8 | 7.97 × 10-26年 | ||||
|
肌丝滑动(35.4;9.832 × 10-35年) |
|
|
|
|||
|
肌动蛋白-肌凝蛋白丝滑动(35.4;1.459 × 10-34年) |
|
|
|
|||
|
肌肉系统过程(56.2;1.447 × 10-33年) |
|
|
|
|||
|
肌肉收缩(50;6.408 × 10-31年) |
|
|
|
|||
|
肌动蛋白介导的细胞收缩(35.4;9.680 × 10-27年) |
|
|
|
|||
|
50 | 2 | 4.52 × 10-06年 | ||||
|
组蛋白H4乙酰化(25;1.131 × 10-16年) |
|
|
|
|||
|
肽基氨基酸修饰(50;1.613 × 10-16年) |
|
|
|
|||
|
组蛋白乙酰化(25;1.170 × 10-13年) |
|
|
|
|||
|
内肽基赖氨酸乙酰化(25;2.149 × 10-13年) |
|
|
|
|||
|
多肽赖氨酸乙酰化(25;2.712 × 10-13年) |
|
|
|
|||
|
50 | 2 | 5.62 × 10-06年 | ||||
|
病毒转录(34;5.579 × 10-27年) |
|
|
|
|||
|
病毒基因表达(34;7.051 × 10-26年) |
|
|
|
|||
|
多肽赖氨酸修饰(34;2.567 × 10-18年) |
|
|
|
|||
|
病毒过程(46;1.024 × 10-17) |
|
|
|
|||
|
参与共生相互作用的生物过程(46;1.493 × 10-16年) |
|
|
|
|||
|
50 | 1 | 3.32 × 10-03年 | ||||
|
病毒转录(40.4;8.401 × 10-32年) |
|
|
|
|||
|
病毒基因表达(40.4;1.476 × 10-30年) |
|
|
|
|||
|
病毒细胞内转运(31.9;1.691 × 10-27年) |
|
|
|
|||
|
病毒的传播(31.9;1.250 × 10-26年) |
|
|
|
|||
|
多生物定位(31.9;2.301 × 10-26年) |
|
|
|
|||
|
50 | 1 | 3.39 × 10-03年 | ||||
|
对有机环化合物(61.4;6.074 × 10-19年) |
|
|
|
|||
|
组织发育(68.2;1.553 × 10-18年) |
|
|
|
|||
|
对非生物刺激的反应(61.4;3.091 × 10-18年) |
|
|
|
|||
|
腺体发育(45.5;6.551 × 10-18年) |
|
|
|
|||
|
细胞代谢过程正向调控(79.5;1.774 × 10-17年) |
|
|
|
|||
|
50 | 1 | 3.46 × 10-03年 | ||||
|
氮化合物代谢过程的正向调控(77.1;1.738 × 10-18年) |
|
|
|
|||
|
大分子代谢过程的正向调控(79.2;5.340 × 10-18年) |
|
|
|
|||
|
细胞过程正向调控(91.7;1.152 × 10-17年) |
|
|
|
|||
|
生物过程正向调节(93.8;2.262 × 10-17年) |
|
|
|
|||
|
蛋白质代谢过程正向调控(60.4;2.337 × 10-17年) |
|
|
|
|||
|
50 | 1 | 3.54 × 10-03年 | ||||
|
大分子代谢过程的正向调控(87;7.785 × 10-22年) |
|
|
|
|||
|
dna模板转录的正向调控(67.4;1.717 × 10-21年) |
|
|
|
|||
|
核酸模板转录的正向调控(67.4;4.954 × 10-21年) |
|
|
|
|||
|
RNA生物合成过程的正向调控(67.4;5.018 × 10-21年) |
|
|
|
|||
|
氮化合物代谢过程的负调控(76.1;6.518 × 10-21年) |
|
|
|
|||
|
50 | 1 | 3.54 × 10-03年 | ||||
|
病毒转录(44.9;5.321 × 10-38年) |
|
|
|
|||
|
病毒基因表达(44.9;1.541 × 10-36年) |
|
|
|
|||
|
信号识别蛋白(SRP)依赖的靶向膜的共翻译蛋白(28.6;2.873 × 10-22年) |
|
|
|
|||
|
共翻译蛋白靶向膜(28.6;4.992 × 10-22年) |
|
|
|
|||
|
病毒过程(53.1;6.767 × 10-22年) |
|
|
|
从排名前13位的上调长非编码rna (lncrna)中获得得分最高的网络(按路径数计算)。绿色箭头表示激活效应,红色箭头表示抑制效应,灰色箭头表示未指明的效应。lncrna beta TnTF (Tnnt3)和alpha-MHC (MyH6)用黑色圈出。
从16个下调的长链非编码rna中获得了具有统计学意义的网络。网络对象的顺序基于网络上规范路径片段的数量进行优先级排序。
不。,name, Gene Ontology processes (%; |
总节点 | 种子节点 |
|
||||
|
50 | 2 | 1.98 × 10-06年 | ||||
|
Janus激酶活性激活的负调控(4.7;9.716 × 10-06年) |
|
|
|
|||
|
线粒体的轴突逆行转运(4.7;1.941 × 10-05年) |
|
|
|
|||
|
白细胞介素-1 α产生的负调控(4.7;3.231 × 10-05年) |
|
|
|
|||
|
嘌呤脱氧核糖核苷酸分解代谢过程(4.7;4.841 × 10-05年) |
|
|
|
|||
|
白细胞介素-1介导的信号通路的负调控(4.7;6.770 × 10-05年) |
|
|
|
|||
|
50 | 1 | 1.84 × 10-03年 | ||||
|
细胞对有机环化合物的反应(50;4.858 × 10-18年) |
|
|
|
|||
|
细胞对脂质的反应(47.6;7.417 × 10-17年) |
|
|
|
|||
|
脂质反应(57.1;8.792 × 10-17年) |
|
|
|
|||
|
心肌细胞分化(31;1.763 × 10-16年) |
|
|
|
|||
|
对有机环化合物(57.1;5.534 × 10-16年) |
|
|
|
|||
|
50 | 1 | 2.09 × 10-03年 | ||||
|
肌肉系统过程(34;6.752 × 10-17年) |
|
|
|
|||
|
血小板聚集(18;1.312 × 10-13年) |
|
|
|
|||
|
同型细胞-细胞黏附(18;1.131 × 10-12年) |
|
|
|
|||
|
肌肉系统过程的调节(26;2.361 × 10-12年) |
|
|
|
|||
|
肌肉肥大(16;4.725 × 10-12年) |
|
|
|
得分最高的(通过通路数量)来自前16个下调的长非编码rna (lncrna)。灰色箭头表示未指定的效果。黑色圈出的是lncRNA DNAJC25。
特定lncrna的异常表达已被描述在各种疾病中,包括某些类型的肌肉营养不良症,如杜氏肌营养不良症、肌强直性肌营养不良症和面肩胛肱肌营养不良症[
我们的结果表明,由于dysferlin缺乏症,有大量的lncrna和mrna表达差异。下调的lncrna多于上调的lncrna,但上调的lncrna多于下调的lncrna。我们通过检测几种lncrna的表达来验证微阵列结果,这些lncrna在变化方向上是一致的,尽管在fc的大小上有小的不一致。这是意料之中的,因为这两种方法之间存在差异,使用了不同的规范化策略,以及它们固有的缺陷。
差异表达的lncrna与mrna的染色体分布不相等。2号和11号染色体的lncrna比例更高,而2号和7号染色体的差异表达mrna比例更高。有趣的是,失联蛋白基因位于人类的2号染色体和小鼠的6号染色体上。我们很容易认为,至少有一些差异表达的lncrna和mRNA基因产物可能直接调节失联蛋白的表达或功能。
根据lncrna相对于其他基因的位置和转录的方向性,可以将其分为有义lncrna、反义lncrna、双向lncrna和长基因间非编码rna (long-intergenic noncoding rna, lincrna)等多个亚群。有趣的是,本研究中鉴定的差异表达的lncrna大多为意义lncrna(43.3%)或基因间lncrna(38.3%)。加在一起,它们占差异表达的lncrna总数的四分之三以上。LincRNAs是从蛋白质编码基因附近的区域转录而不重叠的ncRNAs。已知它们具有高度的组织特异性,可以调节附近的蛋白质编码基因和远离它们的基因[
由于lncrna是调控分子,差异表达的lincrna和意义lncrna可能通过多种机制控制附近或重叠基因的表达。因此,我们很容易预测本研究中发现的许多新型lncrna的功能可能与相关基因的功能有关。从我们的GO和通路分析中,一些差异表达的mrna在功能上与骨骼肌收缩(16个基因)、骨骼肌松弛(12个基因)、肌肉收缩调节(5个基因)和肌动蛋白-肌球蛋白丝滑动(5个基因)相关。相关信号通路包括PI3K-Akt信号通路(41个基因)、Hippo信号通路(14个基因)和控制干细胞多能性的信号通路(15个基因)。
这项研究有几个局限性。本研究中使用的dysferlin缺陷小鼠成肌细胞使用短发夹RNA (shRNA)沉默dysferlin。因此,这些细胞可能具有低水平的dysferlin表达,这可能影响了差异表达。由于该领域的前期研究很少,因此差异表达lncrna的意义和相互作用仅被预测,而未被证实。此外,该芯片是使用来自3个生物重复的聚合RNA进行的,因此无法计算fc的统计学意义。需要注意的是,已知嘌呤霉素会引起基因表达的变化[
综上所述,这是第一篇阐明lncRNA特征的报告。我们的研究结果强调,lncRNAs参与调节基因表达和关键的生物学功能,如肌肉收缩和松弛失调。未来的研究将专注于破译这些lncrna调节功能的确切机制,并增加我们对这种不治之症的理解。
基因符号和折叠变化。
互补的RNA
褶皱变化
基因本体论
京都基因与基因组百科全书
基因敲除
四肢肌萎缩症
长基因间非编码RNA
长链非编码RNA
信使rna
非编码rna
实时定量聚合酶链反应
这项研究是由波士顿麻省药学院和健康科学大学的教师发展资助委员会和夏季本科生研究计划资助的。我们要感谢罗伯特·H·布朗博士,麻省大学医学院神经学主席,为我们提供了dysferin缺陷和野生型小鼠成肌细胞;杨谷石博士,Arraystar公司的高级科学家,对生物信息学分析的支持;波士顿麻省药学院和健康科学大学的医师助理研究部门以及耆那基金会,以表彰他们对营养不良研究的鼓励和支持。
没有宣布。