TUhjnbcbe - 2020/11/11 10:51:00
今天跟大家分享的是一月份发表在biosciencereports.(IF:2.)杂志的一篇文章,这是一篇关于ceRNA三元组与缺血性心肌病的研究。AsusceptibilitybiomarkeridentificationstrategybasedonsignificantlydifferentiallyexpressedceRNAtripletsforischemiccardiomyopathy缺血性心肌病中基于显著差异表达ceRNA三元组生物标志物的鉴定缺血性心肌病(ICM)是导致死亡的常见心脏病。在现有数据库中无法找到有效的ICM生物标记物。首先,根据ICM和正常样本的RNA-Seq和miRNA-Seq数据鉴定潜在的生物标志物。利用差异表达的mRNA,miRNA和lncRNA以及随机检验的方法构建ceRNA三元组。确定了8个ICM易感基因并证实对易感基因于ICM和正常的分类准确性。这些生物标志物将有助于ICM的诊断和治疗。文章的流程图如图1所示。图1.流程图结果1.显著差异表达的ceRNA三元组根据mRNA-miRNA、mRNA-lncRNA和miRNA-lncRNA表达值,计算相关性,得到显著相关的关系对,基于显著的调控对,构建正常和疾病中显著差异的三元组,如表1所示。表1.ceRNA三元组中显著差异表达的基因数目2.候选ICM易感基因为筛选ICM易感基因,留下包含至少一个差异miRNA或者lncRNA的ceRNA三元组,利用富集分析的方法对68个差异基因进行功能富集。发现富集到37个显著的GOterm中,其中20个GOterm是和6个ICM相关的功能类相关(图2)。图2.ceRNA三元组中差异基因的富集分析在ICM相关功能类中,其中37个基因认为是候选的ICM易感基因,以基因表达作为特征,利用支持向量机(SVM)模型对ICM和正常样本进行预测模型构建,并利用留一法交叉证实评估预测性能,发现利用不同的核函数均具有较高的准确性,最后发现利用linear和sigmoid核函数具有最高的预测准确性(图3)。图3.37个候选易感基因的分类ROC曲线利用linear核函数进一步对ICM易感基因类作为特征进行分类器的构建,发现ICM易感基因功能类中基因分类性能更高(表2)。对ICM易感基因单独作为特征,8个基因的分类AUC均大于0.75(表3)。且对于ceRNA三元组的lncRNA筛选显著的,发现8个lncRNA的分类AUC大于0.75(表3)。表2.ICM相关功能类中基因分类性能表3.ICM易感基因的分类准确性进一步为了评估筛选的ICM易感基因的准确性,与随机筛选的基因的分类性能进行比较,发现识别的ICM相关的mRNA和lncRNA均相对随机筛选的具有高的AUC(图4)。并进一步通过文献查证,发现一些识别的基因与lncRNA是与心脏相关的生物学过程和功能是相关的。图4.ICM易感基因分类准确性比较这些易感基因最后形成了10个差异表达的ceRNA三元组,其中七个是在ICM样本中识别的,3个样本是正常样本识别的,进一步利用三元组中的基因作为特征进行性能评估,发现基于ICM识别的七个中的五个ceRNA三元组具有好的分类性能(图5),而正常的三个ceRNA三元组中两个的分类性能较好(图6)。七个ceRNA三元组中包含三个基因(FLT4,PSMB1,PKD1),也被证实与心血管功能有关。图5.ICM中五个差异表达ceRNA的分类性能图6.正常样本中2个差异表达ceRNA的分类性能综上,该工作基于ceRNA三元组的信息,识别8个ICM易感mRNA和8个ICM易感lncRNAs。基于显著差异表达ceRNA三元组的策略也将有助于其他复杂疾病的生物标记物的挖掘。今天的分享到此就结束了,祝开启美好的一天!欢迎