protocols云分享之:预测靶microRNA
1.数据收集与microRNA选择:
GEO(Gene Expression Omnibus, https://www.ncbi.nlm.nih.gov/geo/)可查询基因序列、RNA&DNA& ChIP测序结果。利用关键词搜索相关基因表达谱。
2.鉴别差异性表达的基因:
GEO2R
(https://www.ncbi.nlm.nih.gov/geo/geo2r/)允许用户比较不同组的样本,以确定不同的microRNA,在交叉的实验条件。取|logFC| ≥ 2 cutoff and P value < 0.05有统计学差异,而logFC 2上调microRNA, logFC -2下调。
3.预测靶基因:
FunRich (functional enrichment - ment)是一种用于功能富集和蛋白质-蛋白质相互作用网络分析的分析工具。FunRich中的microRNA富集功能可以用来进行miRNA富集分析,预测microRNA的靶基因,或者通过给定的靶基因找到microRNA。对差异表达的小分子RNA基因进行功能分析,发现其具有丰富的功能。
4. GO and KEGG Pathway Analysis of DEGs(提取差异表达genes(DEGs):
GO (Gene Ontology)是对高通量基因组和转录组数据进行基因注释和特征生物属性分类的一种常用优势方法。KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个数据库,用于进行基因组、生物途径、疾病、药物和化合物的搜索。DAVID(Database for Annotation, Visualization and Integrated Discovery, https://david.ncifcrf.gov/)是一个在线生物信息学工具,用于提供对大量基因列表的功能理解。以P < 0.05为截止标准。可进行关键的生物学过程(BP),分子功能(MF),细胞复合物(CC),以及这些DEGs之间的通路。
5. PPI网络及模块分析:
STRING (the Retrieval of Interacting Genes, https://string-db.org/)是一个用于评估PPI (protein-protein interaction)即蛋白质相互作用网络信息的web工具。为了检测这些DEGs之间的潜在关系,我们使用了Cytoscape软件(https://cytoscape.org/ 用于可视化复杂网络并将其与任何类型的属性数据集成)并以0.4的置信度作为截止标准。利用Cytoscape中的MCODE (Molecular Complex Detection) app显示PPI网络模块,节点score cutoff=0.2,k-core=2,max.depthfromseed=100, degree cutoff= 2。然后,选取前四个分子绘制到STRING关系网里。