01? MEGENA概要
基因共表達(dá)網(wǎng)絡(luò)分析可以有效鑒定與復(fù)雜人類疾病相關(guān)的功能性共表達(dá)基因模塊。最常用的共表達(dá)網(wǎng)絡(luò)分析是加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA),它將復(fù)雜生物過(guò)程的基因共表達(dá)網(wǎng)絡(luò)劃分為高度相關(guān)的幾個(gè)特征模塊,其代表著幾組高度協(xié)同變化的基因集,并可將模塊與特定的臨床特征建立關(guān)聯(lián),從中尋找發(fā)揮關(guān)鍵功能的基因,幫助識(shí)別參與特定生物學(xué)過(guò)程的潛在機(jī)制以及探索候選生物標(biāo)志物。但是這種方法有一定局限性,無(wú)法在單個(gè)網(wǎng)絡(luò)中共存不同級(jí)別的聚類,從而無(wú)法體現(xiàn)復(fù)雜網(wǎng)絡(luò)的多尺度層次性。
為了解決這些缺點(diǎn),MEGENA在拓?fù)漕I(lǐng)域采用了網(wǎng)絡(luò)嵌入范式。換句話說(shuō),一個(gè)共同表達(dá)網(wǎng)絡(luò)被嵌入在一個(gè)球面上,這樣一個(gè)鏈接就不會(huì)與其他鏈接交叉。MEGENA通過(guò):i)引入共表達(dá)相似性的質(zhì)量控制,ii)并行化嵌入式網(wǎng)絡(luò)構(gòu)建,發(fā)展了一種新的聚類技術(shù)來(lái)識(shí)別平面濾波網(wǎng)絡(luò)(PFNs)中的多尺度聚類結(jié)構(gòu)。
MEGENA包括四個(gè)主要步驟:1)引入并行化、提前終止和先驗(yàn)質(zhì)量控制的快速平面濾波網(wǎng)絡(luò)構(gòu)造(FPFNC);2)引入以分辨率參數(shù)為特征的模塊結(jié)構(gòu)緊湊性的多尺度聚類分析(MCA);3)采用多尺度中心分析(MHA)來(lái)識(shí)別高度復(fù)雜的網(wǎng)絡(luò)聚類特征關(guān)聯(lián)分析(CTA)探討聚類與臨床結(jié)果的相關(guān)性。圖1顯示了MEGENA的總體分析流程。
FPFNC主要遵循PMFG算法的網(wǎng)絡(luò)嵌入原理來(lái)構(gòu)造PFN。所有的基因?qū)κ紫韧ㄟ^(guò)一個(gè)相似性度量進(jìn)行排序,量化各自的相互作用強(qiáng)度,然后對(duì)其平面性進(jìn)行迭代測(cè)試,以形成有利于包含具有較大相似性的基因?qū)Φ那度胧骄W(wǎng)絡(luò)。為了使PFN構(gòu)建在全基因組共表達(dá)網(wǎng)絡(luò)分析中具有可擴(kuò)展性,MEGENA開(kāi)發(fā)了兩種技術(shù)。首先,通過(guò)設(shè)置基因?qū)ο嗨菩缘腻e(cuò)誤發(fā)現(xiàn)率(FDR),在網(wǎng)絡(luò)嵌入之前篩選掉不重要的交互作用。其次,提出了一種并行篩選程序(PCP)來(lái)提取更可能被嵌入的基因?qū)ψ蛹?,使得FPFNC能夠更加高效地構(gòu)建網(wǎng)絡(luò)。
然后將FPFNC構(gòu)造的PFN輸入MCA,識(shí)別多尺度聚類。MCA結(jié)合了三個(gè)不同的準(zhǔn)則來(lái)識(shí)別局部相干簇,同時(shí)保持全局最優(yōu)分割。首先,利用最短路徑距離(SPD)優(yōu)化簇內(nèi)緊密性。其次,利用局部路徑索引(LPI)優(yōu)化局部聚類結(jié)構(gòu)。第三,采用整體模塊化(Q)來(lái)確定最優(yōu)劃分。具體地說(shuō),MCA采用層次分裂法,通過(guò)k分裂和緊度估計(jì)兩步迭代,將PFN中的復(fù)雜相互作用分解為不同分辨率的相干相互作用體。k-split通過(guò)優(yōu)化SPD、LPI和Q來(lái)識(shí)別導(dǎo)致父網(wǎng)絡(luò)最優(yōu)劃分的簇。
最后,利用MHA和CTA進(jìn)行下游分析。MHA首先根據(jù)已建立的平面網(wǎng)絡(luò)隨機(jī)模型確定每個(gè)集群內(nèi)的重要樞紐。在多個(gè)尺度上作為中心的節(jié)點(diǎn)稱為多尺度中心。CTA通過(guò)主成分分析和相關(guān)分析評(píng)估個(gè)體聚類與臨床結(jié)果的相關(guān)性。
02??MEGENA示例流程
1、計(jì)算相關(guān)性
2、計(jì)算PFN
在這一步中,平面濾波網(wǎng)絡(luò)(PFN)是通過(guò)取顯著相關(guān)對(duì)ijw來(lái)計(jì)算的。在使用不同的相似性度量的情況下,可以獨(dú)立地將結(jié)果格式化為列名為c(“row”、“col”、“weight”)的3列數(shù)據(jù)幀,并確保weight列的范圍在0到1之間。將此用作計(jì)算.PFN()也可以。
3、執(zhí)行聚類
利用MCA聚類進(jìn)行多尺度聚類分析。“MEGENA.output “是用于下游分析的核心輸出,用于匯總和繪圖。
4、匯總結(jié)果
5、作圖
可以選取感興趣的網(wǎng)絡(luò)模塊作圖
參考文獻(xiàn)
[1] Zhang L, Peng TL, Wang L, Meng XH, Zhu W, Zeng Y, Zhu JQ, Zhou Y, Xiao HM, Deng HW. Network-based Transcriptome-wide Expression Study for Postmenopausal Osteoporosis. J Clin Endocrinol Metab. 2020 Aug 1;105(8):2678–91. doi: 10.1210/clinem/dgaa319. PMID: 32483604; PMCID: PMC7320836.
[2] Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559. doi: 10.1186/1471-2105-9-559. PMID: 19114008; PMCID: PMC2631488.