今天和大家分享的是2020年4月發(fā)表在JOURNAL OF CELLULAR BIOCHEMISTRY (IF:4.237)雜志上的一篇文章《CFHR3 is a potential novel biomarker for hepatocellular carcinoma》,作者為了深入研究補(bǔ)體因子H相關(guān)蛋白CFHR3在肝癌中的作用,對(duì)TCGA來(lái)源以及ICGC來(lái)源的肝細(xì)胞癌RNA-seq數(shù)據(jù)和臨床數(shù)據(jù)進(jìn)行了全面生物信息學(xué)分析,明確了CFHR3在肝癌中的預(yù)后價(jià)值。
前言
肝細(xì)胞癌(HCC)是世界第五大最常見的惡性腫瘤,每年全球診斷出超過700,000例新病例。HCC是一種異質(zhì)性疾病,通常起源于肝硬化,在亞洲和非洲與乙型肝炎病毒(HBV)感染有關(guān)。外科手術(shù)的發(fā)展顯著提高了早期HCC患者的生存率,但是由于HCC病情進(jìn)展快速,大部分患者被診出時(shí)就已經(jīng)是晚期,并且只有不到30%的診出患者接受外科手術(shù),總體生存率還是很低。因此,很有必要挖掘更多有利于改善治療的新靶標(biāo)。
由于缺乏對(duì)疾病機(jī)制的全面了解,HCC治療方法的研究進(jìn)展緩慢。補(bǔ)體系統(tǒng)是先天免疫的關(guān)鍵組成部分,可以促進(jìn)或抑制腫瘤發(fā)生。補(bǔ)體因子H家族包括H因子(FH),補(bǔ)體因子H樣蛋白(CFHL1)和補(bǔ)體因子H相關(guān)蛋白1-5(CFHR1-CFHR5)。CFHR3也稱為DOWN16和FHR-3,是一種補(bǔ)體系統(tǒng)激活的負(fù)向調(diào)節(jié)劑,在先天免疫中起著重要作用。先前的研究表明CFHR3與許多免疫系統(tǒng)疾病之間存在聯(lián)系,例如非典型溶血尿毒綜合征,黃斑變性,IgA腎病和系統(tǒng)性紅斑狼瘡。但是,迄今為止,CFHR3在肝癌中的作用尚不清楚。
材料與方法
1、患者數(shù)據(jù)
作者從TCGA和ICGC數(shù)據(jù)庫(kù)中下載HCC患者的臨床數(shù)據(jù)以及RNA-seq表達(dá)數(shù)據(jù),剔除了部分臨床病理數(shù)據(jù)不足或基因表達(dá)值為“ 0”的患者數(shù)據(jù)。
2、統(tǒng)計(jì)分析
作者使用R(v.3.6.0)軟件進(jìn)行統(tǒng)計(jì)分析。利用Wilcoxon秩和檢驗(yàn)分析HCC隊(duì)列中正常組織和腫瘤之間CFHR3表達(dá)水平的差異。使用Kolmogorov-Smirnov檢驗(yàn)和邏輯回歸分析CFHR3表達(dá)與臨床病理特征之間的關(guān)系。
3、生存分析
生存分析計(jì)算TCGA和ICGC隊(duì)列的總體生存(OS),并使用Kaplan-Meier生存曲線衡量判斷準(zhǔn)確性。還使用單因素和多因素Cox回歸比較CFHR3和其他臨床特征的預(yù)后價(jià)值。CFHR3表達(dá)的臨界值由所有組的中值確定。使用R軟件包“ survivalROC”,確定ROC曲線,曲線下面積(AUC)和C指數(shù),以評(píng)估基因?qū)φw生存的預(yù)測(cè)價(jià)值。
4、ESTIMATE算法
使用R包“ESTIMATE” 計(jì)算每個(gè)隊(duì)列的ESTIMATE分?jǐn)?shù),然后將患者根據(jù)ESTIMATE分?jǐn)?shù)中位數(shù)分為高或低兩組。
5、基因集富集分析
利用GSEA2‐2.2.3以及MSigDB v6.2進(jìn)行,基于默認(rèn)的富集參數(shù),每次分析重復(fù)1000次,選取FDR
結(jié)果
1、臨床病理特征
表1列出了TCGA和ICGC數(shù)據(jù)庫(kù)中患者的臨床特征。TCGA患者的59%(n = 377)和ICGC患者的41%(n = 260)均分為I,II,III和IV期。TCGA隊(duì)列中有255名男性,ICGC中有192名男性。在TCGA隊(duì)列中,患有I,II,III和IV期的患者人數(shù)分別為175、87、86和5,在ICGC隊(duì)列中分別為40、117、80和23。
2、肝癌中CFHR3表達(dá)水平
為了評(píng)估TCGA和ICGC隊(duì)列中HCC患者CFHR3的表達(dá)水平,作者進(jìn)行了Wilcoxon秩和檢驗(yàn)(圖1)。發(fā)現(xiàn)TCGA隊(duì)列中腫瘤組織中的CFHR3表達(dá)水平遠(yuǎn)低于正常組織(P <.001>
作者接下來(lái)比較了兩個(gè)隊(duì)列中低分期(I&II期)和高分期(III&IV期)肝癌患者的CFHR3表達(dá)水平(圖2)。
邏輯回歸單變量分析顯示,CFHR3高表達(dá)表現(xiàn)出良好的預(yù)后特征(表2)。TCGA隊(duì)列中高CFHR3表達(dá)與以下特征顯著相關(guān),如高分期(I vs III: OR = 0.6,P = 0.0001),等級(jí)(G1 vs G3:OR = 0.68,P = .003),等級(jí)(G1 vs G4:OR =0. 68,P = 0.218),T分類(T1 vs T2: OR = 0.64,P = 0.0825),T分類(T1 vs T3: OR = 0.64,P = 0.0001)。在TCGA隊(duì)列中,IV期只有5例患者,并且I期和IV期之間沒有顯著差異(I vs IV,OR = 1.21,P =0 .0183)。結(jié)果表明,CFHR3低表達(dá)的HCC可能比CFHR3高表達(dá)的HCC預(yù)后更差。
3、CFHR3表達(dá)量作為HCC預(yù)后的價(jià)值
作者通過Kaplan–Meier曲線分析了不同分期和CFHR3不同表達(dá)量的生存率差異。結(jié)果顯示,在TCGA(P
4、CFHR3作為HCC生物標(biāo)志物的有效性研究
為了評(píng)估CFHR3作為HCC生物標(biāo)志物的有效性,作者進(jìn)一步了TCGA和ICGC隊(duì)列的ROC曲線中的Uno C指數(shù)和AUC值(圖5A和5B)。在亞組分析中,CFHR3在兩個(gè)獨(dú)立隊(duì)列的所有I期,II期以及III期和IV期患者中均具有穩(wěn)定的AUC值(TCGA:0.66、0.63、0.62和ICGC:0.66、0.73、0.63;圖5A,5B)。在TCGA和ICGC隊(duì)列中時(shí)間相關(guān)的AUC值顯示出一致的模式(圖5C和5D)。
為了比較AUC和C指數(shù),作者分析了其他預(yù)后基因,包括SAC3D1,AP2M1,MKI67和GPC3。利用ROC曲線評(píng)估TCGA和ICGC隊(duì)列中這些基因的預(yù)后能力(圖6A-J)。TCGA隊(duì)列中SAC3D1和MKI67在2年和3年內(nèi)的AUC值均大于CFHR3的AUC值。但是在CFGA3的TCGA隊(duì)列中,0.5年和5年的AUC值優(yōu)于其他基因的AUC值。在ICGC隊(duì)列中,CFHR3與其他基因相比顯示出更高的AUC值。此外,與其他已建立的預(yù)后基因表達(dá)相比,CFHR3在TCGC和ICGC隊(duì)列中顯示出更高的C指數(shù)值(表4)??傊珻FHR3在肝癌患者中表現(xiàn)出良好的分類準(zhǔn)確性和預(yù)測(cè)能力。
5、ESTIMATE分析
為了探究高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)HCC人群在ESTIMATE,免疫和基質(zhì)評(píng)分方面的差異,作者分析了TCGA和ICGC人群中CFHR3的差異表達(dá)。結(jié)果表明,低危人群的ESTIMATE值,免疫和基質(zhì)評(píng)分均高于高危人群(P
6、CFHR3與生物學(xué)通路和功能之間的關(guān)系
作者利用GSEA分析TCGA數(shù)據(jù)集,以明確CFHR3低表達(dá)和高表達(dá)之間的功能和生物學(xué)通路。分析表明,CFHR3低表達(dá)表型由許多關(guān)鍵通路組成,并與腫瘤發(fā)生有關(guān)。高風(fēng)險(xiǎn)組中富集了所有通路,包括細(xì)胞周期,Wnt信號(hào)通路,結(jié)腸直腸癌,癌癥通路,Notch信號(hào)通路,VEGF信號(hào)通路和P53信號(hào)通路。另外,CFHR3高表達(dá)組還發(fā)現(xiàn)了補(bǔ)體和凝血級(jí)聯(lián)以及初級(jí)膽汁酸的生物合成這兩個(gè)通路的富集(圖8和表5)。
總結(jié)
本篇文章的作為單基因生信分析文章,主要的思路是首先利用Wilcoxon秩和檢驗(yàn)分析了TCGA以及ICGC隊(duì)列中癌組織和正常組織、癌旁組織之間CFHR3的表達(dá)差異,然后利用Kaplan‐Meier生存曲線比較兩個(gè)隊(duì)列中HCC高低分期之間CFHR3的表達(dá)差異,利用單變量分析進(jìn)一步明確CFHR3的表達(dá)差異與臨床預(yù)后特征之間的相關(guān)性,這時(shí)確定了CFHR3低表達(dá)顯示較差的預(yù)后。接下來(lái),通過Kaplan–Meier生存曲線分析了不同分期和CFHR3不同表達(dá)量的生存率差異,驗(yàn)證CFHR3的預(yù)后價(jià)值。同時(shí),利用ROC生存分析檢驗(yàn)CFHR3預(yù)測(cè)的有效性。最后利用ESTIMATE分析和GSEA富集分析展示了CFHR3高表達(dá)和低表達(dá)之間免疫和基質(zhì)評(píng)分方面的差異以及富集通路的差異。
該文章可謂完美復(fù)現(xiàn)單基因分析的思(tao)路,就是表達(dá)特征+預(yù)后價(jià)值+免疫浸潤(rùn),然后再加點(diǎn)功能相關(guān)的分析,然后4分+文章就到手啦,是不是很心動(dòng),如果你也有感興趣的腫瘤和基因想要進(jìn)行類似的研究,快來(lái)聯(lián)系我們吧。