肝細胞癌(HCC)是世界範圍內最常見的消化道惡性腫瘤之一。根據國際癌症研究機構的最新資料[1], 每年約有841 080例新發病例和781 631例死亡病例, HCC在所有惡性腫瘤的發病率和死亡率中分別排名第7和第3。目前HCC的預後預測取決於組織病理學引數和腫瘤分期系統。然而, 這種傳統的方法均不足以準確預測HCC患者的臨床結果。目前迫切需要改善肝癌患者的早期檢測和預後, 以及幫助臨床醫生最佳化治療策略[2]。近年來, 基因組學測序技術及生物資訊學分析已經廣泛應用於不同型別的腫瘤研究, 發揮越來越大的作用[3]。隨著研究的不斷深入, 已經產生了多個生物資訊資料庫。目前常見的公共資料庫有TCGA資料庫和GEO資料庫。生物資訊資料庫為研究者們提供了大量的生物學資料[4-5]。研究者可以透過對肝癌組織和癌旁組織中的差異基因進行分析, 篩選出與肝癌預後的相關特徵基因, 利用TCGA資料庫構建風險預測模型, 利用GEO資料庫驗證模型的有效性。本文主要歸納總結基於免疫基因特徵、代謝基因特徵、鐵死亡基因特徵、細胞自噬基因特徵、m6 A RNA甲基化調控因子構建的肝癌風險預測模型, 為肝癌的早期檢測、預後和治療方案的最佳化提供新觀點。
1基於免疫特徵基因的風險預測模型
腫瘤免疫及免疫治療是近年來腫瘤學及免疫學研究中受到極大關注的領域。腫瘤免疫治療, 尤其是腫瘤微環境中免疫細胞的浸潤與免疫檢查點阻斷療法等, 在腫瘤治療中取得了令人矚目的效果, 為重新審視併發掘免疫系統在腫瘤發生發展中的作用提供了極好的機遇[6-7]。Chen等[8]鑑定出9個與肝癌預後相關的免疫相關基因對(IRGP)。結合臨床特徵和病理因素進行多因素分析, 發現基於9個IRGP(CISH_vs_PIAS3、CISH_vs_HSPA14、SOCS2_vs_TYRO3、ACAP1_vs_CD180、MAP3K3_vs_ BTN3A3、TRIB3_vs_RORC、AGER_vs_TYRO3、SDC4_vs_HSPD1、PLAUR_vs_CD8A)的風險評分是一個有效的獨立預後指標。9種IRGP的預後價值透過森林圖和nomogram列線圖進一步驗證, 顯示其預測準確率優於腫瘤TNM分期和病理分級。Feng等[9]鑑定出17個與肝癌預後相關的IRGP。在TCGA佇列和國際癌症基因組聯盟佇列中, 患者根據IRGP特徵分為高危組與低危組, 低危組患者的總生存時間較高危患者長。在結合臨床特徵和病理因素後, 多因素分析顯示IRGP特徵是一個肝癌預後的獨立危險因素。ROC曲線驗證了IRGP特徵的準確性。基因集富集分析表明該特徵與免疫生物學過程有關, 不同風險患者的免疫微環境狀態存在差異。基於17個IRGP的特徵可有效評估HCC的總生存期, 並預測免疫檢查點治療反應和靶向藥物敏感性。Hu等[10]基於93個免疫相關基因(IRG)對肝癌進行分子分型, 一共得到5個亞組。這5組患者有不同的預後、免疫狀態和免疫檢查點的表達。隨後, 在TCGA資料庫中, 篩選出11個與預後相關的IRG(LCN2、S100A10、FABP6、PLXNA1、KITLG、OXTR、S100A1、CCL26、CMTM4、IL1RN、RARG), 並利用國際癌症基因組聯盟資料庫進行驗證, 結果顯示, 低危組與高危組患者免疫細胞浸潤水平存在差異。研究結果表明, 基於IRG的HCC分類有助於解釋HCC的異質性, 這可能有助於促進HCC的個體化精準治療。Huang等[11]在TCGA資料庫中採用單變數Cox迴歸分析、LASSO迴歸和多變數Cox迴歸鑑定出5個IRG(EZH2、FTL、CFHR3、ISM2、CDK5)。基於5個IRG生成風險評分。根據風險評分的中位數進行分層, 結果顯示, 風險評分高的患者在1、2、3和5年後的總生存率(OS)較低, 這一結果在建模組和驗證組中是一致的。此外, IRG與免疫細胞的浸潤情況相關。根據IRG和臨床特徵構建的風險預測模型, 能夠預測患者1、3和5年的OS, AUC高達0.8。這些結果表明, 用於基於IRG的風險預測模型可用於監測治療策略的有效性和預後預測。Wang等[12]構建基於13個IRG(SPP1、STC2、HSPA8、IL15RA、BLNK、TRAF3、NOD2、GRB2、ACTG1、HDAC1、S100A9、PSMD1、EPO)的風險預測模型, 研究顯示, 高危組和低危組患者的OS差異與免疫浸潤、腫瘤免疫微環境和多種訊號通路的相互作用有關。
2基於能量代謝特徵基因的風險預測模型
越來越多的證據表明, 能量代謝重程式設計在HCC的發生和發展中起重要作用, 特別是有氧糖酵解。有氧糖酵解能迅速產生足夠的三磷酸腺苷, 滿足腫瘤在缺氧條件下生長和增殖的能量需求, 有氧糖酵解在腫瘤的增殖、生長、侵襲和治療中起著重要作用[13-14]。Chen等[15]鑑定出與肝癌預後相關的4個糖酵解相關基因(CDCA8、RAB5IF、SAP30和UCK2)。Wang等[16]鑑定出與肝癌預後相關的8個糖酵解相關基因(PAM、NUP155、GOT2、KDELR3、PKM、NSDHL、ENO1和SRD5A3)。Zhou等[17]鑑定出與肝癌預後相關的17個糖酵解相關基因對(HMMR_PFKFB1、CHST1_GYS2、MERTK_GYS2、GPC1_GYS2、LDHA_GOT2、IDUA_GNPDA1、IDUA_ME2、IDUA_G6PD、IDUA_GPC1、MPI_GPC1、SDC2_LDHA、PRPS1_PLOD2、GALK1_IER3、MET_PLOD2、GUSB_IGFBP3、IL13RA1_IGFBP3和CYB5A_IGFBP3)。基於上述糖酵解相關基因, 構建肝癌預後風險預測模型, KM曲線表明低風險組患者的OS比高危組患者OS更長。ROC曲線顯示了該模型具有較好的預測效果。透過單因素和多因素Cox分析, 證明該風險評分是一個獨立的預後因素, 與TNM臨床特徵結合, 能夠進一步提高模型的預測準確性。
脂肪酸合成、β-氧化和細胞脂質組成的改變有助於HCC的發生和發展[18]。Wang等[19]鑑定出3個具有肝癌預後價值的脂質代謝相關基因(ME1、MED10、MED22), 並基於該基因計算每個肝癌患者的風險評分, 結果顯示, 高危組HCC患者的生存率明顯低於低危組患者, 多因素Cox迴歸分析顯示該風險評分是肝癌的獨立預後因素。此外, 這一特徵還能對HCC患者的預後提供高度準確的預測。研究結果闡述了脂質代謝和HCC之間的密切聯絡, 並促進基於代謝治療HCC的發展。
氨基酸作為中間代謝物影響脂類、谷胱甘肽、核苷酸、葡萄糖胺和多胺的生物合成, 以及細胞增殖和三羧酸迴圈碳[20-22]。肝臟是蛋白質合成、降解和解毒的重要器官, 也是氨基酸代謝的重要器官[23]。Zhao等[24]基於9個氨基酸代謝相關基因(B3GAT3、B4GALT2、CYB5R3、GNPDA1、GOT2、HEXB、HMGCS2、PLOD2和SEPHS1)構建肝癌預後風險預測模型, 根據風險評分將患者分為高危組和低危組, 結果顯示, 低危組患者風險評分較低, 生存時間較長。單因素和多因素Cox迴歸證實該評分是HCC的獨立風險因素。ROC曲線顯示, 該評分可預測HCC患者1、2、3和5年生存率的AUC分別為0.813、0.770、0.744、0.702。
3基於鐵死亡特徵基因的風險預測模型
鐵死亡是一種新的鐵依賴細胞死亡形式, 其特徵是鐵過度積累和脂質過氧化, 與其他眾所周知的細胞死亡在形態學、遺傳學和生化上均不同。由於肝臟易受氧化損傷, 鐵過度積累是大多數肝臟疾病的主要特徵。近年來, 鐵死亡在肝臟疾病領域迅速受到關注[25]。Lian等[26]鑑定出10個鐵死亡相關基因(SLC7A11、G6PD、CISD1、CARS、SLC1A5、ACACA、ACSL3、NQO1、NFS1、GPX4), 結果顯示, 與低危組相比, 高危組患者OS明顯降低。在多因素Cox迴歸分析中, 該評分是OS的獨立預測因子。AUC證實了該模型的預測能力。研究表明, 鐵死亡特徵基因可以用於HCC的預後預測, 提示以鐵死亡特徵基因為靶點可能是HCC的一種新的治療選擇。Wan等[27]在TCGA佇列中, 從70個差異表達的基因(DEG)中鑑定出5個鐵死亡特徵基因(G6PD、HMOX1、LOX、SLC7A11、STMN1), 構建HCC風險預測模型, Kaplan-Meier曲線生存分析顯示, 低危組的OS顯著高於高危組。來自GSE14520佇列的資料證實了這一結果。KEGG和GO功能富集分析表明, 風險組間的OS差異與免疫相關通路密切相關。進一步分析表明, 腫瘤微環境可能是導致風險組間預後差異的原因。Chen等[28]基於2個鐵死亡相關mRNA(SLC1A5、SLC7A11)和8個鐵死亡相關長鏈非編碼RNA(lncRNA)(AC245297.3、MYLK-AS1、NRAV、SREBF2AS1、AL031985.3、ZFPM2-AS1、AC015908.3和MSC-AS1), 並在此基礎上構建肝癌風險預測模型, 訓練組和驗證組的AUC分別為0.830和0.806。決策曲線分析顯示, 基於鐵死亡基因的風險評分的預測能力優於所有病理特徵。多因素Cox迴歸分析顯示, 基於鐵死亡基因的風險評分是一個獨立的預後因素。透過Kaplan-Meier曲線, 可以明確區分低、高危患者的生存機率。Liang等[29]鑑定出3個與HCC預後相關的鐵死亡相關lncRNA(RHPN1-AS1、MAPKAPK5AS1、PART1), 結果顯示, 與低風險組相比, 高危組HCC患者的OS更短。這一特徵可作為HCC預後的獨立預測因子, 並在GEO佇列中得到了驗證。同時, 鐵死亡相關lncRNA評分的預測準確性高於基於性別、年齡、年級、分期和病因等評分的工具。這一特徵與免疫細胞浸潤(如巨噬細胞、髓樣樹突狀細胞和中性粒細胞等)和免疫檢查點(PD-1、CTLA-4和TIM-3)有關。Xu等[30]基於9個鐵死亡相關lncRNA (CTD-2033A16.3、CTD-2116N20.1、CTD-2510F5.4、DDX11-AS1、LINC00942、LINC01224、LINC01231、LINC01508和ZFPM2-AS1)構建肝癌的風險預測模型, 基因集富集分析表明, 這些lncRNA介導的訊號通路可能透過干擾腫瘤壞死因子a/核因子κB、IL-2/訊號轉導因子和轉錄啟用因子5、細胞因子/細胞因子受體調控肝癌免疫微環境。Spearman相關分析表明, 靜息記憶CD4+ T淋巴細胞、卵泡輔助T淋巴細胞、調節性T淋巴細胞、M0巨噬細胞等浸潤性免疫細胞亞型在高危組和低風險組之間存在顯著差異。研究結果為肝癌中與鐵死亡相關的lncRNA提供了一個有前景的見解, 併為患者的預後和免疫治療提供了一個個性化的預測工具。
4基於細胞自噬特徵基因的風險預測模型
細胞自噬是真核生物中進化保守的對細胞內物質進行週轉的重要過程。該過程中一些損壞的蛋白或細胞器被雙層膜結構的自噬小泡包裹後, 送入溶酶體或液泡中進行降解並得以迴圈利用。在腫瘤中, 自噬可能在腫瘤發生的早期階段發揮抑制作用。然而, 越來越多的證據[31-32]表明, 在已經形成的腫瘤中, 自噬可以幫助應對細胞內環境壓力的變化, 如缺氧、營養缺乏等惡習環境, 從而促進腫瘤的存活。Huo等[33]在HCC患者中共發現62個差異表達的自噬相關基因(autophagy-related gene, ARG)。單因素和多因素迴歸確定了5種與肝癌患者OS相關的ARG(HDAC1、RHEB、ATIC、SPNS1和SQSTM1)。重要的是, 基於ARG的風險評分是肝癌預後的獨立風險因素。此外, 預後風險模型的AUC為0.747, 表明該模型在預測HCC預後方面具有較高的準確性。有趣的是, 在HCC細胞系中, 風險相關的ARG與化療藥物敏感性相關。Yang等[34]共鑑定出27個差異表達ARG, 透過Cox迴歸和LASSO迴歸分析, 鑑定出3種OS相關ARG (SQSTM1、HSPB8和BIRC5)。基於這3種ARG建立預後預測模型, 在TCGA佇列和GEO驗證佇列中, 風險評分高的HCC患者預後較差, 風險評分曲線的AUC分別為0.756和0.672。此外, 校正曲線和C指數表明, 基於ARG的風險預測模型的預測能力較好, 可能是預測HCC患者預後的一種有前景的工具。Cao等[35]鑑定出與細胞自噬相關的13個基因對(PRKCD/TP53、BAX/GABARAPL1、ATIC/PARP1、CDKN2A/ERBB2、BIRC6/FOXO1、BAK1/DAPK1、PINK1/RAB24、GDAC6/HGS、CX3CL1/HSPB8、DLC1/HSPB8、APOL1/EIF4EBP1、ARNT/HIF1A、CX3CL1/NPC1)。Kaplan-Meier曲線分析表明, 高危組患者的OS明顯差於低危組, 並發現自噬相關的風險評分與免疫細胞的浸潤有關。Wu等[36]篩選出78個差異表達的自噬相關lncRNA, 並使用4個與肝癌預後相關lncRNA(LUCAT1、AC099850.3、ZFPM2-AS1和AC009005.1)建立預後模型, 可作為HCC患者的獨立預後因素, 並且1、3、5年生存率的預測效率高於其他臨床病理因素(AUC分別為0.764、0.738、0.717)。此外, 生物資訊學分析結果顯示, LUCAT1和ZFPM2-AS1可能分別透過HSA-Mir-495-3p/DLC1和HSA-Mir-515-5P /DAPK2軸影響HCC的自噬活性。Yang等[37]篩選出7個自噬相關lncRNA(PRRT3-AS1、RP11-479G22.8、RP11-73M18.8、LINC01138、CTD-2510F5.4、CTC-297N7.9、RP11-324I22.4), Kaplan-Meier分析表明, 風險評分低的患者預後明顯優於風險評分高的患者, 該風險評分的預後預測準確度(AUC=0.786)顯著高於ALBI, Child-Pugh, AFP和AJCC_stage。
5基於N6-甲基腺苷(m6A)RNA甲基化調控因子的風險預測模型
表觀遺傳是研究基因的核苷酸序列不發生改變的情況下, 基因表達的可遺傳變化。甲基化修飾佔所有RNA修飾的60%以上, 而m6A是信使RNA、microRNA和長鏈非編碼RNA中最常見的內部修飾, 在轉錄、加工和代謝中起著關鍵的調節作用。m6 A修飾與腫瘤增殖、分化、腫瘤發生、增殖、侵襲和轉移有關, 在惡性腫瘤中起癌基因或抑癌基因的作用[38]。Zhang等[39]基於13個m6 A RNA甲基化調控因子的表達水平, 透過共識聚類分析, 識別出兩個亞群(聚類1和2)。與聚類1相比, 聚類2預後較差, 且與較高的組織學分級和病理分期顯著相關。此外, 聚類2在癌症相關通路中顯著富集。研究人員進一步構建基於5個m6 A RNA甲基化調控因子(ZC3H13、KIAA1429、METTL3、YTHDF1、YTHDF2)的肝癌預後風險預測模型, 並在GEO資料集中得到成功驗證。最後, 建立了基於年齡、性別、組織學分級、病理分期和風險評分的綜合預測模型, 能夠提高模型的預測能力。Xu等[40]篩選出19個m6 A調控因子, 根據m6 A調控因子的共識聚類, 被分為2組(聚類1和聚類2)。研究發現m6 A調控因子在聚類1中表達上調。與聚類2相比, 聚類1與較高的程式性死亡配體1表達水平、較低的免疫評分、較差的預後和免疫細胞浸潤有關。基於單變數Cox和LASSO迴歸分析, 識別出5個m6 A調控因子(WTAP、METTL3、HNRNPC、YTHDF1、YTHDF2), 研究發現高危組與較高的程式性死亡配體1表達水平、較高的分級和較差的OS密切相關。在訓練資料集中, 1、3、5年的AUC分別達到0.77、0.67和0.68。在驗證資料集中, 1、3、5年的AUC分別為0.7、0.63和0.55。基因集富集分析顯示MTOR訊號通路和WNT訊號通路與聚類1和高危組相關。
綜上所述, 研究表明m6 A調控因子與HCC的腫瘤免疫微環境顯著相關。基於m6 A調控因子的風險評分可以預測HCC患者的預後, 為提高免疫治療療效提供新的治療靶點。
6小結
TCGA和GEO資料庫相關研究尚有一定的侷限性。首先, 這些研究僅僅是回顧性研究, 缺乏前瞻性研究。第二, 目前大多數研究基於免疫基因特徵基因、代謝基因特徵基因、鐵死亡基因特徵基因、細胞自噬基因特徵基因、m6 A RNA甲基化調控因子等方面, 還有很多在HCC中起重要作用的預後基因尚有待進一步挖掘。第三, 目前篩選出的基因缺乏基礎實驗的進一步驗證。因此, 有必要進一步探索更多的肝癌早期檢測分子標誌物和影響肝癌預後的分子標誌物, 以提高早期肝癌檢測率和鑑別出肝癌預後高危人群;有必要進一步開展嚴格的前瞻性和多中心臨床試驗, 驗證風險預測模型的準確性和有效性;有必要進一步透過基礎實驗對篩選出的分子標誌物進行驗證, 尋找肝癌的潛在治療靶點。目前, 處於大資料快速發展的時代, 對大資料進行挖掘和分析有助於探索重要的生物學規律。因此, 生物資訊學對於醫學和生物學的發展極其重要, 在生物醫學領域中具有廣闊的應用前景。
檢視參考文獻目錄或免費下載PDF
http://www.lcgdbzz.org/cn/article/doi/10.3969/j.issn.1001-5256.2022.01.002
方國旭, 張清華, 黃永迎, 等. 生物資訊學在肝細胞癌風險預測中的應用[J]. 臨床肝膽病雜誌, 2022, 38(1): 15-19.
本文編輯:林姣
公眾號編輯:邢翔宇
全網首發|《臨床肝膽病雜誌》2022年第1期“大資料與人工智慧賦能肝臟外科數字診療新時代”重點號(執行主編:劉景豐)
述評|劉景豐:人工智慧在原發性肝癌外科治療中的應用現狀與展望