|
科研快訊 | Nature子刊:多界水平微生物分析可識別不同隊列中結(jié)直腸癌的細菌-真菌相互作用和生物標志物(國人佳作)導(dǎo)讀 2022年1月27日,中山大學(xué)附屬第六醫(yī)院,復(fù)旦大學(xué)人類表型組研究院,中國科學(xué)院上海營養(yǎng)與健康研究所,同濟大學(xué)生命科學(xué)與技術(shù)學(xué)院和上海交通大學(xué)醫(yī)學(xué)院公共衛(wèi)生學(xué)院多單位聯(lián)合在Nature Microbiology上發(fā)表題為《Multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts》的文章。盡管最近的研究對腸道微生物群和結(jié)直腸癌(CRC)之間的關(guān)系方面的理解取得了進展,但在不同隊列的結(jié)直腸癌中,跨界水平的腸道微生物失調(diào)還有待研究。在本研究中,我們采用來自8個不同地理區(qū)域的1,368份CRC宏基因組學(xué)樣本數(shù)據(jù)集,探究4個微生物界水平的改變。綜合分析確定了20種古生菌、27種細菌、20種真菌和21種病毒為每個界水平診斷模型。然而,我們的數(shù)據(jù)顯示,用多界水平的標志物構(gòu)建的模型具有更高的診斷準確性,特別是添加真菌物種。具體來說,包括11個細菌、4個真菌和1個古菌特征的16個多界水平的ROC曲線標志物,在診斷CRC方面取得了較好的效果(受試者ROC曲線曲線下面積AUROC = 0.83),并且在3個獨立的隊列中保持了準確性。生態(tài)網(wǎng)絡(luò)的Co-abundance分析揭示了細菌和真菌之間的聯(lián)系,例如Talaromyces islandicus和Clostridium saccharobutylicum。使用鳥槍宏基因組測序數(shù)據(jù),探索了微生物功能潛力的預(yù)測能力,并在CRC患者中觀察到D-氨基酸代謝和丁酸鹽代謝升高;诠δ苄訣ggNOG基因的診斷模型獲得了較高的準確度(AUROC = 0.86)?偟膩碚f,我們的研究結(jié)果揭示了CRC相關(guān)的微生物類群在不同人群中普遍存在,并證明了多個界水平和功能標志物作為CRC診斷工具的適用性,以及作為治療CRC的潛在治療靶點的可能性。 論文ID 原名:Multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts 譯名:多界水平微生物分析可識別不同隊列中結(jié)直腸癌的細菌-真菌相互作用和生物標志物 期刊:Nature Microbiology IF:17.745 發(fā)表時間:2022.01.27 通訊作者:朱立新,陳興棟,張國慶,朱瑞新,王慧 通訊作者單位:中山大學(xué)附屬第六醫(yī)院,復(fù)旦大學(xué)人類表型組研究院,中國科學(xué)院上海營養(yǎng)與健康研究所,同濟大學(xué)生命科學(xué)與技術(shù)學(xué)院,上海交通大學(xué)醫(yī)學(xué)院公共衛(wèi)生學(xué)院 DOI號:10.1038/s41564-021-01030-7 實驗設(shè)計 收集來自全世界9個地理區(qū)域的糞便鳥槍宏基因組測序數(shù)據(jù),共計1,368份樣本。包括奧地利(AUS,PRJEB7774)、法國(FRA,PRJEB6070)、德國(GER,PRJEB27928)、中國(CHN_HK,PRJEB10878)和日本(JPN,PRJDB4176)以及驗證數(shù)據(jù),包括美國(USA,PRJEB12449)、意大利(ITA,SRP136711)和中國(CHN_SH,內(nèi)部)。根據(jù)宏基因組測序數(shù)據(jù),進行微生物分類和功能鑒定分析、基于微生物特征標志物的CRC診斷模型的構(gòu)建與評價、多界水平物種Co-abundance分析、物種和功能之間相關(guān)性分析以及與CRC相關(guān)基因的qPCR分析。 結(jié)果
圖1. 本研究納入的CRC患者人群及其相關(guān)腸道微生物組的概述。(a)來自全世界8個患者群體的共計1,368個樣本的糞便鳥槍宏基因組數(shù)據(jù);數(shù)據(jù)包括奧地利(AUS,PRJEB7774)、法國(FRA,PRJEB6070)、德國(GER,PRJEB27928)、中國(CHN_HK,PRJEB10878)和日本(JPN,PRJDB4176)。驗證數(shù)據(jù)包括美國(USA,PRJEB12449)、意大利(ITA,SRP136711)和中國CHN_SH,內(nèi)部),括號內(nèi)的數(shù)字代表樣本容量;(b)用Shannon指數(shù)表示CRC患者(紅色,n= 491)和對照組(藍色,n = 494)的α多樣性;(c)基于Bray-Curtis距離對5個隊列樣本進行主坐標分析(PCoA),結(jié)果表明,組間(P = 0.001)和組間(P = 0.001)微生物組成存在差異;(d)集合圖顯示了通過MaAsLin2在每個隊列中識別的不同細菌種類的數(shù)量,并通過數(shù)據(jù)集的組合共享,每一列上的數(shù)字表示不同物種的數(shù)量,右邊的集合大小表示每個隊列中的差異物種數(shù)量,點連接表示連通隊列中的共同差異物種;(e)集合圖顯示了通過MaAsLin2在每個隊列中識別的不同真菌種類的數(shù)量,并通過數(shù)據(jù)集的組合共享,每一列上的數(shù)字表示不同物種的數(shù)量,右邊的集合大小表示每個隊列中的差異物種數(shù)量,點連接表示連通隊列中的共同差異物種。 圖2. 不同人群間的差異物種及每個界水平特征構(gòu)建模型的預(yù)測性能。(a)系統(tǒng)發(fā)育樹顯示了不同真菌物種的集合(共231種),按子囊菌門、擔(dān)子菌門、壺菌門、隱真菌菌門、微孢子門、毛菌門和捕蟲霉亞門進行分類;外圈標記為顯著差異種(P < 0.05,雙側(cè)檢驗);meta分析結(jié)果通過MMUPHin進行識別,橙色表示物種增加,綠色表示物種減少;紫色星標記的物種表示在分類模型的物種;條形圖顯示了各隊列標記特征的豐富度變化;(b)熱圖顯示了每個隊列中使用單一界水平特征標志物建立的模型的AUROC值,*P = 0.001;(c)箱線圖顯示了使用單一界水平特征標志物的模型的隊列之間AUROC值,數(shù)據(jù)通過IQRs顯示,中間值為黑色水平線,須狀線延伸至1.5× IQR (n = 4)范圍內(nèi)的最極值點。 圖3. 結(jié)合多界水平的特征標志物構(gòu)建的預(yù)測模型的性能以及這些基本特征標志物在每個地理隊列中的綜合重要性。(a)熱圖顯示了在每個隊列中用多界水平特征標志物建立的模型的AUROC值,A:古菌;B:細菌;F:真菌;V:病毒,*p = 0.001;(b)箱線圖顯示了使用多界水平特征標志物的模型的隊列之間AUROC值,數(shù)據(jù)通過IQRs顯示,中間值為黑色水平線,須狀線延伸至1.5× IQR (n = 4)范圍內(nèi)的最極值點;(c)通過使用隨機森林“Gini importance”方法對每個隊列數(shù)據(jù)集的預(yù)測性能進行交叉驗證,對每個列出的特征標志物(屬于四個界水平模型)的重要性進行估計,紅色表示物種增加,藍色表示CRC患者與對照組相比物種減少;(d)由16個多界水平特征標志物組成的AUROC模型矩陣,用于CRC檢測,*P = 0.001;(e)由16個多界水平特征標志物組成的AUROC模型矩陣,用于早期的CRC檢測,*P = 0.001。 圖4. CRC患者與對照組多界水平物種之間的Co-abundance相關(guān)性。(a)在CRC患者和對照樣本中,包含來自所有四個界水平的組合差異物種的Co-abundance網(wǎng)絡(luò),節(jié)點的顏色表示細菌(綠色)、真菌(橙色)、古菌(藍色)和病毒(紫色);絕對相關(guān)性高于0.3,紫色線條表示正相互作用,灰色線條表示負相互作用;(b)對照組和CRC患者的中度Co-abundance網(wǎng)絡(luò),絕對相關(guān)性高于0.6;邊緣根據(jù)中等網(wǎng)絡(luò)中的關(guān)聯(lián)大小進行著色,節(jié)點的顏色表示細菌(綠色)、真菌(橙色)、古菌(藍色)和病毒(紫色),紫色線條表示正相互作用,灰色線條表示負相互作用。 圖5. 由KO基因構(gòu)建的CRC相關(guān)功能改變模型及其性能研究。(a)箱線圖(左)顯示了每個隊列中對照(藍色條)和CRC患者(紅色條)代謝通路的相對豐度,樣本數(shù)為AUS(CRC患者= 46,對照 = 63),F(xiàn)RA(CRC患者= 53,對照 = 61),GER(CRC患者= 60,對照 = 65),CHN(CRC患者= 80,對照 = 86),JPN(CRC患者= 258,對照 = 251);熱圖(中)顯示了綜合meta分析,確定了在五個地理人群中檢查的每個代謝途徑中顯著改變的KO基因表達,單元格顏色和強度代表KO基因的豐度倍數(shù)變化,通過MMUPHin鑒定顯著差異KO基因(P< 0.05),P值顯示在單元格中;(b)比較對照組(n= 494)和CRC患者組(n = 491)中bdhA/b(K00100)、oraE(K17898)和oraS(K17899)功能基因的標準化的相對豐富度,以年齡、體重指數(shù)和性別為協(xié)變量,采用MMUPHin方法檢測統(tǒng)計學(xué)意義;(c和d)通過gDNA qPCR檢測,CRC患者(n= 24) bdhA和bdhB在丁酸鹽代謝途徑(c)和oraE和oraS在D-精氨酸和D-鳥氨酸代謝途徑(d)的表達均高于對照組(n= 24);數(shù)據(jù)表示為平均值± s.d,三個生物學(xué)重復(fù);(e)用175個重要的EggNOG基因構(gòu)建的模型的AUROC矩陣,*P= 0.001。 |