學(xué)術(shù)不端文獻查重檢測系統 多語(yǔ)種 圖文 高校 期刊 職稱(chēng) 查重 抄襲檢測系統
今天跟大家分享的是2020年8月發(fā)表在Biomolecules雜志(IF=4.082)上的一篇文章:”Colorectal Cancer Prediction Based on Weighted Gene Co-Expression Network Analysis and Variational Auto-Encoder”。在文章中作者通過(guò)加權基因共表達網(wǎng)絡(luò )分析(WGCNA)以及深度學(xué)習神經(jīng)網(wǎng)絡(luò )變異自動(dòng)編碼器(VAE)分別用于提取大腸癌中兩種不同維度的特征構建分類(lèi)器,通過(guò)支持向量機來(lái)探討分類(lèi)器的魯棒性,診斷精確率高達0.9692。該方法為WGCNA共表達分析聯(lián)合深度學(xué)習神經(jīng)網(wǎng)絡(luò )預測疾病進(jìn)展提供新的思路
Colorectal Cancer Prediction Based on Weighted Gene Co-Expression Network Analysis and Variational Auto-Encoder
一.研究背景
大腸癌(CRC)是一種惡性腫瘤,其發(fā)病率在全球腫瘤患者中排名第三,死亡率高居第二。盡管現代醫療技術(shù)進(jìn)步顯著(zhù),但大多數CRC患者中晚期預后仍不好。因此,需要對CRC進(jìn)行有效的早期診斷和構建新的預后指標。一種有效的特征提取方法可以避免模型過(guò)度擬合的問(wèn)題,特征提取方法是影響分類(lèi)器性能的關(guān)鍵因素,可提高微陣列基因表達數據預測CRC的準確性
二.結果解讀
1.準備GEO數據集并進(jìn)行數據矯正
選擇來(lái)自數據集GSE8671,GSE9348和GSE23878的基因表達數據(正常組和癌癥組)進(jìn)行分析。PCA結果顯示,在數據矯正前GSE23878與其他三個(gè)數據集有顯著(zhù)差異,而批次矯正后基本上消除了四個(gè)數據集的批處理效應
2. WGCNA進(jìn)行特征提取
根據臨床表型(normal vs tumor)作為性狀,與全局網(wǎng)絡(luò )構建共表達網(wǎng)絡(luò )分析。結果顯示,所有樣品聚集在一起以形成17個(gè)模塊,其中最小的模塊包含36個(gè)基因。這些模塊最多包含6377個(gè)基因,每個(gè)模塊平均814個(gè)基因
3.WGCNA核心基因的界定
根據模塊與性狀之間的相關(guān)性,選取與性狀相關(guān)性系數最大的基因作為后續研究對象(MEturquoise模塊),共包含6865個(gè)基因。后續通過(guò)模塊內置函數GS > 0.5 & MM > 0.8 以及差異表達情況共篩選出165個(gè)基因,根據K值選取前10個(gè)基因作為關(guān)鍵基因