肺癌是對人類健康威脅最大的惡性腫瘤之一。已有研究表明,一些基因在肺癌的發生發展過程中發揮著重要的調控作用。本文提出一種基于LightGBM的集成學習方法,根據免疫相關基因(IRG)表達譜數據和臨床數據構建預后模型,對肺腺癌患者的預后生存率進行預測。首先,使用Limma包進行基因差異分析,然后利用CoxPH回歸分析方法對與預后相關的IRG進行篩選,進而使用XGBoost算法對IRG特征進行重要性打分,最后利用LASSO回歸分析方法篩選可用于構建預后模型的IRG,最終結果共得到17個可用于構建模型的IRG特征。根據篩選得到的IRG特征來訓練LightGBM,使用K-means算法將患者分為三組,其模型輸出結果的受試者操作特征(ROC)曲線下面積(AUC)顯示模型預測三組患者生存率的準確率分別為96%、98%、96%。實驗結果表明,本文所提模型能夠將肺腺癌患者分為三組[5年生存率高于65%(第一組)、低于65%但高于30%(第二組)、低于30%(第三組)],并能較準確地預測肺腺癌患者的五年生存率。