[摘 要] 目的:采用生物信息学方法探索结肠癌组织中与焦亡相关的基因,并探讨其与预后的关系,为结肠癌患者提供新的治疗靶点。方法:分别从TCGA数据库、GEO数据库中下载结肠癌患者的基因表达、转录数据及临床数据。利用R软件提取出TCGA转录数据中细胞焦亡基因的表达量,并找到差异表达基因,构建差异表达基因的蛋白互作网络。采用单因素分析、聚类分析将基因进行分型,比较两种亚型之间生存差异,得到预后相关基因。然后通过Lasso回归分析、交叉验证及优化,得到基因系数(Coef系数),构建一种结肠癌预后的预测模型。根据该预测模型计算出TCGA样本的中位风险得分,将样本分为高、低风险组。以GEO样本作为验证组,分别对TCGA、GEO样本进行生存分析(Kaplan-Meier分析)、绘制ROC曲线、绘制风险曲线、PCA和t-SNE分析。结合模型中的风险评分,分别采用单因素及多因素分析来寻找结肠癌患者的独立预后因素。对高、低风险组进行GO和KEGG分析。最后行ssGSEA分析,对每个样本进行免疫细胞及免疫相关功能打分,得到高、低风险组之间免疫细胞及免疫细胞相关功能的差异。结果:共鉴定了52个焦亡基因在结肠癌及正常结肠组织中的表达,筛选出40个差异基因。通过Cox回归和Lasso回归分析,构建了一个基于15个基因的结肠癌预后风险预测模型,并将结肠癌患者分为高、低风险两组,两组之间生存有明显差异(P<0.001)。根据预测模型计算出TCGA样本的风险评分,并得到的中位风险评分,利用GEO数据库结肠癌患者进行验证,结果显示高低风险组之间生存率存在明显差异(P=0.013)。发现预测模型计算出的风险评分是预测结肠癌患者生存的独立预后因素。对差异基因进行GO富集分析、KEGG富集分析、ssGSEA分析结果显示,高风险组患者免疫细胞浸润明显减少。结论:通过生物学信息方法构建了一个基于15个基因的结肠癌患者预后风险预测模型,这些基因在结肠癌免疫中也发挥重要作用。