%0 Journal Article %A 郭志强 %A 张立友 %A 许利娟 %A 宫美娜 %A 韩 笑 %T 基于公共基因表达数据库和临床样本队列构建白内障预测模型 %D 2023 %R %J 生命科学研究 %P 447-454 %V 27 %N 5 %X 基于基因表达数据库(Gene Expression Omnibus, GEO)筛选差异基因, 建立白内障预测模型并对其进行评价。首先, 采用生物信息学方法从GEO中筛选出与白内障相关的芯片数据, 并采用GEO2R软件和NetworkAnalyst工具分析得到最显著的差异表达基因。然后, 依托我院健康管理中心白内障筛查队列, 采用Cox比例风险回归构建白内障发病风险预测模型, 绘制列线图, 通过C指数、校准曲线、受试者操作特征(receiver operating characteristic, ROC)曲线、决策曲线分析(decision curve analysis, DCA)评价模型的区分度、校准度、预测能力和获益情况。结果显示, 在GSE5645、GSE193629和GSE161701数据集中, 鱼精蛋白1 (protamine 1, PRM1)为高表达基因, 五羟色胺2C受体(serotonin 2C receptor, HTR2C)为低表达基因; 白内障组和非白内障组在年龄、体重、收缩压、对比敏感度(contrast sensitivity, CS)、客观散射指数(objective scatter index, OSI)、调制传递函数截止频率(modulation transfer function cut off, MTF cut off)、斯特列尔比(Strehl ratio, SR)、动态视力、PRM1、HTR2C和CX46等指标的差异均有统计学意义(P<0.05); 预测模型最终纳入年龄、OSI、MTF cut off、PRM1和HTR2C共5个变量(P<0.05), 建立的预测模型为log[h(t)/h0(t)]=2.689 2+0.012×年龄+1.320×OSI-0.041×MTF cut off+ 0.029×PRM1-6.549×HTR2C; 模型C指数为0.875, 置信区间为0.862~0.886; 模型的预测概率与实际概率接近; ROC曲线下面积(area under the curve, AUC)为0.904 (95% CI: 0.884~0.923), 灵敏度和特异度分别为82.4%和92.3%; 平均AUC为0.911; 当模型的高风险阈值为0.25~0.75时, 净收益率>0。本研究建立的白内障临床预测模型具有很好的区分度、校准度、预测能力、内部有效性和临床效益, 具备较高的临床应用价值。 %U https://smkx.hunnu.edu.cn/CN/abstract/article_2540.shtml