本报讯(见习记者江庆龄)复旦大学附属华山医院教授郁金泰、毛颖团队与复旦大学类脑智能科学与技术研究院研究员程炜、教授冯建峰团队合作,全面绘制了人类健康与疾病蛋白质组图谱。他们结合人工智能大数据分析方法构建了疾病诊断预测模型,并发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。11月22日,相关研究发表于《细胞》。
大规模蛋白质组学研究能够深化对健康和疾病的理解,但现有研究仍集中于有限的疾病结局,蛋白与健康和疾病之间的关系还存在许多未解之谜。
研究团队深入分析了53026名个体的血浆蛋白质组数据,纳入了2920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关特征,跨越了14.8年的中位随访期,揭示了168100个蛋白质-疾病关联和554488个蛋白质-表型关联。其中,超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性。
利用蛋白质组学特征对660种疾病进行聚类,能够重新审视疾病的类别和亚型。例如,按照传统疾病分类策略,各种痴呆亚型被划分到同一疾病亚群,而亚群还包含精神、内分泌、心血管等系统疾病。结合蛋白质组学特征,研究团队揭示了该亚群的特征性生物学功能,进而解释了患者身上同时出现看似不相关症状的缘由。
研究团队进一步识别出具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值(接受者操作特征曲线下方面积值)超过0.80,将有助于提高疾病的早期诊断率。值得一提的是,GDF15被发现是预测和诊断多种疾病的关键蛋白,可能成为一个重要生物标志物。EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多个疾病中表现出良好的预测和诊断性能。
同时,研究人员确定了474个具有潜在因果关联的蛋白质-疾病对,为25个已知靶点的37种潜在药物提供了重新利用的机会,并确立了26个具有治疗潜力且安全性良好的新靶点,为老药新用和新药研发提供了重要线索。基于研究结果,研究团队建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas,以期帮助科学家更好理解疾病的生物学机制,加速疾病生物标志物、预测诊断模型和治疗靶点的开发。
相关论文信息:
https://doi.org/10.1016/j.cell.2024.10.045