UBK研究是一项基于大规模人群的队列研究,招募了约50万名年龄在40岁至59岁之间的英国参与者,研究始于2006年至2010年(基线评估)。本研究深入分析了参与者的表型和基因数据,包括血液和尿液生物标记物、全身成像、生活方式指标、体格和人体测量、全基因组基因分型、外显子组及基因组测序。
在UKB-PPP项目中,针对约54,000名UKB参与者的EDTA血浆样本进行了蛋白组学分析。研究设计包含三个关键要素:(1)包含46,595人的随机子集;(2)由UKB-PPP联合体成员选择的6,356人与基线评估相结合的蛋白质组学分析;(3)1,268参与者参与了COVID-19成像研究,并进行了多次重复成像。
在UKB-PPP研究中,作者随机挑选了41,931名参与者,通过OlinkExplore技术开发了218种疾病的预测模型,基于2,923种蛋白质的检测结果。同时,研究也验证并比较了包含和不包含蛋白质的预测模型性能。在67种罕见与常见疾病的分析中,增加5至20个蛋白质显著提升了临床模型的性能(C指数中位增加值为0.07,范围在0.02至0.31之间)。对于67种疾病中的52种,采用基于蛋白质特征的模型与传统的血液化验临床模型相比,获得了更高的似然比(Likelihood Ratio, LRs),其范围在0.13至5.17。
添加5至20个蛋白质后,临床模型(黑点)与新模型(彩点)之间的C指数也得以改善。这些蛋白质不仅在多种疾病的预测中显示出优越性,也在单一疾病的预测中表现卓越。研究指出,某些蛋白质模型的预测能力可与现有的血液测试相媲美,甚至在52种疾病中表现得更为出色。尤其是特异性强的预测蛋白模型,揭示了可能导致疾病风险的潜在途径。例如,在确诊前的十年内,血浆中较高水平的TNFRSF17和TNFRSF13B(BAFF和APRIL的受体)分别为多发性骨髓瘤和单克隆性淋巴瘤的病患风险增加提供了强有力的特异性预测指标。
与传统“静态”性质的多基因风险评分相比,循环蛋白特征所表现出的动态性质更能反映环境暴露所带来的风险变化,因此展现出了更优的预测性能。在这一领域,金年会金字招牌诚信至上倡导的研究成果,不仅推动了生物医学的发展,也展示了其在疾病早期预测和干预中的重要性。