10.3760/cma.j.cn112338-20220616-00536
自组织神经网络在长寿基因研究设计中的应用:巢式病例对照研究样本选择
目的:应用自组织神经网络为长寿研究选择对照组,以改进长寿基因研究设计。方法:本研究基于2013年中国慢性病及其危险因素监测与全国死因监测数据融合形成的自然人群队列,纳入年龄≥90岁的老年人或年龄<80岁且已死亡的汉族人群(对照组),排除死于伤害、传染病、寄生虫病和恶性肿瘤的个案,利用自组织神经网络方法,通过多次迭代和自组织聚类,选取人口学特征、患病、生活习惯、社会行为、精神心理等多方面因素相似的≥90岁老年人和对照组,开展全基因组测序。研究采用PLINK 1.9软件评估测序数据质量,开展常染色体上的单核苷酸多态性(SNPs)和长寿的logistic回归,用Q-Q图可视化SNPs与长寿关联的
P值。
结果:研究从基线177 099例调查对象中筛选出1 019例人群基因组样本开展全基因组测序,其中长寿组517例、对照组502例。长寿组和对照组在吸烟、饮酒、饮食、睡眠时长、血脂水平和自评口腔健康状况总体相似,在社会经济状况、身体活动时间、BMI和自评健康状况差异较大。全基因组测序结果经质控,4 618 216个SNPs进入关联分析。长寿组相关SNPs分析结果
P值的Q-Q图显示在
P值1e-4的区域有明显小于预期
P值的富集,
P<1e-7区域也检出了显著信号。
结论:自组织神经网络可综合考虑社会经济和生活行为方式的影响,从大规模自然人群队列中有真实死亡年龄和死亡原因的样本中选取长寿对照样本,提高长寿基因组关联分析检验效能。本研究为大规模自然人群队列筛选样本开展巢式病例研究提供了方法学参考。
长寿、队列、巢式病例对照、全基因组关联研究
44
国家自然科学基金专项81941025;国家重大公共卫生服务项目81941025;Special Project of National Natural Science Foundation of China;National Major Public Health Service Projects
2023-05-30(万方平台首次上网日期,不代表论文的发表时间)
共9页
326-334