基于儿童遗传病多中心大数据,建立智力残疾类疾病表型图谱与基因变异数据库

科学前沿 2023-11-30

服务背景:在我国,单基因病临床资源分布不平衡。在不同区域不同医院之间,单基因病临床资源分布并不平衡,存在巨大差异。这些不平衡体现在:一是,由于单基因病种类繁多,不同医院擅长的单基因病种类存在差异;二是,单基因病诊疗涉及到诊断、治疗和康复等多个环节,不同医院的优势学科存在差异;三是,不同医院的遗传检测条件和环境存在差异,只有条件好的医院才拥有自己的测序平台;四是,复杂遗传病病例和较高诊疗水平医生的聚集分布并不一致。国家人类生殖和健康资源库依托PGenomics平台建立国家儿童遗传病基因变异与表型识别数据中心,对表型信息、代谢组、基因组信息进行标准化采集,积累了丰富的数据及生物样本资源,为智力残疾类疾病构建表型图谱和基因变异数据库提供资源基础。

服务对象:全国范围内临床医疗机构、科研院所等。

服务情况:基于儿童遗传病多中心收集和整理的表型组和基因组大数据,根据智力残疾、轻度智力残疾、中度智力残疾、重度智力残疾等标准化表型为关键词,筛选出智力残疾类疾病患儿,根据标准化表型,建立了儿童智力残疾类疾病的表型谱,基于PGenomics智能分析解读工具实现的,在全基因组水平计算每个变异在病例组和对照组的频率,并进行关联分析、汇总分析,儿童智力残疾类疾病变异分析包括SNP/Indel、CNV的分析,建立了儿童智力残疾类疾病基因变异数据库。依托PGenomics平台,面向全国范围内临床医疗机构、科研院所等开放共享智力残疾类疾病构建表型图谱和基因变异数据库。

取得成效:

筛选出的66个智力残疾类疾病患儿中,42.42%的患儿婴儿期发病(该数字可能保守,部分患儿没有采集该表型);中度智力残疾所占比例最多,为19.70%;轻度和重度智力残疾各占15.15%,极重度智力残疾占9.09%。患儿伴发表型中,运动发育迟缓最多,占62.09%,包括运动发育迟缓和粗大运动发育迟缓;其次是语言发育迟缓,占34.85%。其他常见伴发表型包括肌张力减退(13.64%)、小头畸形(13.64%)、癫痫发作(13.64%)、脑发育不全(13.64%)、肌张力增高(12.12%)。儿童智力残疾类疾病的表型谱可见面部畸形,包括眼距过宽、高腭、小下颌畸形、耳位异常、耳廓异常、鼻梁异常、并指(趾)畸形、双侧眼睑下垂。精神行为类异常表型包括癫痫发作、孤独症、自闭症行为、情绪不稳、社交智力残疾类疾病等。利用汇总分析工具共获得了1003718个遗传变异,其中143223个为公共数据库未报道的变异,占变异总数目的14.3%。按照变异类型统计,SNP变异最多,865266个,占总变异数目的86.21%;其次是片段缺失变异,62891个,占总变异数目的6.27%;其次是片段插入型变异,45295个,占总变异数目的4.51%,最后是微小插入/缺失型变异,为29071个,占2.90%。

在此基础上,建立了儿童智力残疾类疾病基因变异数据库,并通过在线检索实现变异循证溯源,方便用户查询感兴趣变异在公共数据库、PGenomics数据库、儿童智力残疾类疾病基因变异数据库的频率和统计学检验结果。同时,还展示了携带该变异的患儿,方便研究者之间开展深入合作。

图1 儿童智力残疾类疾病基因变异数据库变异类型分布

图2 儿童智力残疾类疾病基因变异数据库变异循证示例