安诺优达生物样本信息数据库科研成果展示

安诺优达基因科技(北京)有限公司总部位于北京,是中国基因组行业的知名企业,公司于2012年成立,专注于新一代基因组学技术在人类医学健康和生命科学研究两大领域的产业化应用。

在生命科学研究领域,该公司在基因组学、转录组学和表观遗传学等多组学水平与国内外高校院所和研发机构广泛开展科研合作,涉及领域包括人类重大疾病基础研究、动植物分子育种、遗传与进化、环境微生物和生态等,并且在基因表达分析、单细胞技术、染色体Hi-C技术等领域形成特色优势,在Nature、Science、Elife、Developmental Cell、Genome Biology、Bioinformatics 等国际期刊发表学术论文超过100篇。

在医学健康领域,该公司汇集了国内外优秀的基因组学及医学专家,有多学科人才组成的合理技术梯队,并已在生育生殖健康、肿瘤个性化诊疗、罕见遗传病和基因体检四大方向形成了优秀的产品体系和品牌效应。其中,无创产前DNA检测技术已经产生了良好的社会价值,该技术也被公认为全球基因组技术产业化应用的第一个成功典范。

安诺优达基因科技有限公司凭借多年来在基因测序领域的累积,建立了生物样本数据库,截止目前已积累样本621535例。包括:循环游离核酸遗传资源库、胚胎组织遗传资源库、分子肿瘤遗传资源库、随机健康人群遗传资源库,样本类型包括:羊水、外周血、流产组织、脐血、新鲜组织、石蜡包埋组织、唾液等。

除上述生物样本库外,还依托于高效的测序平台、专业的分析团队、丰富的项目经验,建立了50万中国人群的基因组数据库-Annoroad Typical Chinese Genomes数据库(以下简称ATCG Database),现阶段ATCG Database将主要先用于过滤测序数据中在中国人群中的高频突变,筛选针对于中国人的疾病关联位点。后期该数据库将以每个月40000份样本数量不断扩充数据库的样本数量和数据量,为针对中国人的疾病研究提供更标准、更权威的参考。在未来,将结合ATCG Database,圈定适合中国人的特异性变异位点,为下游疾病诊断锁定致病基因和生物靶点,着眼临床转化,制定精准检测panel,开发相关靶药,协助医生制定个体化的治疗方案,真正将技术转化于临床。

成果展示一

Xist-dependent imprinted X inactivation and the early developmental consequences of its failure

出版源: 《Nature Structural & Molecular Biology》  2017,24(3):226-233
被引量: 7(截止2017年9月7日)

背景: X染色体失活(XCI)是指雌性哺乳类细胞中,两条X染色体的其中之一失去活性的现象,过程中X染色体会被包装成异染色质,进而因功能受抑制而沉默化。Xist RNA是能引发X染色体沉默的长片段ncRNA,尽管Xist对XCI是必要的,但其对胚胎植入前的印记XCI的精确作用尚存争议。

方法: 利用单细胞转录组测序(scRNA-seq)技术,在小鼠早期胚胎的不同阶段,对完全依赖于Xist介导的印记XCI进行了完整探索。

发现: 本研究证实启动印记的X染色体失活完全需要Xist的调控,其剂量补偿失败对植入后胚胎有致命性影响,揭示了早期胚胎发育中基因组和表观的变化是以X染色体的转录沉默为基础。

成果展示二

Structural organization of the inactive X chromosome in the mouse.

出版源:《Nature》 2016, 535(7613): 575
被引量:34(截止2017年9月7日)

背景: X染色体失活(XCI)引起X染色体结构重塑,转变成沉默的异染色质;在雌性哺乳动物发育中,X染色体失活由两条X染色体中一条的非编码RNA Xist发生上调引起。

方法: 利用Hi-C测序、ATAC-seq和RNA-seq解析了小鼠失活X染色体结构特征。

发现: 本研究在小鼠神经前体细胞(NPCs)和胚胎干细胞中,研究了失活X染色体的结构和基因表达情况;发现在失活的X染色体结构重塑中Xist和含有DXZ4边界发挥着重要作用,在失活的X染色体中,除了“逃脱”沉默的基因附近,其他位置失去了有活性和失活的区室(compartmentA/B)以及拓扑结构域(TADs)。

成果展示三

Maternal LSD1/KDM1A is an essential regulator of chromatin and transcription landscapes during zygotic genome activation.

出版源:《 Elife》 2016,5
被引量:18(截止2017年9月7日)

背景: 受精过程中,高度特化的精子和卵母细胞基因组被重建并赋予全能性,然而重编程事件的机制仍不清楚,普遍认为组蛋白修饰酶可能在此过程中发挥作用。

方法: 采用Smart-seq2扩增,Illumina HiSeq 2500,SE50的测序策略进行单细胞样本的转录组测序

发现: 本研究结果表明,KDM1A在合子受精过程可能起到关键作用,不仅构建了正确的表观遗传图谱,还保留了基因组的完整性,开启并驱动了小鼠早期发育基因组表达的新模式。该研究证实了KDM1A作为母源因子作用于生命伊始,并塑造了早期胚胎组蛋白甲基化和转录组的全景图。

成果展示四

Mutational spectrum and risk stratification of intermediate-risk acute myeloid leukemia patients based on next-generation sequencing.

出版源:《Oncotarget 》 2016, 7(22): 32065.
被引量:2(截止2017年9月7日)

背景: 急性髓细胞白血病是一组起源于造血干细胞的恶性疾病,涉及多种基因突变,具有高度的异质性。在现有的WHO急性髓细胞白血病(AML)分层体系中,主要依靠传统的MICM综合诊断分型,约50-60%患者被划分为中危,而这也是治疗指征最不明确的一个患者群体,治疗后的异质性很大。发掘更精确的分层方法,明确AML中危患者的治疗指征,一直是临床医学和科研工作者的努力方向。

方法: 提取95例既往确诊AML患者,26例新近确诊AML患者和32例健康人的骨髓细胞DNA样本,进行高通量测序筛查。

发现: 通过对95例IR-AML病例的高通量测序筛查,发现了101个基因存在突变热点。有7个基因(CEBPA, NPM1, DNMT3A, FLT3-ITD, NRAS, IDH2和WT1)在群体中的突变频率超过10%。遗传互作分析在重叠突变中发现了几个协同突变和单一突变模式。这些突变模式的分析表明基因型和预后之间有一定的相关性。在生存分析中,整合协同突变,可以将95例IR-AML划分为三类不同的风险群体。这些结果加深了对AML分子发病机制和生物学的理解,提供了根据不同突变类型划分IR-AML预后的方法,对实施合理的治疗方案,减轻患者痛苦,提高患者生活质量具有重大意义。

成果展示五

Statistical Approach to Decreasing the Error Rate of Noninvasive Prenatal Aneuploid Detection caused by Maternal Copy Number Variation

出版源:《Scientific reports》 ,2015,5: 16106.
被引量:2(截止2017年9月7日)

背景: 无创产前DNA检测是针对胎儿染色体非整倍体数目异常疾病的新型检测技术,该方法采用新一代高通量测序技术结合生物信息学分析方法,对孕妇外周血中的游离DNA进行检测和分析,是一项无创,安全,精准的新型检测技术,然而,受某些特殊因素的影响,NIPT仍然存在一定的假阳性结果。如何让检测结果更精准,是NIPT技术优化的重点和难点。

方法: 基于自主创新的FCAD Workflow分析流程对6615例大规模临床样本开展NIPT验证试验

发现: 本研究中,FCAD Workflow分析流程通过增加母体CNV过滤系统进行Z值校正,成功在6615例临床样本中,排除了2例T21、1例T18和1例T13的假阳性,有效地降低了错误率。

成果展示六

HiC-Pro: an optimized and flexible pipeline for Hi-C data processing

出版源:《Genome Biology》 , 2015 , 16 (1) :259
被引量:19(截止2017年9月7日)

背景: 高通量染色体捕获技术(High-throughput chromosome conformation capture,Hi-C),以整个细胞核为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系。通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。随着Hi-C技术逐渐成熟,开发一种可以用于任何项目的生物信息分析流程十分必要,然而全基因组的Hi-C测序数据常常包括多达上百G的原始序列产量,处理这些大量数据需要优化的生物信息分析流程,长期以来缺乏一种稳定、灵活、高效的流程。

方法: 陈重建博士携手科学顾问Edith Heard(法国居里研究所资深研究员)及Hi-C技术发明人Job Dekker,研发出一种Hi-C数据处理及分析的新流程HiC-Pro。研究中分别采用来自两个公共数据库的IMR90和IMR90_CCL186数据进行分析对比,对于每个数据库,运行HiC-Pro流程,获得分辨率为20kb、40 kb、150 kb、500 kb 和1 Mb 分辨率的标准相互作用图,IMR90_CCL186 数据库还能获得5kb分辨率的相互作用图。

发现: 结果表明,和hiclib运行相同的数据,HiC-Pro完成分析少于15小时,而hiclib需要用28小时。此外,HiC-Pro运行IMR90_CCL186数据得到5kb分辨率相互作用图的用时仅12小时,表明HiC-Pro能在合理的时间分析大量数据。