美提出基因测序数据分类新标准 提高比对效率

2016-11-072938点击

来源:科技日报
        最近,美国洛斯阿拉莫斯国家实验室(LANL)的一个遗传学小组和一国际财团联合提出了一套旨在阐明可公开获取的基因测序数据信息的质量标准。新标准最终可使遗传研究人员开发出更有效的疫苗,或有助于公共健康部门或安全人员更迅速地应对潜在的公共卫生突发事件。

行归类。这些标签可在公共数据库中获取,而目前使用的标签仅为两个。此项成果的重要性在于,研究人员必须每天使用这样的数据,以对未知遗传数据和已知生物体的遗传数据进行相互参照,而有了这样的新的分类标准,数据的获取与对比工作的效率将大大提高。

  每个生物体的细胞内都有DNA,由4个分子构建模块(或称碱基对)组成,碱基对排成特定序列时就可构成基因。这些基因序列可包含对生物体有益或有害的遗传指令。基因组研究人员编目了数以千计的基因数据,并将其放在公众数据库中以供其他研究者使用。 然而,由于基因数据的复杂性,公共数据库中的遗传信息范围从粗略到精致一概都有。过去,这些基因数据常被归类为“草图”和“成品”两大类,给基因数据的准确性留下了太多的不确定性。



  钱恩联合了大大小小的数个基因组测序中心,如美国能源部联合基因组研究所、桑格研究所、人类微生物群系项目Jumpstart联盟测序中心、密歇根州立大学以及安大略省癌症研究所等,共同提议将现有的测序数据分类从两大类充实为6大类。这6个标准涵盖了从代表公众提交最低要求的“标准草图序列”到代表最高标准的“完成序列”,而“完成序列”的验收标准是每10万个碱基对中最多只能包含一个错误。

  LANL基因科学小组负责人、联合基因组研究所LANL研究中心主任克里斯·戴特表示,该项研究的目的是为了让所有主要的基因组中心和基因组研究小组都能用上符合其需要的分类基因组测序数据。而为了尽可能保证基因组序列的完整性,一些较小的研究中心也可采用这个分类等级来建立和提交其研究成果,以帮助其他科学家了解既已完成的工作。

×
客服热线

400-817-8855

客服QQ

776629964

预约咨询

预约咨询

预约咨询卡

Appointment consultation card

×