华大基因多项黑科技亮相数博会

2019-05-30 04:38发布

华大科技研发总监唐冲介绍自主开发的多组学数据挖掘系统Dr.Tom。资料图片

用手机即可完成个人全基因组测序分析,多组学交互式数据挖掘系统同时亮相

5月27日,在贵州贵阳举行的“2019数博会生命大数据高峰论坛暨第四届基因组云计算技术开发者峰会(GCTA 4)”上,连续4年参与数博会的华大基因携新的黑科技到来——用手机进行个人全基因组测序分析。同时,华大基因自主开发的多组学交互式数据挖掘系统Dr.Tom也在大会上亮相。

2016年起,华大基因联合BT和IT业界同仁,创办了基因组云计算技术开发者大会(简称“GCTA”)。 2018年数博会期间,贵阳高新区管委会和华大基因共同主办了首届生命大数据高峰论坛。今年,作为数博会的重要组成部分,生命大数据高峰论坛携手GCTA大会,邀请IT与BT领域的前沿研究者、重磅大咖、创新精英,以“生命就是大数据”为主题,聚焦“阅读、管理、理解、计算生命大数据”,分享前沿学术报告,解读最新政策及行业动态,为生命大数据的研究与应用再添新动力。

黑科技登场

手机分析个人全基因组测序

生命就是大数据,每个人都是行走的数据库。在极速增长的大数据面前,如何挖掘蕴藏其中的生命规律,成为业界有识之士的共识。本次大会邀请了众多专家学者,从不同角度分享与生命大数据相关的前沿学术动态。

在大会上,华大基因信息产品高级总监晋向前透露,华大基因在搭载麒麟980芯片的Mate 20 pro手机上进行了全基因组测序分析,并成功完成了5X WGS(个人全基因组测序)数据的生物信息分析,验证了在简单指令集架构芯片上进行生物信息分析的可行性,实现了零的突破。

WGS(个人全基因组测序)是目前大规模获得人高质量基因序列信息的主要手段,这些海量的数据将被用于评估个人健康和疾病,是助力精准医学的第一步。借助基因测序仪,人类得以“阅读”海量基因数据。过去20年,个人基因组测序的费用以“超摩尔定律”的速度在迅速下降。国产测序仪的加入,更加速了其进程。核心工具的发展,改变了数据解读方式,推动着大规模人群基因组学研究项目不断发展。

晋向前表示,该WGS数据的完成,是针对移动终端所做的技术选型,目前尚未进行商业开发,但在人类从信息时代走向生命健康时代的今天,具有重大意义。在即将到来的“人人基因组时代”,小型化和便携化的测序仪将成为刚需,移动终端面临处理大量的基因数据,国产芯片的给力表现让研究人员充满信心,并为后续研发指明了方向。

“Dr.Tom”亮相

可实现一站式个性化分析

作为华大基因的重要业务板块之一,多组学大数据业务致力于成为全球生命科学研究机构的首选合作伙伴,为从事生命科学研究的机构和企业提供高质量、行业领先的基因测序、质谱、生物数据库、云计算等标准化技术服务和全流程系统解决方案。

本次大会,华大基因发布了多组学大数据业务板块的重要产品——自主开发的多组学数据挖掘系统Dr.Tom。华大基因科技研发总监唐冲介绍,该系统是集大数据分析及人工智能技术于一体的一站式个性化分析系统,开创性地创建了任意调动、自由循环的智能数据挖掘体系,大大降低了个性化分析难度和成本,助力零生信基础的科研人员完成高质量数据挖掘,并可将信息分析效率提高30倍以上。通过Dr.Tom,可以满足个性化分析需求,打造数据、平台、传输、管理为一体的闭环管理体系。

除Dr.Tom系统外,华大基因还建成了基因计算机一体机HALOS和基因云计算平台BGI Online,拥有可应用于临床生化、临床免疫、临床微生物及临床分子检测等多种类型的质谱平台、全基因组合成平台。

作为公司的重要业务板块,多组学大数据与合成业务板块的发展也助推了华大基因的业绩增长。华大基因2018年年报数据显示,报告期内,公司多组学大数据与合成业务实现营收7.03亿元,同比增长7.24%。截至2018年底,华大基因多组学大数据与合成业务方向参与发表科研文章67篇,业务覆盖全球100多个国家和地区。

加大竞争力

构建中国人专属基因数据库

数据库建设方面,华大基因拥有遗传病数据库、肿瘤数据库和病原数据库,分别覆盖了已知5000多个单基因遗传病、超过1000个靶向用药常见药物靶点及8000余种病原微生物,使得公司具有更精准的分析能力、更强的检出能力和更便捷的数据传输能力,形成了公司的核心竞争力。

2018年10月,华大基因还上线了CMDB炎黄中国人基因频率数据库。华大股份大数据总监金鑫博士在大会主题演讲中指出,“管理”与“计算”基因大数据的核心平台在于基因数据中台,而“理解”中国人的基因需要中国人自己的基因频率数据库与单倍体参考序列集。目前,华大基因已构建了CMDB炎黄中国人基因频率数据库,该数据库上线以来,服务科研院所与医院超过180家,API查询调用次数突破4000万次。CIS10K中国人单倍体参考序列集也已完成第一期构建,其Reference Panel数据分析效果优于现有数据集,将在理解中国人基因数据方面发挥巨大作用。

早在2011年,华大基因就发起了“3M计划”,即建立3个百万基因组计划,分别是百万动植物基因组计划、百万微生物基因组计划和百万人基因组数据库。2016年3月20日,华大基因完成了第一个“百万”项目,它就是目前基因组学在临床上应用最普及、技术最成熟的无创产前诊断项目“NIFTY”,这一百万的样本来自全球62个国家。与行业知名的基因检测公司相比,华大的检测数据量遥遥领先。

■ 相关新闻

贵州科学院携华大共建新型研发机构

5月21日,贵州科学院贵科大数据研究院和贵州华大基因科技有限公司签约,成立贵州生命大数据研究院,并在数博会上正式揭牌。

贵州的大数据产业一直走在全国前列,2017年12月,贵州进入国家健康医疗大数据区域中心第二批国家试点。此前,贵州初步构建了从数据存储、清洗加工、数据安全等核心业态,到电子信息制造、软件和信息技术服务等关联业态。这为健康医疗大数据中心的建设提供了基础和支持。

未来,贵州生命大数据研究院将集合双方优势资源,通过整合双方人才、技术、资源等优势,以生命学大数据为切入点,打造科研创新、人才培养、成果转化、造福民生的创新性机构,同时推进生物资源基础研究,生物产业孵化培育,创新成果产业化,建成一个引领贵州省精准医学发展的基础平台和生命大数据平台,并配合贵州省国家健康医疗大数据西部中心建设规划,提供先进的生命大数据分析和挖掘技术,促进贵州省科技发展。

本版采写/新京报记者 王卡拉

文章来源: https://www.toutiao.com/group/6696518501827346952/