2022
09/22
相关创新主体

创新背景

DNA纳米孔测序的复杂性意味着需要创建大量的数据,然后需要存储和正确分析。
这些数据通常被记录为一种名为FAST5的文件格式,这种复杂的信息通常会产生大约1.3 tb的文件大小——大约相当于650小时的高清视频。

从历史上看,计算机处理如此大的FAST5文件并分析其中包含的人类基因组信息需要大约两周的时间。

 

创新过程

新南威尔士大学和加文医学研究所的研究团队开发出了一种新的计算机文件格式,它处理DNA样本的速度比现有系统快30倍。

 

 

SLOW5格式是专门为更有效地分析纳米孔序列而设计的,它提供了更完整的基因变异视图。

Hasindu Gamaarachchi博士创建了一种文件格式,设计用于对纳米孔信号数据进行高效、可扩展的分析。

新的SLOW5文件格式不仅大大减小了文件的大小,而且可以在大约10.5小时内处理完全相同的信息——比FAST5快30多倍。

并行计算

这一点的关键在于,与FAST5不同,SLOW5格式允许高效的并行计算,因此多个处理器可以同时执行多个更小的分析,这些分析是从更大、更复杂、更完整的数据集中分解出来的。由于新的SLOW5可以被多个处理器同时并行访问,处理时间减少了30倍。

因此,处理人类基因组数据的时间从大约两周缩短到不到半天。

纳米孔测序本身提供了一个更完整的观点,基因变异和重建复杂基因组的可能性。

纳米孔是一种纳米级的孔,离子电流通过它,当生物分子通过时,会测量电流的变化。然后记录和翻译这些改变,以识别分子和碱基的修饰。

 

纳米孔测序是DNA采样分析的“下一代”,几乎可以在任何地方使用手持设备完成,例如牛津纳米孔的这种设备。

纳米孔测序被用于识别一系列疾病,也帮助医疗专业人员更详细地分析DNA样本,从而有可能提供更个性化的药物,特别是在各种癌症的治疗方面。

新的SLOW5文件格式现在可以帮助医疗专业人员更快地诊断疾病,并确保给患者开特定的靶向药物——通常是最有效的治疗——比以前快得多。

 

创新关键点

与FAST5不同,SLOW5格式允许高效的并行计算,因此多个处理器可以同时执行多个更小的分析,这些分析是从更大、更复杂、更完整的数据集中分解出来的。由于新的SLOW5可以被多个处理器同时并行访问,处理时间减少了30倍。

 

创新价值

纳米孔序列分析现在可以以30多倍的速度完成,为癌症和其他疾病患者提供更快、更好的专门治疗。

效率的提高不仅可以帮助医学专家更快地分析单个DNA样本,为患者提供更快、更好的医疗保健,而且还可以在任何给定的时间段内进行更多的采样。

SLOW5消除了纳米孔测序使用的一个主要瓶颈,这种新技术在临床遗传学、农业和其他生物科学领域有无数潜在应用。
随着SLOW5的发展,研究人员处理纳米孔测序数据的能力现在可以跟上生成数据的能力。这将为这种令人兴奋的新兴技术在医学科学中的许多新应用打开大门。

 

New computer file formats could dramatically speed up the processing of DNA samples

A team from the University of New South Wales and the Garvan Institute of Medical Research has developed a new computer file format that processes DNA samples up to 30 times faster than existing systems.

The SLOW5 format was specifically designed for more efficient analysis of nanopore sequences and provides a more complete view of genetic variation.

Dr Hasindu Gamaarachchi has created a file format designed for efficient and scalable analysis of nanopore signal data.

The new SLOW5 file format not only reduces the file size considerably, but it can process the exact same information in about 10.5 hours -- more than 30 times faster than FAST5.

Parallel computing

The key to this is that, unlike FAST5, the SLOW5 format allows for efficient parallel computation, so multiple processors can simultaneously perform multiple smaller analyses that are broken down from larger, more complex, and more complete data sets. Since the new SLOW5 can be accessed simultaneously by multiple processors in parallel, the processing time is reduced by a factor of 30.
As a result, the time to process human genome data has fallen from about two weeks to less than half a day.
Nanopore sequencing itself provides a more complete view of genetic variation and the possibility of reconstructing complex genomes.

Nanopores are nanoscale pores through which ionic currents are passed, and changes in current are measured as biomolecules pass through. These changes are then recorded and translated to identify molecular and base modifications.

Nanopore sequencing is used to identify a range of diseases and also helps medical professionals analyze DNA samples in more detail, potentially providing more personalized medicine, especially in the treatment of various cancers.

The new SLOW5 file format can now help medical professionals diagnose diseases more quickly and ensure that patients are prescribed specific targeted drugs - often the most effective treatments - much faster than before.

智能推荐

  • 生物工程创新思维 | 融合Cre-loxP和CRISPR-Cas9的新型基因打靶技术构建微型扰动图谱

    2022-07-27

    研究团队提出了一种崭新的小鼠基因打靶技术——iMAP,其iMAP品系携带100个gRNA表达单位,靶向90个功能不甚清晰的基因,以此构建了一个微型扰动图谱,揭示了这90个基因分别在39个组织/细胞中对细胞存活、扩增、分化的影响。

    涉及学科
    涉及领域
    研究方向
  • 血液生理学创新思维 | 血红蛋白可充当化学信号的相关机制创新研究

    2022-11-10

    研究探究血红蛋白在氧气载体之外的作用,在血红蛋白引导神经元活动的基础上进行小鼠实验,发现哺乳期母鼠在血红蛋白刺激下会检测生活环境周围的信号。

    涉及学科
    涉及领域
    研究方向
  • 海洋生物学创新思维 | 通过新型生物设备记录并研究北海喙鲸的狩猎策略

    2022-11-23

    一个国际生物学家团队成功地利用生物学来研究相对未知的普通或北海喙鲸的行为。

    涉及学科
    涉及领域
    研究方向