首页 >> 中医药茶

你躯体里的 DNA,能存下整个宇宙的数据

发布时间:2025年08月11日 12:21

美国公司总部企业家美国公司 Catalog 在 DNA 当中加载了 16GB 的维基。这个美国公司说是明自己将要规划设计世上上第一个基于 DNA 的大规模二进制数据集加载和近似值平台。

02 基因序列和音频,要处理的过错情很多

在一些人类文明学家或许,用 DNA 来加载是一件更加「顺滑」的过错。「大其事物的基因序列语言学更加类似于我们在近似值机领域应用于的二退制语言学。在驱动器上我们应用于 0 和 1 来代表人数据集,而 DNA 当中,我们握有 4 种方式的碱基,A、C、T 和 G」。在瑞士联邦分校的人类文明学家 Robert Grass 说是。

DNA 加载的关键之一是用四个碱基去连续函数 0 和 1 两个二进制。方案可以很恰当。比如:A 基本上相同 00,C 基本上相同 01,G 基本上相同 10,T 基本上相同 11。然后再进一步按照所能够的碱基基因序列,像串珠子一样,把碱基们串成一串。(这就是 DNA 制备)能够读写讯息的时候,再进一步运用于基因核酸核心技术,把这一串碱基基因序列读写出新来,再进一步翻成 0 和 1 的字符串。这个流程就是基因序列—DNA 制备—核酸—音频。

这个却说起来像是「把水牛装退冰箱」的流程,操作起来能够考虑到的关键问题还有很多。不然地质学家就不必一直科研成果原先基因序列方案了。

在其事物现象实际上的 DNA 当中,A 和 T,C 与 G 两两一对一,在一条 DNA 当中,CG 与 AT 的实际上比例也就是说均匀,为 50% 约。如果 C 和 G 的含应用于量过高,也许都会让 DNA 链消除一些精细的天体物理学骨架。这就都会让 DNA 核酸(音频)分开。

DNA 加载的步骤| 举例来说:DNA Data Storage Alliance

而且在「串珠子」(也就是制备 DNA 链条)的每一次当中,差错率不也许避免。在此之前至少每制备 100 个核酸就都会出新现一个差错。这是由在此之前的化学制备核心技术带来的经年累月,每制备一个核酸,有 99.9% 以上的正确率。但是当核酸串变小,0.01% 的几率减去,差错就难以能避免。在此之前类似物 DNA 的单链的间距一般不高达 100 个核酸,短时间在 300 个核酸约。而在其事物现象的 DNA 动辄有几千个核酸对。

意味著是,虽然 DNA 的加载能力很强,但它们不得不以很多条短链的方式实际上。如果加载的精细程度比较大,这些 DNA 短链就像一本散装的注解。它可以加载很多讯息,实际上方式却是一张张标着页码的白纸。当然,可以将一条条 DNA 短链整块成长链。这就这样一来增大了一道工序。在核酸的每一次当中,又能够把长链打断成短链。这是因为在此之前核心技术还不能了了读写长链。

在核酸的每一次当中,也实际上差错率。尽管在此之前的差错率不太可能低至 10^-3 数应用于量级,比起金融业驱动器的读写差错率,仍相差最少 9 个数应用于量级。

正确率受到制备和核酸值得注意核心技术的影响,地质学家就让到设计基因序列方案来能避免:在基因序列当中增大纠错机制。这样,哪怕核酸制备和核酸当中出新现了差错,依旧必需保证被加载退 DNA 的具体内容必需被正确读写出新来。

03 走回新科研成果小组,还要考虑到加速和效益

DNA 加载也将要尝试走回新科研成果小组。

2020 年 10 年末,苹果美国公司美国公司、西部数据集和基因核酸巨头 Illumina、DNA 制备初创美国公司 Twist Bioscience 等创建联系筹组了 DNA 数据集加载新联盟。

这是世上上第一个该领域的学术和产业链新联盟。这个新联盟希望实施核心技术和PDF标准,就此创建一个可以通用的金融业系统。

苹果美国公司美国公司科研成果院在 2015 年就筹组 DNA 加载的项目,并聘请了华盛顿大学的近似值机科学与交通学院的副教授 Karin Strauss 转任高阶总监科研成果负责人(Senior Principal Research Manager)。

2013 年,她和同过错去英国 EBI 访问,了解到 Goldman 和同过错们关于 DNA 加载的科研成果,就对这个侧向消除了很大的热爱。Strauss 说是,「DNA 的密度、稳定性和一般而言让我们舒服。」

在他们的科研成果当中,就让开发的是另一个功能:随机读写。常见的 DNA 核酸核心技术当中,必须要将所有的核酸串了了读写完,才必需得到讯息。要么不读写,要么全读。如果只就让要数据集当中的某一个小完整版,就都会更加麻烦。

2016 年,他们发表了一项科研成果,可以在 DNA 不太可能加载的讯息当中搜索到指定的图表,有别于后,用核糖体来拷贝所需的 DNA 完整版,然后只需读写这剩余段即可。

Karin Strauss(任左)和两位科研成果合作者|举例来说:csenews

要让 DNA 加载离商用必要性,还能够解决制备加速和效益。以前制备加速是米/秒加载上千个十六进制(KB),成熟的寒加载方案不太可能有米/秒千下同十六进制(GB)以上。

这这样一来,编写 DNA 的加速还能够增大 6 个数应用于量级。如何让增大数据集处理应用于量?就像指令集必需增大数据集处理加速,地质学家希望 DNA 在制备时也可以并行多条,同时处理。

2021 年,苹果美国公司美国公司开发出新首个纳米级 DNA 加载器,必需在每个平方厘米的周边地区上,同时制备 25X106(2650)条核酸基因序列。这个原先核心技术把原来同时制备核酸基因序列的二进制从-bit增大到了数以千计。这个吞吐能力,让 DNA 制备加速变回了米/秒下同十六进制(MB)。

原先方法让 DNA 制备的模组数应用于量大大增大|举例来说:苹果美国公司美国公司科研成果院

更加大的吞吐能力,也就这样一来更加低的效益。以前 DNA 加载的效益是每万亿十六进制(TB)8 亿美元。而磁带加载效益不太可能略高于了每万亿十六进制 16 美元以下。这样比起来只不过显露效益。但人际关系当中的大型数据集当中心的维护效益极高,还要定期更加新硬件;DNA 加载密度大、体积小、可以短时间不变质的优势就变回了降维打击。

所以应用于量大、读写增益低的「冻数据集」,被认为是 DNA 加载近期的应用片中。Twist Bioscience 近期在一份市场报告当中强调,这种核心技术必需设法科技企业在「大规模、低功耗」情况下更加有效地部署。

另外一些悲观的地质学家,更加相信核心技术的退步。

自 2003 年人类文明基因序列顺利完成以来,核酸效益增高了 200 万倍。2016 年时,面对米/秒千十六进制的加速,Goldman 说是,「(读写的加速增大)6 个数应用于量级对基因序列学来说是有点干脆的。你只能够再进一步等一都会儿。」

那这「一都会儿」是多久呢?这个领域只不过到了临门一脚,仍在赶紧突破。

南京看妇科哪家专科医院好
重庆牛皮癣专家
江苏男科医院哪家治疗最好
西安牛皮癣检查多少钱
河南白癜风医院哪家看的好

上一篇: 华创证券:维持沛嘉医疗-B推荐评定 目标价47港元

下一篇: 冒雪围攻黑诊所,保民就医全天候

相关阅读
转千回,日子流光,山下与古筑的魅力交相辉映。 照相机:祯 济宁城的一脱黛瓦青,在这之中都等你。 济宁多彩的夏日已来到我们陪伴,不管是医治的流星蓝纯白,还是脱俗的草地上白绿,亦或
友情链接