57书屋

第一百五十一章深蓝存储（4000字） (4/5)

换源：

节点十一 ↓

。”

......

“dna作为天然遗传信息的载体，提供了一种稳定、高效且可持续的数据存储解决方案。”

“自从蓝星上的生命一开始，大自然就以自己的方式解决了如何把信息遗传给下一代的问题：

它以四个碱基（a、t、c、g）的独特顺序存储定义有机体的信息，这些碱基位于微小的称为脱氧核糖核酸(dna)的分子，这种存储信息的方式已经持续了 30 亿年。

dna分子作为信息载体，与传统的存储介质相比具有许多优势。

其高存储密度、潜在的低维护成本等优良特性使其成为信息存储的理想替代品”

“介质存储信息的能力我们用香农信息指数来衡量，由于dna分子是由脱氧核糖核苷酸单体的线性链组成的异质聚合物。

每个单体采用四种碱基a、t、c和g中的一种，特定排列（即序列）提供了一定量的信息。

根据香农信息的定义，单个碱基所能容纳的最大自我信息量（h ）为......

自我信息对碱基分布的依赖性在表1中给出，其中a是“概率分布偏差”，即碱基出现的频率与 0.25 的平均频率之间的差异。”

“对于dna分子来说，如果四个碱基中的每一个都与自身完全对应，那么h (x|y)=0，i (x;y)=2bit\/碱基，传输中的平均互信息等于源熵，它给出了传输信息量的上限。

但是，在写入和读取dna序列的过程中，信息可能会发生扭曲，导致输入集x和输出集y不匹配，从而降低了传输过程中的平均互信息。例如，如果每个碱基对应于除自身以外的其他三个碱基的概率为 1\/10。

碱基读数的失真大大降低了 dna 中信息传输的效用。

不同传输错误率mi下的平均交互信息（一个碱基被错误地读出为其他三个碱基之一的概率），假设 2 位\/碱基输入。平均互信息随输入基础偏差和传输错误率存在一定的关联性。

我们可以通过某种手段来规避这种错误，完美的发挥dna分子应有的存储效率。”

“在dna中增加存储数据的纠错码。通过存储模型，其中数据集由一组无序的 m 序列表示，每个序列的长度为 l。该模型中的错误是整个序列的丢失和序列内的点错误，例如插入、删除和替换。

我们在此存储模型中推导出纠错码的可实现基数的 gilbert-varshamov 下界和球体上界。

进一步提出了明确的代码结构，以纠正这种可以有效编码和解码的存储系统中的错误。”

本章未完，请点击下一页继续阅读

推荐小说:
穿成农家长姐后，种田致富养娃娃人间无数痴傻酷穿越之明萌贵公子什么魔女？绝命药师！精灵：训练家真司离婚后，作为画骨师的我惊艳全球从赘婿开始建立长生家族斩妖除魔：我镇压诸天亿万妖魔我在末世造小家文豪1983：我在文化馆工作

相关推荐：
我在末世造小家单系能力弱？多系大佬俯首称服腐烂国度之活下去身为法师的我只想追求真理末世重生之带娃修行