当您以开源形式发布 500,000 个人类基因组时会发生什么?就是这样。DNA 是数字化的。构成人类基因组的 30 亿个化学碱基不是以二进制编码数据,而是以四进制系统编码数据,使用四种化合物——腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶——来表示四个遗传“数字”:A、C、G 和 T。尽管这在 1953 年有点令人惊讶,当时沃森和克里克在他们著名的双螺旋论文中提出 A-T 和 C-G 配对作为“遗传物质的复制机制”,但很难想象遗传信息如何在代代相传中有效地传递。正如任何制作过复印件的复印件的人都知道的那样,模拟系统在无损传输方面很差,这与数字编码不同。如果我们的遗传物质以纯粹的模拟形式存储,那么数百万年来逐渐复杂结构的进化将会更加困难,甚至是不可能的。