当你以开源形式发布 50 万个人类基因组时会发生什么?就是这样。DNA 是数字化的。构成人类基因组的三十亿个化学碱基以四进制系统而非二进制编码数据,使用四种化合物——腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶——来表示四个遗传“数字”:A、C、G 和 T。尽管这在 1953 年沃森和克里克在他们著名的双螺旋论文中提出 A-T 和 C-G 配对作为“遗传物质的复制机制”时有点令人惊讶,但很难想象遗传信息如何以其他任何方式从一代有效地传递到下一代。正如任何制作过复印件的复印件的人都知道的那样,模拟系统不利于无损传输,这与数字编码不同。如果我们的遗传物质以纯粹的模拟形式存储,那么数百万年来逐渐进化出更复杂的结构将会更加困难,甚至是不可能的。