当您以开源形式发布 500,000 个人类基因组时会发生什么?就是这样。DNA 是数字化的。构成人类基因组的 30 亿个化学碱基不是以二进制编码数据,而是以四进制系统编码数据,使用四种化合物——腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶——来表示四个遗传“数字”:A、C、G 和 T。尽管这在 1953 年沃森和克里克在他们著名的双螺旋论文中提出 A-T 和 C-G 配对作为“遗传物质的复制机制”时有点令人惊讶,但很难看出遗传信息如何能够以任何其他方式从一代传到下一代有效的方式。 正如任何制作过复印件的复印件的人都知道的那样,模拟系统在无损传输方面很差,这与数字编码不同。在数百万年的时间里逐步发展出更复杂的结构会更加困难,甚至是不可能的,如果我们的遗传物质以纯粹的模拟形式存储的话。