开源永恒
开源赢得了现在,但未来呢?
在 2018 年 3 月刊的 Linux Journal 中,我写了一篇文章回顾过去十年。在如此短的时间内,发生了惊人的变化。但正如我指出的那样,这也许并不令人惊讶,因为十年代表了 Linux 整个历史(以及在较小程度上 GNU 项目的历史)中相当大的一部分,GNU 项目分别始于 1991 年 8 月 和 1983 年 9 月。这些日期使得 Linux Journal 于 1994 年 4 月的创刊成为一个极其大胆且具有远见的举动,也是值得在其 25 周年纪念日上庆祝的事情。
对我来说,1994 年也是值得纪念的一年,还有其他原因。它标志着我开始撰写关于互联网在商业中的应用的每周专栏——这是最早撰写这类专栏之一。我总共撰写了 413 篇“Getting Wired”专栏文章,最后一篇发表于 2003 年 4 月。我第一次提到 Linux 是在 1995 年 2 月。此后,自由软件和(后来的)开源逐渐成为贯穿专栏文章的一个越来越重要的主题——“Linux”这个词总共出现了 663 次。回顾最近发生的、导致数千家公司倒闭和数十亿美元损失的互联网泡沫破灭,我在最后一篇“Getting Wired”专栏文章中写道:
真正的互联网并没有消亡:它只是回到了它最初兴起的实验室和卧室。因为真正的互联网革命不是由股票期权驱动的,而是由共享驱动的——特别是自由软件的共享。
...
自由软件背后的理念——以及因此驱动互联网早期令人兴奋的那些理念——是如此不可避免,以至于即使像微软这样强大的公司也被迫采纳它们。事实上,我预测在未来五年内,微软将效仿 IBM,成为开源的坚定支持者,从而成为互联网精神最终胜利的象征。
您可以在 Computer Weekly 网站上在线阅读最后一篇专栏文章,该文章最初发表在该网站上。它是 数百篇“Getting Wired”专栏文章中仍然可以在那里找到的一篇。但一些年份的存档是不完整的,而且无论如何,它只能追溯到 2000 年。这意味着五年份——大约 250 篇专栏文章——不再向公众开放(我自然仍然有我自己的原始文件)。
即使我所有的“Getting Wired”专栏文章都可以在 Computer Weekly 网站上找到,也不能保证它们会永远可用。将来,该网站可能会重新设计,并且指向这些文件的链接会被删除。这些文件本身可能会被删除,因为它们是古代历史,不再受关注。该刊物可能会倒闭,其文章会被简单地丢弃。因此,今天可用的任何内容都不能保证明天仍然存在。
互联网档案馆的设立部分是为了解决旧网页丢失的问题。它的目标是拍摄互联网演变的快照,记录和存储我们数字文化的短暂瞬间。它已经保存了数十亿个不再可用的网页,充当了对抗时间和遗忘的堡垒。这是一个令人难以置信、不可替代的资源,它没有收到政府的官方资助,所以 我敦促您尽可能捐款——您永远不知道什么时候会需要它。
互联网档案馆的 Wayback Machine 已经保存了 3470 亿个网页,这是一个奇迹。但它并不完美。特别是,它似乎没有任何我的“Getting Wired”专栏文章的备份副本。也许这没什么大不了的,但它表明了其馆藏的部分性质。更普遍地说,这提出了两个重要问题。首先:谁应该保存我们的数字遗产?其次:应该保留什么?尽管一些数字文物正在 美国、英国 和 其他地方 保存,但资源是零散的、被动的,并且通常没有任何适当的长期保存策略。相比之下,挪威正在发生的事情,正如去年 ZDNet 的这篇报道中所描述的那样:
在挪威北部靠近北极圈的地方,挪威国家图书馆 (NLN) 安全存储设施的专家们正在实施一项惊人的计划。
他们的目标是将挪威出版的所有内容数字化:书籍、报纸、手稿、海报、照片、电影、广播和地图,以及挪威 .no 域名上的所有网站。
他们的工作已经进行了 12 年,按目前的估计,将需要 30 年才能完成。
文章报道称,已经数字化了 54 万本书籍和 200 多万份报纸。截至去年年底,馆藏数据约为 8PB,每天增长 5 到 10TB。标题中提到了“1000 年的档案馆”。虽然这听起来可能很长一段时间,但从历史角度来看,这并不长。我们有超过一百万块包含可以追溯到两千甚至三千年前的楔形文字铭文的泥板。埃及象形文字也同样存活了这么久,中国的甲骨文也是如此。在我们文明的这个阶段,我们应该思考如何将今天的信息保存数万甚至数十万年。一个项目已经开始应对这一挑战:
长久以往基金会成立于 01996 年,旨在开发时钟和图书馆项目,并成为一个非常长期的文化机构的种子。长久以往基金会希望对当今加速发展的文化提供一种制衡,并帮助使长期思考更加普遍。我们希望在未来 10,000 年的框架内培养责任感。
长久以往基金会的图书馆项目是“为了遥远的未来,为了遥远的未来”。目前已经有三个工具:罗塞塔磁盘、Long Viewer 和 Long Server。Long Viewer 是“一个开源的时间线工具”,而 Long Server 是“长久以往基金会数字连续性软件项目的总体程序”。遗憾的是,目前还没有关于 Long Server 将采取何种形式的详细信息。然而,Long Server 网站确实提到该团队“目前正在进行一个名为格式交换的文件格式转换项目”。
文件格式转换是将数字材料存储数千年的核心挑战之一。我们自己短暂的经验表明,格式被替换的速度有多快,导致旧文件难以读取。现在想象一下,读取一个数字文件的难度,该文件的位被完美地保存下来,但使用的是一万年前的文件格式编写的。
幸运的是,解决这个核心问题的方案形式是显而易见的。读取古代文件格式的唯一希望是它们是完全开放的。这样,就可以相对容易地构建读取器和文件转换工具。同样,为长期保存数字材料的项目创建的任何程序都必须是开源的,以便也可以对其进行详细检查、修改和构建。即使仅仅过了 25 年,我们也知道自由软件已经获胜。但也很可能它的成功将是长期的,假设人类文化能够以任何连续性存续下去。开源——而且只有开源——是永恒的。