Linux 与商务人士 - 世界实时网络

作者:Doc Searls

网络存在分裂。它从一开始就存在,就像一棵榆树从种子中生长出来,种子承载着树干向上二十英尺分叉的承诺,直指天空。

主干是静态网络。我们用房地产的术语来理解和描述静态网络。它有“站点”,有“地址”和“位置”,位于我们借助“建筑师”、“设计师”和“建造者” “开发”的“域名”中。像住宅和办公楼一样,我们的站点有“访问者”,当然,除非它们“正在建设中”。

再下一层,我们用运输的术语来描述网络。“传输”协议管理着“数据包”在端点之间的“路由”,解包后的数据驻留在“存储”中。当我们仍然将网络称为“信息高速公路”时,我们使用“信息”来标记我们存储在硬盘驱动器和网站上的商品。今天,“信息”已经过时了。相反,我们称之为“内容”。

出版商、广播公司和教育工作者现在都在“交付内容”的业务中。许多网站现在都由“内容管理系统”组织。

“内容”这个词意味着实质。它是一种可以制造、塑造、购买、出售、运输、存储并与其他材料结合的材料。“内容”不如“信息”人性化,不如“数据”技术化,但比两者都更方便。就像“解决方案”或拼字游戏中的空白瓷砖一样,您可以在任何地方使用它,尽管它没有增加其他价值。

我经常写到当我们把人类的表达简化为货物时出现的问题,但这并不是我这次要说的。相反,我只是简单地指出,网络的大部分要么是静态的,要么可以方便地用静态术语来理解,这些术语将其中的一切都简化为一种易于管理、易于搜索、易于理解的形式:站点传输内容

自从第一个浏览器和搜索引擎出现以来,静态网络并没有太大变化。是的,我们制作和运输的“内容”比我们在 1996 年“创作”的“页面”要多样化和复杂得多,当时我们仍然受到蒂姆·伯纳斯-李最初的网络愿景的指导:一个由超链接连接的文档世界。但是我们评估超链接的方式并没有太大变化。事实上,正是谢尔盖·布林和拉里·佩奇对链接意义的洞察力促使他们构建了 Google:一个搜索引擎,它通过最大程度地加权来自其他拥有最多入站链接的站点的入站链接最多的站点来找到我们想要的东西。尽管 Google 的 PageRank 算法现在包含许多变量,但其最初的洞察力已被证明非常有效且持久。链接有价值。最重要的是,这解释了 Google 和模仿它的搜索引擎的成功。

静态网络不变的特性之一是它作为干草堆的本质。网络确实有一个带有域名系统 (DNS) 的基本目录,但除此之外,第一个单斜杠右侧的所有内容都是一个巨大的“随便什么”。UNIX 路径 (/随便什么/随便什么/随便什么/) 使顺序成为每个域的本地选项。在所有组织事物的方式中——按时间顺序、按字母顺序、按类别、按空间、按地理位置、按数字——没有一种在静态网络中占主导地位。组织完全取决于管理域内内容的人。在这些域之外,总和是一个超出人类(甚至可能是机器)理解的混乱的质量。

尽管网络没有组织,但可以像链接暗示的无数条件层次结构中那样对其进行搜索。这些层次结构,其中大多数都很小,使搜索引擎能够在万维网干草堆中找到针。事实上,搜索引擎在这方面做得如此出色,以至于我们几乎不会停下来思考他们所做事情的随意奇迹般的性质。我假设当我查找 linux journal diy-it(没有布尔运算符,没有引号,没有技巧,只有这三个词)时,任何大型搜索引擎都会将我引导到我在 2004 年 1 月和 2 月的 Linux Journal 上撰写的关于该主题的专栏文章。事实上,他们可能比我们自己的内部搜索软件更能找到旧的社论。“你可以在 Google 上查到”是为域自己的干草堆不提供搜索设施的最常见借口。

我之所以提出这一点,是因为搜索引擎的成功产生的一个影响是,使我们对网络的理解具体化为一种静态场所,与公共图书馆没什么不同。静态网络的图书馆缺乏任何类似卡片目录的东西,这无关紧要。搜索引擎是虚拟图书管理员,他们接受您的订单并在浏览器加载下一页所需的时间内从书库中检索文档。

然而,在那个图书馆中,存在着一些活动形式,它们太新、太不稳定、太不可预测,以至于传统的网络搜索无法完全理解。这些构成了现在从静态网络分支出来的实时网络

实时网络由蒂姆·伯纳斯-李构思网络时、Netscape 和 Microsoft 之间爆发“浏览器大战”时,甚至 Google 开始其迈向网络搜索霸主地位时都看不到的标准和实践定义。这些标准包括 XML、RSS、OPML 和越来越多的其他标准,其中大多数来自小型独立开发人员,而不是来自大型公司。这些实践是博客和聚合。最近,播客(带有 OPML 组织的目录)也加入了进来。

这些标准和实践是关于时间和人,而不是关于站点和内容。当然,博客在静态网络搜索引擎看来仍然像站点和内容,但以静态术语看待博客会错过一些关于它们的根本不同的东西:它们是活着的。它们的实时性和人性定义了实时网络。

至关重要的是,我们应该根据实时网络自身的术语来理解它,而不是从静态网络借用的术语。

博客是日志,而不是站点。它们是写出来的,而不是建造出来的。最好的博客每天或更快地跳动着一颗心脏。写作本身比说教更具对话性(这就是我在这里的行为方式,在月刊印刷出版物中)。这意味着它们的作者是在说话,而不仅仅是“创建内容”。他们与读者和其他博主交谈,后者通过电子邮件、评论或在他们自己的博客上回应。这意味着每个博主所说的话通常是不完整和暂定的。像所有生命形式一样,博客在持续期间仍然是未完成的。(另一方面,站点内容在任何时候都是完成的,然后被其他完成的内容替换。)

几个月前,有人要求我向一个对博客一无所知的人解释博客。当我完成后,这个人明白博客是一种新的新闻形式,它赋予个人比以往任何时候都更高的杠杆作用。然后,他指示我,作为一个相当知名的博主,立即将我的余生奉献给纠正世界上熟悉的罪恶。

我回答说,我已经 57 岁了,厌倦了把大石头推上陡峭的山坡,只是为了短距离——也厌倦了被滚回来的石头压扁。我告诉他,博客可能会在某些情况下让西西弗斯的生活轻松一些,但它更好的杠杆作用是在雪球上。我解释说,我作为博主的工作是把雪球滚下山。有些是我新创建的;另一些是我沿着山坡推动的,一路增加少量质量。

我的观点:滚雪球与建造站点和运输内容截然不同。也许不是完全不同,但足以让网络分叉。

博客早于聚合,但正是聚合开始赋予实时网络形式。聚合为人们及其使用的工具提供了一种方式,可以通过订阅来关注来自聚合源的提要。起初,这些来源是博客和出版物,但后来它们开始包括对会话主题的搜索,包括作者姓名、URL 和特定博客文章或新闻报道的永久链接。这些来源中有许多不是博客本身,而是搜索引擎报告关键字和 URL 搜索的结果。

在撰写本文时,最流行的实时网络搜索引擎是 Technorati(现在在 Alexa 上排名约 700 位,每天约有 8000 万页面浏览量)。它于 2002 年 11 月诞生于 David Sifry 地下室的一台来自 Penguin Computing 的 Linux 机器上。这台机器被借来帮助我们两人撰写一篇关于博客的专题报道,该报道最终刊登在 2003 年 2 月的 Linux Journal 上。David 编写 Technorati 是为了帮助他为这个故事做研究。当我第一次看到它时,我也看到了网络中的分叉。Technorati 搜索到的内容是活着的、移动的、变化的。它的结果也与我从静态网络获得的结果截然不同。今年春天,一位在维多利亚的秘密工作的人向一位朋友抱怨该公司对其 IPEX 胸罩的了解有限,该胸罩在几周前才上市。在 Google 上搜索只找到了维多利亚的秘密自己的网站和其他一些提供零售信息的网站。我的朋友向她展示了 Technorati 对“ipex”的搜索,该搜索带来了数百个帖子,其中大部分是女性告诉其他女性她们有多喜欢这款胸罩。那次搜索是通往未经滤镜的真相的窗口,几乎不像该公司从焦点小组或其他惯常的市场调研形式中获得的任何东西。

今天,有六个引擎致力于搜索实时网络。它们都不同。Blogpulse 强调趋势和排名(具有出色的 UI 和出色的图形)。PubSub 不提供网络搜索,而是专注于向用户聚合器提供关键字搜索提要。Bloglines 将搜索与聚合和其他服务集成在一起。IceRocket 强调性能和简单性。Technorati 专注于快速索引、标签搜索和热门话题。Feedster 以个性化和索引大小领先。

所有这些描述都是简单而不完整的。当您读到这篇文章时,它们也已经过时了。整个类别正在迅速变化,就像他们关注的个人和社会趋势一样,以及使它们成为可能的技术和使用这些技术做新事的开发人员。几天前,我与一家新公司交谈,该公司收集和聚合围绕本地企业和服务的对话,使广域网的实时分支尽可能本地化。我每周至少有一次这样的对话。

今天早上,我与一些参与“微格式”的技术人员进行了交谈。在 microformats.org 网站上,这些微格式被描述为“一组建立在现有和广泛采用的标准之上的简单、开放的数据格式。微格式并没有抛弃今天有效的东西,而是打算首先通过适应当前的​​行为和使用模式(例如,XHTML、博客)来解决更简单的问题。” 微格式不是规范和标准,而是“设计原则”、“适应使用模式的方法”、“与语义 XHTML 和现实世界相关联”以及“一种思考数据的方式”。据我所知,围绕微格式的没有人想为它们申请专利或为利用它们的商业模式申请专利。就像没有人为 RSS 申请专利一样(RSS 最初的意思是“富站点摘要”,但在 Dave Winer 领导其发展成为稳定的实时网络推动者之后,它的意思是“真正简单的聚合”)。我们可以感谢这种慷慨大方为网络和 Web,以及 Linux 以及自由软件和开源运动所做出的贡献。

标签是标准和实践以实时、有机方式演变的完美示例。标签是充当类别的标签,由用户附加到照片、列表、博客文章或他们放在网络上的任何内容(或其他人放在网络上的内容)。标签首先出现在 del.icio.us(一个社交书签管理器)和 Flickr(一个照片共享服务)上。在这两种情况下,开发人员都让用户控制自己的创作(请注意,我避免说“内容”)以及对这些创作的描述。后来,Technorati 不仅开始进行标签搜索,还开始为链接中的标签建立标准(包括 rel=“tag”元素)。作者和用户开始向各种内容添加标签。因此,标签现在正在成为一种实时网络组织形式。

实时网络的博客分支还有另一种顺序:时间顺序。无论是 TypePad、Drupal 还是 Manila 还是其他一些系统提供服务,博客都以相同的方式组织:blogname.suffix/year/month/day/post。帖子的永久链接是其唯一的 URL。

任何组织的数据堆都可以存档。这意味着网络中最不静态的部分也是可以像图书馆一样存档和组织的部分——并且以相同的方式进行研究,只是更好。想想可以从按日期和类别(标签)组织的来源总和中收集多少数据。想想可以从中收集到的情报。还要想想促进或销售情报可能存在的商业机会。

我从 Netcraft 了解到,到目前为止我提到的所有实时网络搜索引擎都在 Linux 上运行。Google、AskJeeves 和 A9 也是如此。即使 MSN Search 也通过 Akamai 的巨型服务器场在 Linux 上运行。唯一的例外是 Yahoo,它运行自己的 BSD 版本(它仍然是一个开源操作系统)。

在我写这篇文章时,我也在帮助组织在旧金山举行的 Syndicate 会议(2005 年 12 月 12 日至 14 日,市中心的希尔顿酒店——本期 Linux Journal 应该在那时在报摊上)。在贸易展上,习惯上向供应商和大型服务提供商寻求领导。然而,对于实时网络,领导力不仅仅来自大公司。事实上,大多数领导力来自独立开发人员和先锋用户。在这方面,实时网络更像是一个生态系统,而不是一个工业类别。站在舞台上的人会有很多话要说,但构成我们过去所说的“观众”的人也会有很多话要说。看看对话如何进行将会很有趣。

看看实时网络将如何承载 Linux 创新以及关于它们的对话也将很有趣。Linux 和开源开发一直具有它们的实时特性。随着实时网络的增长,我们可以预期这些特性至少会变得更有组织性(例如,按时间顺序或标签)。

“实时”是否有可能加入“自由”和“开放”行列,成为我们万神殿中的形容词?有可能。无论是否如此,我要感谢我的儿子 Allen,他是第一个说出“世界实时网络”的人,为我提供了一个在我听到它之前我从未意识到自己缺乏的视角。

他对世界实时网络的最初愿景是字面意义上的:一个任何人都可以联系任何人并在实时中提出或回答问题的网络。当他第一次作为研究人员接触到网络时,他认为网络在支持最人性化的互动形式方面存在根本缺陷:一种一个人直接增加另一个人知识的形式。

自从 Allen 第一次向我介绍这个概念以来,我们在实时方向上已经走了很长一段路。仅 VoIP 就是一个巨大的实时类别。移动网络的发展都将沿着它的实时分支进行。

它究竟走向何方,任何人也猜不透。我们唯一可以肯定的是,它正在朝着天空前进。

Doc Searls 是 Linux Journal 的高级编辑。

加载 Disqus 评论