更深入理解网络 | Linux Journal

行业新闻

作者：Doc Searls

于 2005 年 7 月 22 日

编者注：以下是 Doc Searls 的 SuitWatch 时事通讯 6 月 9 日和 6 月 23 日刊的内容。注册成为这份双周时事通讯的订阅者。

我认为互联网和 Web 如此成功的原因之一是它们在很大程度上没有组织框架。唯一的目录是域名系统 (DNS)，它没有指定第一个单斜杠 / 之后的内容。其余部分可以自由地变成任何人想做的那么大的草堆。

我们确实做到了，在搜索引擎的帮助下。 Web 的草堆特性需要搜索引擎。实际上，Google 和 Yahoo 说：“没错，Web 是一个草堆，我们可以帮助你在那里找到一根针。” 现在，使用搜索引擎已成为 Web 生活中如此重要的一部分，以至于我们大多数人不会感叹这个地方缺乏目录结构。或者 Yahoo 和 DMOZ 在创建类似图书馆的 Web 内容目录方面的相对失败。

但是，如果 Web 的某些部分实际上变得有组织了呢？那又会怎样？

组织事物的方式不多：按类别、按字母顺序、按数字顺序、按时间顺序、按空间、按地理位置……

我们确实有一种粗略的地理组织，在 DNS 中使用国家代码：.uk、.cz、.jp 等等。只是在美国，除了 del.ic.io.us 之外几乎没有人费心使用 .us 代码。但即便如此，也没有什么能真正破坏 Web 的草堆特性。

直到两种现象结合在一起：博客和联合供稿。它们共同创建了 Web 的一个角落——称之为联合领域——它是按时间顺序组织的。

博客有一个虚拟目录路径——http://[博客名称]/年/月/日/日期/帖子——其中最后一项有自己的永久链接。这就是新的搜索引擎和相关服务（Bloglines、Blogpulse、Feedster、IceRocket、Pubsub 和 Technorati）所理解的目录性质（即使不是结构），它们只关注通过 RSS 订阅源联合供稿的 Web 部分。诸如 Technorati 之类的服务会存档每个带有 RSS 订阅源的博客的每篇文章。对他们来说，每个永久链接实际上都是永久的。（披露：Technorati 的诞生是因为其创始人 David Sifry 和我一起为 Linux Journal 撰写一篇关于博客的文章，而我目前在该公司的顾问委员会任职。）

Google 或 Yahoo 则不然。这些搜索引擎的索引是对 Web 上当前内容的清单。其视角不是按时间顺序或任何类似结构的上下文。一切都是草堆。这很好。它们做得非常出色。而且还是在开源基础设施上，更了不起。

但是，Web 的时间顺序角落的出现是一个有趣的现象，它是自然地、自下而上地发展起来的。没有大公司说“就该如此”。相反，这个新的子领域是自然而然地出现的。现在，另一个有趣的自然现象正在显现：标签。

与 RSS 一样，标签带来了一种新的组织原则，至少在其自身的 Web 角落中是如此。标签是个人可以通过 HTML 应用于任何事物的标签。标签首次出现的地方是 del.ic.io.us 和 Flickr。前者是社交书签管理器，后者是照片存档服务，尽管这两个标签都不能公正地评价这两种服务。关于这两者，重要的是它们的价值主要来自用户的贡献。您在这两项服务中看到的一切几乎都是用户放在那里的。

标签是其中很重要的一部分。在 Flickr 上，您被要求为上传的每张照片添加标签，本质上是用用户定义的类别成员资格来标记。

这种做法已扩展到博客。许多博客现在在其链接中添加 rel="tag" 元素，或在其帖子中附加“tags”或“Technorati tags”。

rel="tag" 规范在 Microformats wiki 中进行了描述。该 wiki 的编辑和作者是 Tantek Çelik。 Derek Powazek 和 Kevin Marks 在“概念”标题下被致谢。这三个人都在 Technorati 工作。

我最近与 Tantek 进行了一次 IM 采访，以加深我对标签的理解

Doc Searls： 技术问题：是谁开始了整个标签这件事？ Delicious？ Flickr？还是两者都有？我知道 T'rati 是第一个搜索它的。那么 rel="tag" 是何时/如何出现的？

Tantek Çelik： Technorati 发明了 rel="tag" 和分布式/去中心化标签。

DS： 那么在此之前，标签是 Delicious 和 Flickr silo 内部的吗？

TÇ： 是的。

DS： 标签和 Technorati 标签有什么区别？后者不是专有的，除非……听起来是这样。

TÇ： 我们一直称它们为“rel 标签”，正是出于这个原因：为了明确。

DS： rel 到底是什么意思？

TÇ： rel 表示当前文档（或其大部分）与超链接指向的 href 之间的关系。它标记这种关系的方式是使用名词来描述 href 处的资源。最好的说明性示例是 rel="stylesheet"，它用于指示那边的 href 是当前文档的样式表。另一个很好的例子是 rel="license"，在此处指定：http://microformats.org/wiki/rel-license。 rel="license" 的意思是 rel="whatever" 是否是 w3c 或任何规范的一部分，此处的 href（例如，指向 CC 或 Apache 或 GPL 许可页面的链接）是当前页面的许可。

DS： 那么 rel 是标准 HTML 吗？

TÇ： rel 是 W3C 在 HTML4 规范中定义的标准 HTML4 属性，该规范*还*规定作者可以使用自己的 rel 值，并可以使用配置文件定义它们。

DS： Technorati 如何搜索 Flickr 和 Delicious？那里的“帖子”是否通过 RSS 订阅源提供？

TÇ： 这就是 XMDP（XHTML 元数据配置文件）的用武之地。 XMDP 是一种用于定义此类配置文件的格式。请参阅此说明。 Technorati 使用 Flickr 和 Delicious 的 RSS 订阅源显示标签结果。

DS： 那么它仍然在 RSS 激活搜索的框架或实践中。

TÇ： 是的。

营销反传统人士 Hugh MacLeod，我曾将他的 Gapingvoid 漫画描述为“适合那些工作不糟糕的人的呆伯特”，最近也对标签产生了兴趣。他和他的朋友 Sig 发明了一种名为 Thingamy 的“无树结构小工具”，他们说这“基本上是一种组织数据、查找数据和转移知识的不同方法”。由于重视自由联想和不精确性，他们称之为 “anataxonomy”。

当然，它被定位为树状结构或任何类型结构的替代方案。但是，正如数据可视化大师 Valdis Krebs 在对 Hugh 的一篇帖子的评论中说的那样，“这不是一个 OR 问题……层级结构 OR 其他东西——比如网络。这是一个 AND 的情况……层级结构 AND 网络——规定的 AND 涌现的……”

我认为它是分类的。这使其成为一种非常短的树，也许只有苔藓的高度。

最重要的是谁提出了它。与 Web 上自然发生的酷事一样，不是大型供应商或其他常见的嫌疑人。而是个人，试图理解这个世界。

当然，金钱稍后会来。

Doc Searls 是 Linux Journal 的高级编辑。他还主管 Doc Searls' IT Garage，该网站由 Linux Journal 的出版商 SSC 出版。

加载 Disqus 评论