更深入理解网络
编者注:以下是 Doc Searls 的 SuitWatch 时事通讯 6 月 9 日和 6 月 23 日刊的内容。 注册成为这份双周时事通讯的订阅者。
我认为互联网和 Web 如此成功的原因之一是它们在很大程度上没有组织框架。 唯一的目录是域名系统 (DNS),它没有指定第一个单斜杠 / 之后的内容。 其余部分可以自由地变成任何人想做的那么大的草堆。
我们确实做到了,在搜索引擎的帮助下。 Web 的草堆特性需要搜索引擎。 实际上,Google 和 Yahoo 说:“没错,Web 是一个草堆,我们可以帮助你在那里找到一根针。” 现在,使用搜索引擎已成为 Web 生活中如此重要的一部分,以至于我们大多数人不会感叹这个地方缺乏目录结构。 或者 Yahoo 和 DMOZ 在创建类似图书馆的 Web 内容目录方面的相对失败。
但是,如果 Web 的某些部分实际上变得有组织了呢? 那又会怎样?
组织事物的方式不多:按类别、按字母顺序、按数字顺序、按时间顺序、按空间、按地理位置……
我们确实有一种粗略的地理组织,在 DNS 中使用国家代码:.uk、.cz、.jp 等等。 只是在美国,除了 del.ic.io.us 之外几乎没有人费心使用 .us 代码。 但即便如此,也没有什么能真正破坏 Web 的草堆特性。
直到两种现象结合在一起:博客和联合供稿。 它们共同创建了 Web 的一个角落——称之为联合领域——它是按时间顺序组织的。
博客有一个虚拟目录路径——http://[博客名称]/年/月/日/日期/帖子——其中最后一项有自己的永久链接。 这就是新的搜索引擎和相关服务(Bloglines、Blogpulse、Feedster、IceRocket、Pubsub 和 Technorati)所理解的目录性质(即使不是结构),它们只关注通过 RSS 订阅源联合供稿的 Web 部分。 诸如 Technorati 之类的服务会存档每个带有 RSS 订阅源的博客的每篇文章。 对他们来说,每个永久链接实际上都是永久的。(披露:Technorati 的诞生是因为其创始人 David Sifry 和我一起为 Linux Journal 撰写一篇关于博客的文章,而我目前在该公司的顾问委员会任职。)
Google 或 Yahoo 则不然。 这些搜索引擎的索引是对 Web 上当前内容的清单。 其视角不是按时间顺序或任何类似结构的上下文。 一切都是草堆。 这很好。 它们做得非常出色。 而且还是在开源基础设施上,更了不起。
但是,Web 的时间顺序角落的出现是一个有趣的现象,它是自然地、自下而上地发展起来的。 没有大公司说“就该如此”。 相反,这个新的子领域是自然而然地出现的。 现在,另一个有趣的自然现象正在显现:标签。
与 RSS 一样,标签带来了一种新的组织原则,至少在其自身的 Web 角落中是如此。 标签是个人可以通过 HTML 应用于任何事物的标签。 标签首次出现的地方是 del.ic.io.us 和 Flickr。 前者是社交书签管理器,后者是照片存档服务,尽管这两个标签都不能公正地评价这两种服务。 关于这两者,重要的是它们的价值主要来自用户的贡献。 您在这两项服务中看到的一切几乎都是用户放在那里的。
标签是其中很重要的一部分。 在 Flickr 上,您被要求为上传的每张照片添加标签,本质上是用用户定义的类别成员资格来标记。
这种做法已扩展到博客。 许多博客现在在其链接中添加 rel="tag" 元素,或在其帖子中附加“tags”或“Technorati tags”。
rel="tag" 规范在 Microformats wiki 中进行了描述。 该 wiki 的编辑和作者是 Tantek Çelik。 Derek Powazek 和 Kevin Marks 在“概念”标题下被致谢。 这三个人都在 Technorati 工作。
我最近与 Tantek 进行了一次 IM 采访,以加深我对标签的理解
Doc Searls: 技术问题:是谁开始了整个标签这件事? Delicious? Flickr? 还是两者都有? 我知道 T'rati 是第一个搜索它的。 那么 rel="tag" 是何时/如何出现的?
Tantek Çelik: Technorati 发明了 rel="tag" 和分布式/去中心化标签。
DS: 那么在此之前,标签是 Delicious 和 Flickr silo 内部的吗?
TÇ: 是的。
DS: 标签和 Technorati 标签有什么区别? 后者不是专有的,除非……听起来是这样。
TÇ: 我们一直称它们为“rel 标签”,正是出于这个原因:为了明确。
DS: rel 到底是什么意思?
TÇ: rel 表示当前文档(或其大部分)与超链接指向的 href 之间的关系。 它标记这种关系的方式是使用名词来描述 href 处的资源。 最好的说明性示例是 rel="stylesheet",它用于指示那边的 href 是当前文档的样式表。 另一个很好的例子是 rel="license",在此处指定:http://microformats.org/wiki/rel-license。 rel="license" 的意思是 rel="whatever" 是否是 w3c 或任何规范的一部分,此处的 href(例如,指向 CC 或 Apache 或 GPL 许可页面的链接)是当前页面的许可。
DS: 那么 rel 是标准 HTML 吗?
TÇ: rel 是 W3C 在 HTML4 规范中定义的标准 HTML4 属性,该规范*还*规定作者可以使用自己的 rel 值,并可以使用配置文件定义它们。
DS: Technorati 如何搜索 Flickr 和 Delicious? 那里的“帖子”是否通过 RSS 订阅源提供?
TÇ: 这就是 XMDP(XHTML 元数据配置文件)的用武之地。 XMDP 是一种用于定义此类配置文件的格式。 请参阅 此说明。 Technorati 使用 Flickr 和 Delicious 的 RSS 订阅源显示标签结果。
DS: 那么它仍然在 RSS 激活搜索的框架或实践中。
TÇ: 是的。
营销反传统人士 Hugh MacLeod,我曾将他的 Gapingvoid 漫画描述为“适合那些工作不糟糕的人的呆伯特”,最近也对标签产生了兴趣。 他和他的朋友 Sig 发明了一种名为 Thingamy 的“无树结构小工具”,他们说这“基本上是一种组织数据、查找数据和转移知识的不同方法”。 由于重视自由联想和不精确性,他们称之为 “anataxonomy”。
当然,它被定位为树状结构或任何类型结构的替代方案。 但是,正如数据可视化大师 Valdis Krebs 在对 Hugh 的一篇帖子的评论中说的那样,“这不是一个 OR 问题……层级结构 OR 其他东西——比如网络。 这是一个 AND 的情况……层级结构 AND 网络——规定的 AND 涌现的……”
我认为它是分类的。 这使其成为一种非常短的树,也许只有苔藓的高度。
最重要的是谁提出了它。 与 Web 上自然发生的酷事一样,不是大型供应商或其他常见的嫌疑人。 而是个人,试图理解这个世界。
当然,金钱稍后会来。
Doc Searls 是 Linux Journal 的高级编辑。 他还主管 Doc Searls' IT Garage,该网站由 Linux Journal 的出版商 SSC 出版。