Ogg Vorbis—开放、免费音频—解放你的媒体

作者:Jack Moffitt

音频已成为网络上最受欢迎的应用之一。凭借全球网络提供的发行能力,音乐产业正在被永久地重塑。

互联网上音频应用和文件的繁荣是当前围绕版权法和音乐许可的许多诉讼的根源。唱片业现在才开始弄清楚早期用户第一次在他们的电脑上播放音频文件时就知道的事情:对于艺术家、听众和唱片公司来说,这是一个全新的世界。

处于这场剧变中心的是使这一切成为可能的技术,而一项新技术 Ogg Vorbis 正准备将这场革命推向更高的档位。

Ogg Vorbis 是一种开源且无专利的音频编解码器,由 Xiphophorus 以及其他几个多媒体项目(cdparanoia 和 Icecast,仅举两个例子)共同开发。Xiphophorus 是开源的、与多媒体相关的项目和程序员的集合,他们致力于确保互联网多媒体标准属于公共领域,这才是它们应有的归属。Ogg Vorbis 的工作目前由 CMGI 旗下的娱乐部门 iCAST 资助。

Ogg Vorbis 是一种开放标准,这在很多方面都很重要。在数字音频领域,真正的开放标准很少。看看 Windows Media、Quicktime 或 RealAudio。这些标准都是封闭和专有的,正因如此,这些标准彼此之间(或在其公司围墙之外)都不能很好地互操作。你上次可以在 RealPlayer 中播放 Quicktime 4 或反之是什么时候?Linux 何时才能支持 Quicktime 或 Windows Media?Linux 和互联网建立在开放标准之上,随着互联网和 Linux 上的多媒体迅速成熟,对像 Ogg Vorbis 这样的多媒体应用的需求也在迅速增长。

Ogg Vorbis 由两部分组成:Ogg 和 Vorbis。Ogg 是一种封装格式,在某些方面类似于 Apple 的 Quicktime 或 Microsoft 的 Active Streaming Format。它可以帮助你收集一组属于一起的东西。例如,如果你有一个 Ogg 电影文件,它可能包含一个 Vorbis 流以及另一个编解码器中的视频流。或者 Ogg 电影文件可能包含十个 Vorbis 流,每种可用语言一个。

Vorbis 是在 Ogg 框架内编写的编解码器。它是一种通用的音频编解码器,适用于压缩大多数音频源并获得良好的效果。它不像某些编解码器那样使用子带,但它确实使用类似于其他编解码器的矢量量化。

Vorbis 是我们迄今为止编写的唯一编解码器,但不是我们计划编写的唯一编解码器。还有 Squish 和 Tarkin。

Squish 是一种无损音频编解码器,这意味着质量完全没有损失,实际上,解码后的流将与原始流逐字节相同。你可能想使用它来存档母带。

Tarkin 是我们新生的视频编解码器。它仍在开发中,但我可以告诉你,它基于小波,而不是像大多数现代编解码器(包括 MPEG-4 和 JPEG)那样基于 MDCT。我们仍在研究它,但它非常有前景。

编解码器很难开发。它们需要大量的数学技能和大量的时间。一旦你完成开发,你仍然必须对其进行调整、修复错误并考虑添加酷炫的新功能。这就是为什么 Ogg Vorbis 目前主要关注 Vorbis 和 Ogg 框架的原因。

MP3 有什么问题?

许多读者可能想知道,既然 MP3 已经如此广泛地使用,我们为什么还要费心开发 Ogg Vorbis。MP3 有什么问题?它是免费的,对吧?错了。

你有没有注意到免费 MP3 编码器的惊人缺乏,特别是考虑到 MP3 已经变得如此流行?我可以用一只手全部数完它们。有些人会记得 1997 年末 Fraunhofer 的著名信件。这封信要求所有开源和免费的 MP3 编码器停止并终止或开始支付专利许可费。MP3 使用的算法大约有 12 项专利,所有这些专利都受到所有者 Fraunhofer 的严格执行。

这种专利执行有几个负面影响。几乎不可能拥有免费的 MP3 编码器,因为这样做需要支付许可费。每次下载费用为 2.50 美元(如果使用 Fraunhofer 代码则为 5 美元)。大多数免费编码器都消失了,没有办法支付这种贡品。MusicMatch 是一家流行的 Windows 编码器制造商,将其公司的大部分股份出售给了 Fraunhofer,以换取无限许可。

Fraunhofer 也可以随时更改他们的规则。在 1997 年之前,分发 MP3 编码器是可以的。目前,以 MP3 格式广播是免费的,但 Fraunhofer 表示,他打算在今年年底对这种使用收取许可费。

RIAA 为商业音乐广播达成的交易通常是每首歌三分之一到二分之一美分,考虑到 Fraunhofer 可能希望向你收取收入的 1%,最低每首歌一美分(这些是我从当前商业 MP3 下载费用中推断出来的)。MP3 真的比它提供的音乐贵三倍吗?

许可一个解码器需要花费 0.50 美元。这些不是与 MP3 相关的唯一成本,实际上,有些只是我的推测(希望广播的实际费用会低得多),但专利持有人可以随时随地设定或更改许可费。而且,他们已经表示,他们打算在今年年底对广播这样做。重点不是 15,000 美元还是 5 美元。重点是他们有权随意定价。

MP3 是一项古老的技术。发烧友和程序员长期以来一直在调整编码器,但这项技术不再改进。即使是 LAME,最好的 MP3 编码器之一,也有新的选项来打破规范,试图挤出更多的质量。这种格式中已经没有更多空间来进行新的调整或改进。

替代方案也不是很好。高级音频编码 (AAC) 是 MPEG-4 的一部分,其 IP 限制比 MP3 更多。大多数技术都涉及多家公司,这使得许可更加繁琐。VQF 格式被 NTT 和 Yamaha 紧紧锁定。RealNetworks 和 Microsoft 也不是以其开放标准而闻名。一些衍生编解码器(如 MP+)存在问题,因为它们面临与常规 MP3 编解码器相同的专利限制。

考虑到所有这些固有的问题以及对在互联网上更好地处理音频的需求,解决方案来自开源社区也就不足为奇了。

Ogg Vorbis 与 MP3
Ogg Vorbis—Open, Free Audio—Set Your Media Free

图 1. Ogg Vorbis 与 MP3

Ogg Vorbis 是无专利的,并且从一开始就以这种方式设计。使用该格式用于任何目的(无论是商业用途还是非商业用途)都没有许可费或成本。它也是在 LGPL 条款下的开源,因此即使是源代码对于公司和黑客同行也是免费的。

仅仅免费是不够的。Vorbis 具有卓越的音质,这正是人们对下一代音频编解码器的期望。由于可扩展的格式,Vorbis 的质量将在未来几年内不断提高,而不会影响已经使用的解码器。Vorbis 现在听起来很棒,但质量与六个月后的 Vorbis 相比根本不算什么。

质量不是 Vorbis 提供的唯一优势。Vorbis 还有一些独特的技术特性:可扩展的注释、比特率剥离和访问原始编解码器数据包。

注释是在格式中定义的,因此无需担心像 ID3 标签这样丑陋和限制性的黑客行为。注释以 name=value 对的形式存储,虽然有一个标准注释集供应用程序遵守常用数据,但如果需要,你可以添加任意注释。

比特率剥离允许在不重新编码的情况下动态降低流或文件的比特率。这是通过将最有用的数据编码到数据包的开头来实现的。精简流只是在发送每个数据包之前切掉它们的尾部。想象一下收听一个无线电流,它根据你的个人带宽需求改变比特率。如果你有丢包,它会向你发送一个较小的流;如果你的下载完成,它会向你发送更多数据。

对于组播或其他特殊应用,访问原始 Vorbis 数据包可以完全控制数据的组织和洗牌方式。

而且,没有理由忍受前导或尾随静音,因为 Vorbis 在搜索和解码方面具有样本粒度。还记得你最喜欢的迷幻 CD 上曲目之间的所有间隔吗?它们在 Vorbis 中消失了。需要精确搜索到样本 303054 吗?Vorbis 提供了一种实现此目的的机制。这使得 Vorbis 非常适合生产工作,而 MP3 从未如此。

开发人员和用户会很高兴拥有一套高质量的参考库。这意味着并非每个想编写音频播放器的人都需要编写自己的解码器。开发人员也有更多时间花在音频格式以外的其他事情上。这使他们能够构建更复杂和更有用的软件。

当前状态

两年半的 Vorbis 开发(大部分时间是作为副项目)最终在今年 6 月中旬为我们带来了 Ogg Vorbis beta1 版本。它仅限于一个比特率,但它已经为大多数播放器提供了插件,并在许多平台上提供了支持。

8 月,Ogg Vorbis beta2 版本在加利福尼亚州圣何塞举行的 LinuxWorld Expo 上发布。从 128kbps 到 350KBps 的五个比特率和几个质量改进是主要功能。

现在我们正在迅速接近 beta3 版本,它具有许多显着的质量改进。这主要是由于许多耳朵报告了伪像和错误。代码的组织目标是永久 API,并添加了几个新工具。

进行了一些优化,使解码器速度提高了一倍。我们还调整了代码,使其能够容忍那些仅使用整数数学来实现 Vorbis 的人。这使得硬件和嵌入式设备更容易支持 Ogg Vorbis 播放。

自发布以来的三个月里,我们已经有超过 100,000 次 Ogg Vorbis 下载,并且第三方支持到目前为止一直很棒。Xmms、Freeamp 和 Kmpg 已经支持 Vorbis 播放(甚至像 Sonique 和 Winamp 这样流行的 Windows 播放器也支持 Vorbis)。LAME 现在可以生成 Ogg Vorbis 文件以及 MP3 文件,并且可以一步将 MP3 重新编码为 Vorbis。有人报告说 Grip CD 抓取器取得了成功,并且新的应用程序层出不穷。

一些早期采用的内容制作者也开始接受这种格式。Vorbisonic.com 和 eFolkmusic.com 已经上传了 Ogg Vorbis 文件供下载,你可以在 www.vorbis.com 页面上找到更多站点。

在我们的 beta1 版本发布后不久,我们对域名中包含“vorbis”的域名进行了一些随机搜索,结果表明很多人都在购买与 Vorbis 相关的域名。一些与 Vorbis 相关的站点已经出现,包括 govorbis.com 和 vorbiszone.com。

我们的未来方向

我们才刚刚开始优化过程。在解码方面,Ogg Vorbis 几乎与当前的 MP3 解码器一样快,并且应该很快赶上。已经有人声称在 Pentium 120 机器上可以流畅播放。在编码方面,在快速 Pentium II 和 Pentium III 上已经可以进行实时编码。现在 API 变得稳定,更多功能被淘汰,越来越多的人开始转向速度问题。

将 Vorbis 与 MP3 进行比较几乎是不公平的,因为 Vorbis 没有通道耦合,但我们仍然领先。有一些棘手的专利我们必须绕过,但开发团队正在寻求 Ambisonics 来填补这一空白。Ambisonics 曾获得专利,但专利已经过期。该公司本身由于来自 Dolby 的激烈竞争而倒闭。Ambisonics 技术将为 Vorbis 提供真正的三维球形声音,它可以映射到任意数量的扬声器上——所有这些仅在四个通道中(一个和两个用于立体声,三个用于环绕声,四个用于球形声音)。利用通道耦合应该可以轻松地将比特率降低 40%。

流媒体也在列表上名列前茅。我们目前正在测试流媒体,应该在 11 月之前建立几个测试站。此后不久,Icecast 应该开始支持 Vorbis 作为其主要的音频格式。这为互联网广播爱好者提供了更高质量的流媒体,并为广播公司提供了一种摆脱年底广播版税的方式。

对于流媒体,较低的比特率至关重要。目前,参考编码器输出的最低比特率约为 128KBps。典型的流媒体范围从 24KBps 到 64KBps,我们很快将专注于进行必要的调整,以使低比特率 Vorbis 听起来很棒。较低的采样率也即将到来。

而且,与往常一样,我们通过添加增强质量的功能并消除明显的伪像来严格调整和提高音频质量。

Ogg Vorbis 1.0,其中包括上述功能,应该在你阅读本文时完成。

在 MP3 上取得进展

很多人问我们,我们计划如何夺回 MP3 已经占据的阵地。有些人甚至认为这是不可能的。我认为这是可能的。你不能真正将 Vorbis 与其他试图实现我们目标的音频编解码器进行比较,因为除了 Vorbis 之外,没有其他音频编解码器比 MP3 更自由、更开放。MP3 运动成功的部分原因是支持它的软件数量庞大。软件支持的出现是因为互联网上到处都是代码,并且有关于如何使用它或编写自己的代码的文档。有些人将 MP3 与 Vorbis 比作 VHS 与 Betamax。他们说,仅仅因为我们在技术上更优秀,并不意味着我们会获胜。我想这些人没有意识到 VHS 获胜是因为这项技术实际上更开放。

我们的策略是争取两类群体:艺术家和开发人员。

艺术家和其他内容制作者需要 Vorbis 来避免将其收入的百分比支付给德国的某家技术公司。这些人中的大多数人也对拥有他们可以获得的音质最好的产品感兴趣。人们不会仅仅为了技术而选择 Vorbis 或 MP3 文件。人们想要他们欣赏的艺术家的音乐,或者他们喜欢的 темы 的节目,并且他们希望音乐是可用的、可传输的和易于操作的。

开发人员希望在其软件中包含音频——而不仅仅是为了解码和播放。只有在开源世界中,才能使用像 Ogg Vorbis 这样的开放媒体标准和无专利算法来创建富媒体创作工具。将 Vorbis 包含到软件中很容易(即使程序员是 Vorbis 的新手和 Vorbis 插件 API,编写播放插件也只需很少的时间)。

如果 Vorbis 中正在制作内容并且所有应用程序都支持 Vorbis,则用户可能甚至不会注意到。易用性是通过透明度实现的。从现在开始的几年后,我们可能仍然将在线音乐称为“MP3”,就像有些人仍然将复印称为“施乐复印”一样,但这项技术将来自不同的来源。

你如何提供帮助

就像任何开源项目一样,Vorbis 只有在社区的帮助下才能充分发挥其潜力。程序员、发烧友、音乐家和传播者都是需要的。用 Vorbis 编码一些音乐,收听 Vorbis 文件,并让我们知道你是否听到任何原始文件中没有的东西。伪像一旦被某人识别出来,通常很容易修复。如果你目前有一个可以(或确实)播放或编码音频的项目,请尝试 Vorbis。不仅 Vorbis 的受众会增长,而且用户也会欣赏 Vorbis 提供的功能。与其创建音乐并以 MP3 格式将其在线发布,不如以 Vorbis 格式进行。通过制作 Vorbis 文件,你可以避免专利持有人强制执行的限制,并增加用户对 Vorbis 的需求。将 Vorbis 告诉你的朋友、家人和同事。任何推广像 Vorbis 这样的互联网音频开放标准的努力都是值得的。在 Vorbis 生命的初期阶段,我们真的可以使用帮助。

结论

互联网多媒体的开放标准是一个值得追求且可以实现的目标,特别是对于像 Vorbis 这样高质量的开源音频编解码器而言。

正如 HTTP、FTP、TCP/IP 和其他开放标准帮助改变了网络格局一样,我们的目标是使用比封闭或受专利保护的替代方案听起来更好、看起来更好、协同工作更好的工具来改变多媒体的面貌。你很可能正在使用一个在其核心依赖于开放标准和开源的操作系统;为什么不期望你使用的多媒体应用程序也一样呢?

请访问 Ogg Vorbis 演示站点 www.vorbis.com 或 Xiphophorus 开发者站点 www.xiph.org

Ogg Vorbis—Open, Free Audio—Set Your Media Free
Jack 从六岁起就开始编程,编写从游戏到声音驱动程序、通信软件和密码学的所有内容。2000 年 1 月,Jack 成为 iCAST 的技术副总裁,iCAST 是 CMGI 的娱乐部门。在 iCAST,Jack 管理着开源技术研发团队,该团队目前正在开发 Icecast、Ogg Vorbis 和一个代号为“Tarkin”的视频编解码器。他们的目标与 Icecast 的最初目标相同,是为互联网上的多媒体开发一个开放框架,以确保良好的质量、可靠性和互操作性。
加载 Disqus 评论