软件

OpenOffice.org：可读性和语法扩展的局限性

于 2009 年 9 月 8 日

作为一名专业作家，我的软件需求很简单。给我一个文本编辑器——最好是 Bluefish，但 vim 或 OpenOffice.org Writer 也行——我就拥有一切所需。

然而，从作家可用的辅助工具的数量来看，我显然是少数。小说情节数据库、每日字数计数器、角色生成器——如果你能想象出这种软件，你可能至少能找到一个例子。我为所有这些独创性感到着迷，但在大多数时候，我的结论是，如果你足够了解如何使用这些工具而不让它们给你带来更大的困难，那么你就可以不用它们。OpenOffice.org 扩展 Readability Report 和 Language Tool 是两个完美地说明我观点的应用程序。

Readability Report

Readability Report 是一个扩展，它报告您当前文档在标准理解测试中的得分：Flesch-Kincaid Easy Reading and Grade Level、FOG Index、SMOG Index 和 Automated Readability Test。

这些测试在细节上有所不同，但它们都着眼于诸如每句单词数、复杂和多音节单词数等特征，以产生受众理解一段文字所需的大致教育水平。此外，Readability Report 还包括其自身的 Weirdness Metric，它给出了平均句子得分，并报告了段落中最可读和最不可读的句子。

所有这些测试都可以从顶级菜单中获得，可以针对整个文档生成简要报告，也可以生成详细报告，其中给出每个段落的测试结果。报告在单独的文档中打开，以便您可以保存或打印它们。

除了 Readability Report 作为一个功能而言太小，不适合放在自己的顶级菜单中之外，该扩展本身没有任何问题。但是它包含的测试都是非常有限的工具，受制于对可读性过于机械的看法。

首先，测试衡量的任何事物本身都不是可读性的有力指标。如果句子标点正确并使用了诸如平行结构之类的基本修辞技巧，那么三四行长的句子也可能非常易读。同样，单词的可读性较少取决于音节的数量，而更多取决于它们的常见程度；例如，“impossibility”不应与“duodecahedron”混为一谈，并且比像“gormless”这样的短词更容易理解。

此外，这些测试假设，分数越低，文档的可读性就越高。然而，在实践中，可读性在很大程度上取决于上下文和受众。如果向普通受众撰写关于挂载驱动器、设备或文件系统的文章，您可能会让他们无法理解，但是，如果对自由软件用户使用相同的术语，那么每个人都可能会理解相同的词语。

由于测试本身存在这样的局限性，您可以使用 Readability Report 来精简您的用词和句子长度，直到它在理论上可以被三年级学生阅读，但仍然写得不够好。写作是一门技艺，而不是一门艺术，所以最终这些测试的意义非常小。

您最多可以说的是，Readability Report 的详细分析可以告诉您您的可读性在段落之间如何变化。我不了解其他人，但当您可以通过不断提醒自己写得简单明了来获得几乎相同的结果时，这似乎是一个微不足道的好处。

LanguageTool

语法检查器是 OpenOffice.org 中最受请求的功能之一，因此 LanguageTool 尝试提供一个语法检查器使其成为一个流行的扩展。然而，LanguageTool 不仅本身不完整，而且也未能克服使我见过的每个语法检查器都不足的障碍——在英语中，由于其弱屈折变化和变位，除非在上下文中，否则几乎不可能知道特定单词可能是哪种词性。不幸的是，LanguageTool 对大多数上下文的盲目程度与 Readability Report 相同。

LanguageTool 在“工具”菜单的语言部分安装一个子菜单。如果启用自动检查，它会与拼写检查器一起运行，用蓝色下划线标记违规元素，或者从其自身的子菜单中单独运行。

在子菜单中，您可以选择“配置”以查看 LanguageTool 监视的违规列表。列表中的许多项目根本不是语法问题，而是风格问题，例如以大写字母开头句子或避免使用俚语。其他项目是常见的错别字，可以放入自动更正中。然而，即使在这里，LanguageTool 在很大程度上也对风格充耳不闻。例如，它忽略了您可能想要使用诸如“the reason why”或“each and every one”之类的冗余短语来强调的可能性——这在像英语这样具有日耳曼语根源的语言中是一种广泛且完全可以接受的习惯。

然而，即使在纯语法方面，LanguageTool 也很弱。它仅在特定情况下捕获主谓一致，并且，当它捕获使用动词“to be”的错误形式的实例时，它建议您使用“be”作为替代，从而导致您出错。代词指代和数量一致性同样不一致，而诸如错误的平行结构之类的其他元素根本没有提及。这些失误使得 LanguageTool 以其自身的方式成为与 Readability Report 一样不可靠的功能。

诱人，但尚未成熟

您可能会认为我对这些扩展要求太苛刻了。毕竟，可读性和语法是复杂的问题，并且为它们编程很困难。既然拼写检查器也不是万无一失的，为什么我应该对努力提供许多读者想要的功能持如此消极的态度呢？

答案很简单。拼写检查器确实可以捕获更明显的错别字，并且它的局限性是众所周知的。大多数在电脑旁待过一段时间的人现在都知道，在运行拼写检查器之后，您需要进行额外的校对。

相比之下，Readability Report 和 LanguageTool 等工具以客观的态度呈现他们的发现。用户可能会认为，如果可读性测试告诉他们他们的文档是清晰的，或者语法检查器标记了一个错误，那么该软件一定是正确的。添加一个精确的数字，就像可读性测试所做的那样，您很容易被虚假的精确感所迷惑。如果英语不是您的第一语言，或者当您对自己的写作能力缺乏信心时，相信这些事情的诱惑力一定特别强烈。

然而，任何基于规则的改进写作的努力都会在很大程度上是错误的。可读性和语法工具可以改进，但只能在有限的范围内改进。两者在办公软件套件中已经存在超过 20 年，并且两者都不如经验丰富的编辑可靠。到现在，似乎很可能它们永远不会像经验丰富的编辑那样可靠，除非我们开发出人类水平的人工智能。

走捷径的想法很诱人，这就是为什么这些工具如此诱人。可悲的是，它们都不能替代技能和个人知识——当然 Readability Report 或 LanguageTool 也不能。