Work the Shell - 疯狂填词生成器,调整和技巧

作者:Dave Taylor

上个月,我完成了一个脚本,它可以接受任意一组句子,并随机选择、分析和替换词语及其词性,目的是创建一个有趣且引人入胜的疯狂填词风格的益智游戏。经过一些调整,给它一些关于派对策划的简单句子,我们得到了类似这样的东西

If you're ((looking:noun)) [for] a fun ((way:noun)) 
[to] celebrate your next ((birthday:noun)) how 
((about:adjective)) a pirate-themed costume
party? Start by sending ((invitations:noun)) in the 
form of ((a:noun)) <buried:verb> ((treasure:noun)) 
{map} with {X} ((marking:noun)) {the} ((location:noun)) 
[of] your house, then {put} {a} sign on the ((front:noun)) 
((door:noun)) [that] ((reads:noun)) "Ahoy, mateys" {and}
((fill:noun)) [the] ((house:noun)) [with] ((lots:noun)) 
of ((pirate:noun)) ((booty:noun))

在脚本的当前迭代中,它将选定但因太短而被丢弃的单词标记为{},对于无法明确判断词性的单词标记为[],对于我们定义为无趣词性的单词标记为<>.

如果我们将它们显示为普通单词,而不指示它们因不同原因而被拒绝,那么我们剩下的是这样的

If you're ((looking:noun)) for a fun ((way:noun)) 
to celebrate your next ((birthday:noun)) how 
((about:adjective)) a pirate-themed costume party?
Start by sending ((invitations:noun)) in the form of 
((a:noun)) buried ((treasure:noun)) map with X 
((marking:noun)) the ((location:noun)) of your
house, then put a sign on the ((front:noun)) 
((door:noun)) that ((reads:noun)) "Ahoy, mateys" 
and ((fill:noun)) the ((house:noun)) with
((lots:noun)) of ((pirate:noun)) ((booty:noun))

接下来,让我们看看通过简单地将我们选择的单词留空来获得的输出

If you're ___ for a fun ___ to celebrate your next 
___ how ___ a pirate-themed costume party? Start 
by sending ___ in the form of ___ buried ___ map 
with X ___ the ___ of your house, then put a sign on 
the ___ ___ that ___ "Ahoy, mateys" and ___ the ___ 
with ___ of ___ ___.

似乎替换的单词太多了,不是吗?幸运的是,这很容易调整。

稍微难以调整的是,启发式方法中幸存下来了两个糟糕的选择:“a”(在“form of a buried treasure map”中)和“about”(在“how about a pirate-themed costume party?”中)。仅仅将可替换单词的最小长度设置为三个字母?跳过形容词?

就本专栏而言,让我们继续进行,因为这种事情永远不会像人类编辑那样,从一段平淡的散文中提取出有趣的重新诠释的潜力。

提示输入

脚本演进的下一步是提示用户输入不同的词性,然后在分析和输出文本段落时,实际将这些词性替换为原始单词。

有几种方法可以解决这个问题,但让我们利用trfmt将所有空格替换为回车符,然后将它们整齐地重新组合成格式化的文本。

问题在于,标准输入和标准输出都已经映射和重定向:输入来自输入文件的重定向,输出进入管道,该管道将各个单词重新组合成段落。

这意味着我们最终需要像下面这样复杂的解决方案

/bin/echo -n "Enter a ${pos}: " > /dev/tty
read newword < /dev/tty
echo $newword

我们必须小心不要重定向到 /dev/stdout,因为它是重定向的,这意味着像这样的符号&>1会遇到输入和输出混乱的相同问题。

相反,它实际上开箱即用效果很好

$ sh madlib.sh < madlib-sample-text-2
Enter a noun: Starbucks
Enter a adjective: wet
Enter a adjective: sticky
Enter a noun: jeans
Enter a noun: dog
Enter a noun: window
Enter a noun: mouse
Enter a noun: bathroom
Enter a noun: Uncle Mort

这产生了以下结果

If you're (( Starbucks )) for a fun way to celebrate 
your (( wet )) birthday, how (( sticky )) a pirate-themed 
costume (( jeans )) Start by sending invitations in the 
(( dog )) of a buried treasure map with X marking the 
(( window )) of your house, then put a (( mouse )) on 
the front (( bathroom )) that reads "Ahoy mateys" and fill 
the house with lots of pirate (( Uncle Mort ))

现在让我们添加一些提示,因为如果您像我一样,您可能不会立即记住动词和形容词之间的区别。这是我想出的

verb: an action word (eat, sleep, drink, jump)
noun: a person, place or thing (dog, Uncle Mort, Starbucks)
adjective: an attribute (red, squishy, sticky, wet)

与其仅仅询问词性,我们可以使用一个简单的 case 语句来包含有用的提示

case $pos in
  noun ) prompt="Noun (person, place or thing: 
  ↪dog, Uncle Mort, Starbucks)" ;;
  verb ) prompt="Verb (action word: eat, 
  ↪sleep, drink, jump)" ;;
  adjective ) prompt="Adjective (attribute: red, 
  ↪squishy, sticky, wet)" ;;
  * ) prompt="$pos" ;;
esac
/bin/echo -n "${prompt}: " > /dev/tty

我们需要为完整性添加的另一件事是检测我们何时有复数与单数,特别是对于名词。这可以通过简单地查看单词的最后一个字母是否是 s 来完成。它不是 100% 准确,但就我们的目的而言,我们将认为它相当不错

plural=""
if [ "$(echo $word | rev | cut -c1)" = "s" ] ; then
  plural="Plural ";
fi

然后,只需适当地修改提示

/bin/echo -n "$plural${prompt}: " > /dev/tty
但是,存在问题

然而,回顾我们所做的工作,存在一些问题。最重要的是,尽管我们有一个识别词性的工具,但它并不是特别准确,因为事实证明,许多单词只能根据它们的用法和上下文来正确识别。语法学家已经识别出上面的一些问题!更重要的是,我怀疑无论我们如何修改脚本以进行更智能的单词选择和识别上下文,事实是,创建一个真正出色的疯狂填词需要人工干预。给定一个任意句子,有些单词可以被替换以使其变得有趣,而另一些单词只会使其变得难以理解。

现在,拥有一个稍微不那么雄心勃勃的程序,它可以理解疯狂填词类型的标记语言,并根据需要进行提示,在用户输入后重新组装结果,这不会太过分。也许是“The <noun> in <place> stays mainly in the plain”,它变成了

Noun (person, place or thing):
Noun (a place):

但是,我将把它留作(准备好了吗?)读者的练习!

注意:Mad Libs 是 Penguin Group USA 的注册商标。

Dave Taylor 从事 shell 脚本编程已经很长时间了,三十年了。他是畅销书 Wicked Cool Shell Scripts 的作者,可以在 Twitter 上通过 @DaveTaylor 找到他,更广泛的信息请访问 www.DaveTaylorOnline.com

加载 Disqus 评论