葛宇路凭借《如何用自己的名字命名一条道路》火遍网络,虽然这个举动有违法律,但是这种行为艺术还是激发了许多人的兴趣。近日,美国一名程序员在twitter上表示,他的机器人程序已为英国起了超过4500个地名,其中有相当一部分是一些不知名的小地方。
韦斯特沃德霍!——这个带叹号的地名只是英国“不寻常”地名中的一个
从兰韦尔普尔古因吉尔戈格里惠尔恩德罗布尔兰蒂西利奥戈戈戈赫(Llanfairpwllgwyngyll)到韦斯特沃德霍!(Westward Ho!),英国的这些地名古朴而又与众不同。相比较其他国家,其实英国对地区的命名是属于比较有规律的:
-land
England
Cumberland……
以land结尾的地名通常指“XX家的地盘”。
-ton
Northampton
Brighton……
以ton结尾的地名通常指“XX乡”。
当然,更多人关注的是英国的搞笑地名,如Pity Me in County Durham(可怜的我在达勒姆郡村)、Great Snoring in Norfolk(诺福克的巨大鼾声),这些“不寻常”的地名也是这个调皮的程序员的恶搞对象。据他透露,他已经收集了上千个英国地名作为数据集,帮助机器人进行训练。
以下是一些作者认为的比较有趣的名字:
据悉,DanHon(恶搞主人公)的灵感来自Janelle Shane,后者用RGB颜色值训练AI后,AI导出了上万种不同颜色的值。DanHon在博客上分享了数据源,并介绍了相关方法:
下载英国地名列表。点击此处获得CSV格式地名列表,如果觉得麻烦,可访问github.com/danhon/british-placenames/blob/master/data/towns.txt下载作者整理的列表。
选择一个多层次的神经网络。一开始我用了Karpathy的char-RNN,效果不错,后来我又用了jcjohnson的torch-rnn,结果也令人满意。
推荐使用win系统的电脑和N卡。
根据jcjohnson的操作介绍一步步执行。
机器人会自动使用数据集进行训练,这时可以抽空喝杯咖啡。
采样调查。
这个恶搞看似微不足道,甚至毫无意义,但是正是这种毫无道理的、带有一定趣味性的尝试,帮助学界证明了机器学习拥有广泛的应用空间。
“不务正业”的不止是程序员个人,许多大公司也会经常做一些无聊的实验。谷歌曾训练一个AI程序阅读言情(色情)小说,让它学习书中的对话语言。这个程序最后读了超过2865本书,成了语言上的“爱情大师”。无独有偶,微软也推出了一个可以模仿自然人说话语气的聊天机器人,虽然他的目的是打造一个看起来像青春期少女的chatbot,但这个项目最后因涉嫌种族歧视和性别歧视被关停了。