大公网

大公报电子版
首页 > 艺文 > 小公园 > 正文

人工智能阅读/米 哈

2018-12-20 03:18:19大公报
字号
放大
标准
分享

  对於中世纪文献,尤其炼金术士书籍有点认识的读者,必然知道一本充满谜团的书籍,名为《伏尼契手稿》(Voynich manuscript)。《伏尼契手稿》现藏於耶鲁大学图书馆,经过碳十四检测判断它来自於十五世纪初,手稿由上等牛犊皮纸製成,全书有二百四十多页,书中有大量以鹅毛笔写成的文字和插图,而神秘之处在於:至今,我们还是未有读明白手稿上的文字。

  语言学家估计,《伏尼契手稿》由一个有二十至三十个字母的文字系统写成,但书上的文字却不符合我们认知的任何语言,甚至於这语言是来自欧亚地区,还是美洲大陆也未有定案。於是,不少学者便开始看图识字。

  《伏尼契手稿》大概有六个篇章,几乎每一页都有插图,画有不少植物(同样是有已知的,也有未知的,进一步增加了手稿的神秘性)、医学知识、天体、人体构造,以至宇宙观的描绘。看图估字,不少学者估计《伏尼契手稿》是由中世纪炼金术士写成的参考书。

  从第二次世界大战时期,直到现在,《伏尼契手稿》的解码工作儘管艰辛,但从来没有停顿,不少学者都曾经声称成功破解了手稿的文字,例如有说此书是由亚洲地区闪米特语系的阿拉伯语言写成。然而,各种所谓的破译,都是局部的,而且只能认出了若干的词语。

  今年,《伏尼契手稿》的解码工作得到了新进展。这就是运用上近乎是当今所有研究的“最后武器”—人工智能。来自於加拿大的研究团队以由三百八十种语言写成的《世界人权宣言》文本给人工智能阅读、学习。当人工智能的认字率达百分之九十七,他们让人工智能阅读《伏尼契手稿》,并且译出了手稿的第一行句子:“她向家中的人、牧师,以及其他人建议……”

  谜团貌似将要全面解开了,而不少计算机科学家更宣称未来的研究,最终都会由人工智能代劳。真的会这样吗?至少,在今天,语言学家说这译出来的第一行话,语法不太畅顺呢!

点击排行