大约有1000万人说奎丘亚语,但要想将电子邮件和短信自动翻译成美洲使用最广泛的土著语言,几乎是不可能的。
周三,谷歌在其数字翻译服务中加入了奎丘亚语和其他多种语言,情况发生了变化。
这家互联网巨头表示,新的人工智能技术使其能够极大地扩展谷歌翻译的世界语言曲目。本周新增了24种语言,包括奎丘亚语和其他南美土著语言,如瓜拉尼语和艾马拉语。它还增加了一些流行科技产品中缺失的广泛使用的非洲和南亚语言。
谷歌研究科学家艾萨克·卡斯韦尔告诉记者:“我们研究了人口众多、服务不足的语言。”。
这家加利福尼亚公司一年一度的输入/输出技术展示会的消息可能会在世界许多角落受到庆祝。但这也可能会招致那些对以前的科技产品感到失望的人的批评,这些产品未能理解其语言或文化的细微差别。
奎丘亚语是印加帝国的通用语,从现在的哥伦比亚南部延伸到智利中部。400多年前西班牙征服秘鲁后,其地位开始下降。
将其添加到谷歌认可的语言中,对于奎丘亚语活动家来说是一个巨大的胜利,比如创建了Qichwa 2.0网站的秘鲁人路易斯·伊拉坎基,该网站包括字典和学习该语言的资源。
没有参与谷歌项目的Illaccanqui表示:“这将有助于将奎丘亚语和西班牙语置于同等地位。”。
Illaccanqui的姓在奎丘亚语中的意思是“你是闪电”,他说,这位翻译还将帮助新一代年轻人和青少年保持这种语言的活力,“他们同时会说奎丘亚语和西班牙语,并且对社交网络着迷。”
Caswell称这一消息是“技术上的一大进步”,因为直到最近,如果研究人员无法找到足够多的在线文本,就不可能添加语言鈥攕如数字图书、报纸或社交媒体帖子鈥攆或者他们的人工智能系统。
U、 美国科技巨头在让自己的语言技术在最富裕的市场之外发挥良好作用方面没有很好的记录,这一问题也使得他们更难在自己的平台上发现危险的错误信息。直到本周,Google Translate还提供了弗里西亚语、马耳他语、冰岛语和科西嘉语等欧洲语言鈥攅演讲者少于100万的ach鈥攂但不是像Oromo和Tigrinya这样拥有数百万人的东非语言。
新语言将于本周推出。谷歌语音助手目前还不能理解这些内容,目前只能进行文本到文本的翻译。谷歌表示,它正在努力增加语音识别和其他功能,例如通过将摄像头对准标牌来翻译标牌。
Illaccanqui说,这对于像奎丘亚语这样的主要语言来说非常重要,尤其是在卫生领域,因为许多只会说西班牙语的秘鲁医生和护士在农村地区工作,“无法理解主要说奎丘亚语的患者”。
爱丁堡大学秘鲁机器翻译研究员Arturo Oncevay说:“下一个前沿或挑战是研究语言”,他与人共同成立了一个研究联盟,以改善美洲的土著语言技术。“美洲的土著语言传统上是口头的。”
谷歌在公告中警告称,新增加的语言的翻译质量“仍远远落后于”它支持的其他语言,如英语、西班牙语和德语,并指出这些模式“会出错,并表现出自己的偏见”但卡斯韦尔表示,该公司只有在其人工智能系统达到一定的熟练程度时才添加语言。
他说:“如果有相当多的案例是非常错误的,那么我们不会将其包括在内。”。“即使90%的翻译是完美的,但10%是胡说八道,这对我们来说有点太过分了。”
谷歌表示,其产品目前支持133种语言。最新的24种语言是自2010年谷歌合并了16种新语言以来最大的一批。谷歌称之为“零镜头”或“零资源”的机器翻译模式使这种扩展成为可能鈥攐学习翻译成另一种语言而从未见过实例的人。
去年,Facebook和Instagram母公司Meta推出了一个类似的概念,称为通用语音翻译。
Caswell说,谷歌的模型通过在大约100种数据丰富的语言上训练一个“巨大的神经人工智能模型”,然后将所学知识应用到数百种它不知道的其他语言上。他说:“想象一下,如果你是一个通晓多种语言的人,然后你开始阅读另一种语言的小说,你就可以根据你对语言的总体知识来拼凑出它可能意味着什么。”。
他说,这一新群体的范围从印度东北部约80万人使用的米佐等小型语言,到中非约4500万人使用的林加拉等更广泛的语言。
那是15年前的事了鈥攊n 2006年鈥攖hat微软在南美获得了一些积极的关注,它的一个软件功能将熟悉的微软菜单和命令翻译成了Quechua。但那是在当前人工智能在实时翻译方面的发展浪潮之前。
哈佛大学语言学者Am茅说魁丘亚语的rico Mendoza Mori表示,吸引谷歌的注意,可以在秘鲁等地为该语言带来一些必要的可见性,而在秘鲁,许多公共服务中仍然缺乏说魁丘亚语的人。他说,其中许多语言的生存“将取决于它们在数字环境中的使用”。
另一位语言学者罗伯托·扎里基(RobertoZariquiey)表示,如果没有该地区社区团体的更密切参与,他怀疑谷歌能否为奎丘亚语、艾马拉语或瓜拉尼语提供有效的语言振兴工具。
秘鲁天主教宗座大学的语言学家扎里基(Zariquiey)说:“语言与生活、文化、种族群体和政治组织有着深刻的联系。”。“应该考虑到这一点。”
鈥?
新增的语言有:阿萨姆语、艾马拉语、班巴拉语、博伊普里语、迪维希语、多格里语、埃维语、瓜拉尼语、伊洛卡诺语、康卡尼语、克里奥语、林加拉语、卢甘达语、麦提利语、梅提隆语(曼尼普里语)、米佐语、奥罗莫语、奎丘语、梵语、塞佩迪语、索拉尼库尔德语、提格里尼亚语、聪加语和提维语。
漏 2022年美联社。保留所有权利。未经许可,不得出版、广播、重写或重新分发本材料。