崇家奥人工智能研究院

大型多语言语言模型的翻译性能研究——以BLOOM为例

NLP社区最近发布了一个新的大型开放访问多语言模型BLOOM（BigScience et al.，2022），涵盖46种语言。我们通过评估BLOOM在多个数据集（WMT、Flores-101和DiaBLa）和语言对（高资源和低资源）中的机器翻译性能，重点关注其多语言能力。我们的结果表明，0-shot的性能会受到过度生成和错误语言生成的影响，但在few-shot中，这一点得到了极大的改善，对于许多语言对来说，效果非常好。我们研究了几个方面，包括提示设计、模型大小、跨语言迁移和话语上下文的使用。

论文下载地址：https://www.chongjiaao.com/upfile/pdf/2303.01911.pdf

: 24 March 2023; Hits: 681

机器翻译的统计方法

机器翻译领域几乎与现代数字计算机一样古老。 1949 年 Warren Weaver 建议用统计方法和信息论的思想来解决这个问题，他、Claude Shannon 和其他人当时正在开发这个领域（Weaver 1949）。尽管研究人员很快放弃了这种方法，提出了许多理论上的反对意见，但我们认为真正的障碍在于可用计算机的相对无能以及缺乏机器可读文本来收集对此类攻击至关重要的统计数据。今天，计算机的速度比 1950 年快了五个数量级，并且拥有数亿字节的存储空间。大型、机器可读的语料库很容易获得。统计方法已经证明了它们在自动语音识别中的价值 (Bahl et al. 1983)，并且最近被应用于词典编纂 (Sinclair 1985) 和自然语言处理 (Baker 1979; Ferguson 1980; Garside et al. 1987; Sampson 1986; Sharman等人，1988）。我们觉得是时候给他们一个机器翻译的机会了

论文下载地址：https://www.chongjiaao.com/upfile/pdf/J90-2002.pdf

: 03 July 2022; Hits: 662

机器音译

跨具有不同字母和声音清单的语言翻译名称和技术术语是一项挑战。这些项目通常是音译，即替换为近似的语音等价物。例如，英语中的计算机在日语中输出为 ~ i/l:::'=--~-- (konpyuutaa)。将这些项目从日语翻译回英语更具挑战性，也更具有实际意义，因为音译项目构成了双语词典中没有的大部分文本短语。我们描述并评估了一种通过机器执行反向音译的方法。该方法使用生成模型，在音译过程中包含几个不同的阶段

论文下载地址：https://www.chongjiaao.com/upfile/pdf/P97-1017.pdf

: 02 July 2022; Hits: 793

两全其美：结合神经机器翻译的最新进展

过去一年见证了机器翻译 (MT) 序列到序列 (seq2seq) 建模的快速发展。经典的基于 RNN 的机器翻译方法首先被卷积 seq2seq 模型超越，然后被更新的 Transformer 模型超越。这些新方法中的每一种都包含一个基本架构，以及一组原则上适用于其他 seq2seq 架构的建模和训练技术。在本文中，我们以两种方式梳理了新架构及其相关技术。首先，我们确定了几个关键的建模和训练技术，并将它们应用于 RNN 架构，产生了一个新的 RNMT+ 模型，该模型在基准 WMT'14 英语到法语和英语到德语任务上优于所有三种基本架构。其次，我们分析了每个基本 seq2seq 架构的特性，并设计了新的混合架构，旨在结合它们的优势。我们的混合模型获得了进一步的改进，在两个基准数据集上都优于 RNMT+ 模型。

论文下载地址：https://www.chongjiaao.com/upfile/pdf/P18-1008.pdf

论文注释地址：https://www.chongjiaao.com/upfile/pdf/P18-1008.Notes.pdf

论文其他介绍：https://www.chongjiaao.com/upfile/pdf/P18-1008.Presentation.pdf

视频地址：https://vimeo.com/285807844

代码库地址：https://github.com/tensorflow/lingvo

https://paperswithcode.com/paper/?acl=P18-1008

数据集地址：WMT 2014

: 28 June 2022; Hits: 603

Page 1 of 6