大型多语言语言模型的翻译性能研究——以BLOOM为例 NLP社区最近发布了一个新的大型开放访问多语言模型BLOOM(BigScience et al.,2022),涵盖46种语言。我们通过评估BLOOM在多个数据集(WMT、Flores-101和DiaBLa)和语言对(高资源和低资源)中的机器翻译性能,重点关注其多语言能力。我们的结果表明,0-shot的性能会受到过度生成和错误语言生成的影响,但在few-shot中,这一点得到了极大的改善,对于许多语言对来说,效果非常好。我们研究了几个方面,包括提示设计、模型大小、跨语言迁移和话语上下文的使用。 论文下载地址:https://www.chongjiaao.com/upfile/pdf/2303.01911.pdf 24 March 2023 Hits: 681