google-research

Форк
0

README.md

MADLAD-400: A Multilingual And Document-Level Large Audited Dataset

This repository contains the checkpoints and vocabularies from MADLAD-400: A Multilingual And Document-Level Large Audited Dataset.

Checkpoints

ModelCheckpoint
8B parameter LMlink
3B parameter MT modellink
7.2B parameter MT modellink
7.2B parameter MT model (finetuned on backtranslated data)link
10.7B parameter MT modellink

Vocabulary

The vocabularies used to train the models listed above are here.

Example usage

We provide a simple colab example showcasing how to use the released checkpoints for translation.

Contact

Please reach out to {snehakudugunta, icaswell}꩜google.com for any questions or observed issues. Issues will be listed on this page to aid future users. For questions about the canaries, reach out to cchoquette@google.com.

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.