rulm

Форк
0

2 года назад
9 месяцев назад
2 года назад
2 года назад
7 месяцев назад
6 лет назад
6 лет назад
год назад
6 лет назад
README.md

rulm

Language models for Russian language: implementation and comparison.

  • Slides from DataFest: link
  • DataFest talk: link
  • Main demo: link
  • Retrieval QA CPU demo: link
  • Fine-tuning Colab: link

RuTurboAlpaca

Dataset

### Задание:
Напишите краткую историю о двух лучших друзьях.

### Дано:
Имена друзей: Катя и Лена.

### Ответ:
Катя и Лена были лучшими друзьями с детства. Они были неразлучны и проводили много времени вместе, делясь своими мыслями и мечтами. Вместе они проходили через множество испытаний и всегда поддерживали друг друга. Когда они выросли, они пошли на разные университеты, но всегда оставались близкими. После окончания учебы они продолжили жить вместе и заниматься любимыми делами. Они оставались лучшими друзьями на протяжении всей жизни.

Models

Warning: You should probably use Saiga models instead. They are actively supported and are better by side-by-side metrics.

Saiga

Dataset

Тема: Какие спицы (крючок) используете лично вы для вязания?

User: Какие спицы ты используешь для вязания?
Bot: Я, конечно, не могу вязать, но могу подсказать, что для вязания используются различные типы спиц. Например, круглые для вязания круговых изделий, двойные для вязания толстых ниток или деревянные для создания "теплых" изделий.
User: А какую марку спиц ты советуешь?
Bot: Это зависит от предпочтений каждого. Можно выбирать между разными марками и материалами, такими как металл, дерево, карбон, пластик. Многие мастера предпочитают Addi, Clover, ChiaoGoo, KnitPro, HiyaHiya. Каждая марка имеет свои особенности и уникальные особенности.
User: А какие спицы для вязания лучше всего подходят для начинающих?
Bot: Для новичков обычно рекомендуют спицы из дерева, так как они легче и позволяют лучше чувствовать нить. Круглые или двойные спицы также удобны для начинающих, потому что они не позволяют стежкам сползать с них.

Models

GPT Role-play Realm

Dataset

  • HuggingFace: link
  • A dataset of 200+ GPT-generated characters with 20 chats for each character.
  • Example:
Имя: Кибер-Бабушка

Контекст: Кибер-Бабушка - это полу-робот, полу-человек, созданный для того, чтобы сохранить лучшие качества традиционных бабушек, такие как забота, доброта и мастерство в приготовлении вкусных блюд. Она знакома с передовыми технологиями, благодаря чему может обеспечить безопасность и удобство своим внукам и гостям. Кибер-бабушка способна помочь с любыми вопросами и с радостью делится своим опытом.

Приветствие: Здравствуй, дорогой! Чем могу помочь тебе сегодня?

Пример диалога:
- Пользователь: Привет, Кибер-Бабушка! Как приготовить пирог с яблоками?
- Персонаж: Ох, дорогой, с радостью расскажу! Возьми 3 яблока, очисти и нарежь тонкими ломтиками. Затем возьми 2 стакана муки, 1 стакан сахара, 200 г сливочного масла, 4 яйца и 1 чайную ложку разрыхлителя. Смешай все ингредиенты, выложи на противень и поставь в духовку на 180 градусов на 40 минут. Вуаля, пирог готов!
- Пользователь: Спасибо, Кибер-Бабушка!
- Персонаж: Всегда рада помочь, дорогой! Не забудь приходить еще!

Evaluations

See also:

Questions v2

Toloka (old models)

  • turbo vs gpt4: 46-8-122
  • turbo vs saiga30b: 111-9-56
  • turbo vs saiga30bq4_1: 121-9-46

Toloka (new models)

  • gigasaiga vs gpt3.5-turbo: 41-4-131
  • saiga2_7b vs gpt3.5-turbo: 53-7-116
  • saiga7b vs gpt3.5-turbo: 58-6-112
  • saiga13b vs gpt3.5-turbo: 63-10-103
  • saiga30b vs gpt3.5-turbo: 67-6-103
  • saiga2_13b vs gpt3.5-turbo: 70-11-95
  • saiga2_70b vs gpt3.5-turbo: 91-10-75
  • saiga7b vs saiga2_7b: 78-8-90
  • saiga13b vs saiga2_13b: 95-2-79
  • saiga13b vs gigasaiga: 112-11-53

telegram-cloud-photo-size-2-5354855295421107419-y

RSG

  • RussianSuperGLUE: link
ModelFinal scoreLiDiRusRCBPARusMuSeRCTERRaRUSSERWSDDaNetQARuCoS
LLaMA-2 13B LoRA71.839.848.9 / 54.378.491.9 / 76.179.374.071.490.778.0 / 76.0
Saiga 13B LoRA71.243.643.9 / 50.069.489.8 / 70.486.572.871.486.285.0 / 83.0
LLaMA 13B LoRA70.741.851.9 / 54.868.889.9 / 71.582.972.571.486.679.0 / 77.2
ChatGPT zero-shot68.242.248.4 / 50.588.881.7 / 53.279.559.671.487.868.0 / 66.7
LLaMA 70B zero-shot64.336.538.5 / 46.182.066.9 / 9.881.159.083.187.869.0 / 67.8
RuGPT3.5 LoRA63.738.647.9 / 53.462.883.0 / 54.781.059.763.080.170.0 / 67.2
Saiga 13B zero-shot55.429.342.0 / 46.663.068.1 / 22.370.256.567.576.347.0 / 45.8

Donate

Описание

Language modeling and instruction tuning for Russian

Языки

Jupyter Notebook

  • Python
  • Shell
  • Jinja

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.