/

/

Обзор ДокументацияВойти

/

/

Аналитика

Безопасность

tool-star

R
rnekrasov
upload files
9 дней назад
c493ede

Описание

Повторяем эксперимент с RLVR обучением модели тулингу (одновременному вызову двух инструментов с помощью наград)

Избранное0

Языки

Python

Сообщить о нарушении

Коммиты:

9 дней назад

tool_star_v4_report.txt

9 дней назад

tool_star_v4_results.png

9 дней назад

tool_star_v5.py

9 дней назад

tool_star_v6.py

9 дней назад

README.md

Описание

Повторяем эксперимент с RLVR обучением модели тулингу (одновременному вызову двух инструментов с помощью наград)

Избранное0

Языки

Python

Сообщить о нарушении

Описание

Повторяем эксперимент с RLVR обучением модели тулингу (одновременному вызову двух инструментов с помощью наград)

Избранное0

Языки

Python

Сообщить о нарушении