tool-star
Описание
Повторяем эксперимент с RLVR обучением модели тулингу (одновременному вызову двух инструментов с помощью наград)
Языки
Python
README.md
Повторяем эксперимент с RLVR обучением модели тулингу (одновременному вызову двух инструментов с помощью наград)
Python