Обо мне

Сфера интересов: агентный mid-training, обучение с подкреплением с верификацией наград (RLVR), масштабирование агентных сред (scaling envs), интерливинговое агентное рассуждение с инструментами (interleaved reasoning with tools), контекстная инженерия

Москва
Зарегистрирован 2 Марта 2024
Закрепленные репозитории
6 из 6
    Эксперименты с интерливинговым рассуждением и генерацией синтетических агентных трейсов...
    • Python
    0
    0
    21 день назад
    Библиографический указатель 469 научных статей по LLM-агентам, RL для LLM, reasoning и смежным темам. Переводы на русски...
    5
    14
    2 месяца назад
    Адаптация примера агентного SDK pydantic_ai к GigaChat API...
    • Python
    0
    1
    год назад
    Проверяем идеи из статьи лаборатории Миры Мурати по поводу недетерминизма LLM при температуре генерации 0 и постоянному ...
    • Python
    0
    0
    6 месяцев назад
    Пример системного промпта от большой уважаемой компании...
    • Text
    0
    0
    9 месяцев назад
    Демо конвертера валют по курсу ЦБ РФ, демонстрирующее ключевые возможности GigaChat API (авторизация, генерация сообщени...
    • Python
    0
    0
    9 месяцев назад

354 активности за последний год

ВсПнВтСрЧтПтСб
1
2
3
4
5
...
22

Для полного доступа зарегистрируйтесь или авторизуйтесь на GitVerse

Войти