Обо мне

Сфера интересов: агентный mid-training, обучение с подкреплением с верификацией наград (RLVR), масштабирование агентных сред (scaling envs), интерливинговое агентное рассуждение с инструментами (interleaved reasoning with tools), контекстная инженерия

Москва
Зарегистрирован 2 Марта 2024
Закрепленные репозитории
6 из 6
    Эксперименты с интерливинговым рассуждением и генерацией синтетических агентных трейсов...
    • Python
    0
    0
    22 дня назад
    Библиографический указатель 469 научных статей по LLM-агентам, RL для LLM, reasoning и смежным темам. Переводы на русски...
    4
    13
    24 дня назад
    Адаптация примера агентного SDK pydantic_ai к GigaChat API...
    • Python
    0
    1
    10 месяцев назад
    Проверяем идеи из статьи лаборатории Миры Мурати по поводу недетерминизма LLM при температуре генерации 0 и постоянному ...
    • Python
    0
    0
    5 месяцев назад
    Пример системного промпта от большой уважаемой компании...
    • Text
    0
    0
    7 месяцев назад
    Демо конвертера валют по курсу ЦБ РФ, демонстрирующее ключевые возможности GigaChat API (авторизация, генерация сообщени...
    • Python
    0
    0
    7 месяцев назад

417 активностей за последний год

ВсПнВтСрЧтПтСб
1
2
3
4
5
...
22

Для полного доступа зарегистрируйтесь или авторизуйтесь на GitVerse

Войти