Обо мне

Сфера интересов: агентный mid-training, обучение с подкреплением с верификацией наград (RLVR), масштабирование агентных сред (scaling envs), интерливинговое агентное рассуждение с инструментами (interleaved reasoning with tools), контекстная инженерия

Москва
Зарегистрирован 2 Марта 2024
Закрепленные репозитории
6 из 6
    Эксперименты с интерливинговым рассуждением и генерацией синтетических агентных трейсов...
    • Python
    0
    0
    19 дней назад
    Библиографический указатель 469 научных статей по LLM-агентам, RL для LLM, reasoning и смежным темам. Переводы на русски...
    4
    14
    месяц назад
    Адаптация примера агентного SDK pydantic_ai к GigaChat API...
    • Python
    0
    1
    год назад
    Проверяем идеи из статьи лаборатории Миры Мурати по поводу недетерминизма LLM при температуре генерации 0 и постоянному ...
    • Python
    0
    0
    5 месяцев назад
    Пример системного промпта от большой уважаемой компании...
    • Text
    0
    0
    8 месяцев назад
    Демо конвертера валют по курсу ЦБ РФ, демонстрирующее ключевые возможности GigaChat API (авторизация, генерация сообщени...
    • Python
    0
    0
    8 месяцев назад

412 активностей за последний год

ВсПнВтСрЧтПтСб
1
2
3
4
5
...
22

Для полного доступа зарегистрируйтесь или авторизуйтесь на GitVerse

Войти