The official PyTorch implementation of Google's Gemma models
main
Pengchong Jin
Use approximate=tahn for GeLU
Все инструменты для разработки на одной платформе
Для полного доступа зарегистрируйтесь или авторизуйтесь на GitVerse