quanto

Форк

Ветки: 13 Коммиты: 418 Теги: 13

quanto

/external

smoothquant

README.md

external: add smoothquant export script

10 месяцев назад

smoothquant.py

feat(smoothquant): add Mistral

10 месяцев назад

README.md

SmoothQuant original conversion script

This converts an OPT or Bloom 🤗 transformers model to a "smoothed" version, as described in SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models.

$ python smoothquant.py --model facebook/opt-1.3b --save-path smoothed-models/facebook/opt-1.3b

Note: due to hard-coded assumptions on model architecture in the script this only works for OPT models that apply the layer_norm before the attention (do_layer_norm_before=true in config.json). This means all models but facebook/opt-350m.

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.

quanto

DCDavid Corvoysierci: add stale bot 6 месяцев назад910719

SmoothQuant original conversion script

Использование cookies