lmops

Форк
0

..
/
llma 
год назад
2 года назад
2 года назад
README.md

LLMA: Large Language Model Accelerator

News

  • Outputs of LLMs often have significant overlaps with some references (e.g, retrieved documents).
  • Lossless acceleration of LLM inference by copying from references.
  • Applicable to important LLM scenarios such as retrieval-augmented generation and multi-turn conversations.
  • 2~3 times speed-up; no additional model required!

image

image

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.