vllm
Описание
A high-throughput and memory-efficient inference and serving engine for LLMs
Языки
- Python75,7%
- Cuda21,4%
- C++1,9%
- Shell0,5%
- Dockerfile0,2%
- C0,2%
- Остальные0,1%
Jason Cox
Jason Cox
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
3 года назад
3 года назад
2 года назад
2 года назад
3 года назад
3 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
2 года назад
README.md