vllm
Описание
A high-throughput and memory-efficient inference and serving engine for LLMs
Языки
- Python88,1%
- Cuda6,4%
- C++3,8%
- Shell1%
- CMake0,3%
- C0,3%
- Остальные0,1%
2 месяца назад
год назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
3 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
2 года назад
8 месяцев назад
2 года назад
8 месяцев назад
2 месяца назад
7 месяцев назад
2 месяца назад
3 месяца назад
2 года назад
9 месяцев назад
2 месяца назад
3 месяца назад
2 месяца назад
год назад
год назад
2 года назад
3 года назад
9 месяцев назад
2 месяца назад
5 месяцев назад
9 месяцев назад
8 месяцев назад
2 месяца назад
2 месяца назад
2 месяца назад
2 месяца назад
README.md