Efficient Memory Management for Large Language Model Serving with PagedAttention
Woosuk Kwon

Журнал: None

Дата публикации: 3 октября 2023 г.

DOI: 10.1145/3600006.3613165

Цитирований в статье: 19

Сколько цитировалась: 907

График цитирования
Citation Chart

Похожие работы