Найти тему
10,2 тыс подписчиков

QLoRA: Efficient Finetuning of Quantized LLMs


Model name Guanaco, outperforms all previous openly released models on the Vicuna benchmark, reaching 99.3% of the performance level of ChatGPT while only requiring 24 hours of finetuning on a single GPU.

QLoRA - эффективный метод файнтюнинга, который позволяет сократить использование памяти, чтобы произвести файнтюнинг модели с 65B параметрами на одном GPU 48 ГБ.





QLoRA: Efficient Finetuning of Quantized LLMs  Model name Guanaco, outperforms all previous openly released models on the Vicuna benchmark, reaching 99.
Около минуты