alpaca_lora_4bit/GPTQ-for-LLaMa at 8d198e01719c69e1910c76ad7f406707830ea45f - alpaca_lora_4bit - Telosama Gitea Server

ilotoki_thu/alpaca_lora_4bit

Files

History

John Smith 3471be4e56 add fast_4bit_matmul and auto switch 2 methods according to bottleneck

2023-03-21 08:43:07 +00:00

..

autograd_4bit.py

add fast_4bit_matmul and auto switch 2 methods according to bottleneck

2023-03-21 08:43:07 +00:00

quant_cuda_kernel.cu

add fast_4bit_matmul and auto switch 2 methods according to bottleneck

2023-03-21 08:43:07 +00:00

quant_cuda.cpp

add fast_4bit_matmul and auto switch 2 methods according to bottleneck

2023-03-21 08:43:07 +00:00