Enable dequant+matmul 8bit path for Intel CPU and XPU #1484

jiqing-feng · 2025-01-23T09:30:53Z

Hi @Titus-von-Koeller @matthewdouglas . This feature enables dequant 8bit weight and using float matmul. It speed-up the lora finetune for 3x on XPU and 2x on CPU by the lora finetune script on llama3-8b by the command python olora_finetuning.py --base_model alokabhishek/Meta-Llama-3-8B-Instruct-bnb-8bit --init_lora_weights gaussian --seed 42 --torch_dtype bfloat16 --device_map cpu.

All tests in transformers have been passed, please review this PR. Thanks!

Signed-off-by: jiqing-feng <[email protected]>

jiqing-feng added 2 commits January 23, 2025 15:08

new matmul8bit

b02b757

Signed-off-by: jiqing-feng <[email protected]>

fix cxb

f072403

Signed-off-by: jiqing-feng <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Enable dequant+matmul 8bit path for Intel CPU and XPU #1484

Enable dequant+matmul 8bit path for Intel CPU and XPU #1484

jiqing-feng commented Jan 23, 2025 •

edited

Loading

Enable dequant+matmul 8bit path for Intel CPU and XPU #1484

Are you sure you want to change the base?

Enable dequant+matmul 8bit path for Intel CPU and XPU #1484

Conversation

jiqing-feng commented Jan 23, 2025 • edited Loading

jiqing-feng commented Jan 23, 2025 •

edited

Loading