Модель при тестах потребляет в 50 раз больше VRAM #29

JohnConnor123 · 2025-01-10T20:21:59Z

Решил сначала протестить скрипт run_mera.sh на малой модели. Выбрал модель, квантизация которой весит 400МБ. Запустил скрипт, а у меня сьело в 50 раз (!!!) больше! Потребляет аж 20ГБ - не понимаю почему так происходит. Это для 13b моделей мне нужно 13*50=650 гигов?)) Вот команда, которую я использовал для старта моего скрипта:

CUDA_VISIBLE_DEVICES=0 MERA_FOLDER="$PWD/mera_results/Qwen-Qwen2.5-0.5B-Instruct-AWQ-128G-INT4-vGEMM" MERA_MODEL_STRING="pretrained=/mnt/d/Python_Projects/Jupyter/other/call-center-prompter/debug/quantized_awq/Qwen-Qwen2.5-0.5B-Instruct-AWQ-128G-INT4-vGEMM,dtype=auto" bash run_mera.sh

P.s. Очень сильно хотелось бы для модели на 500Мб потребления хотя бы до гигабайта((( Наверное это какой-то баг.
OS: WSL ubuntu

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Модель при тестах потребляет в 50 раз больше VRAM #29

Модель при тестах потребляет в 50 раз больше VRAM #29

JohnConnor123 commented Jan 10, 2025

Модель при тестах потребляет в 50 раз больше VRAM #29

Модель при тестах потребляет в 50 раз больше VRAM #29

Comments

JohnConnor123 commented Jan 10, 2025