开源 LLMs 部署及微调（持续更新）

目前支持的开源 LLMs 部署搭建：

MOSS
ChatGLM

微调 LLMs：

微调 ChatGLM
- P-tuning（单卡、多卡）
- Lora（单卡、多卡）

注意：

133 路径为：/data/wgs/chat
v100 路径为：/data/donews/wangguisen/chat

Dockerfile

./dk/Dockerfile

MOSS

git clone https://github.com/OpenLMLab/MOSS.git

git clone https://github.com/fpgaminer/GPTQ-triton.git
cd GPTQ-triton
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple .

cd ./weights
git lfs clone https://huggingface.co/fnlp/moss-moon-003-sft-int4

命令行对话运行：

docker run --rm -it --gpus '"device=2"' --name chat_moss_demo\
                   --shm-size 15G \
                   -v /data/wgs/chat:/home \
                   wgs-torch:chat \
                   sh -c "python /home/MOSS/moss_cli_demo.py"

推理运行：

docker run --rm -it --gpus '"device=2"' --name chat_moss\
                   --shm-size 15G \
                   -v /data/wgs/chat:/home \
                   wgs-torch:chat \
                   sh -c "python /home/run_moss.py >>/home/log/run_moss.log 2>>/home/log/run_moss.err"

例子见：./doc/moss_test.md

ChatGLM

https://github.com/THUDM/ChatGLM-6B

cd ./weights
git lfs clone https://huggingface.co/THUDM/chatglm-6b

命令行对话运行：

docker run --rm -it --gpus '"device=2"' --name chat_glm_demo\
                   --shm-size 15G \
                   -v /data/wgs/chat:/home \
                   wgs-torch:chat \
                   sh -c "python /home/chatglm_cli.py"

推理运行：

docker run --rm -it --gpus '"device=2"' --name chat_glm\
                   --shm-size 15G \
                   -v /data/wgs/chat:/home \
                   wgs-torch:chat \
                   sh -c "python /home/run_chatglm.py >>/home/log/run_chatglm.log 2>>/home/log/run_chatglm.err"

LLaMA-Alpaca

https://github.com/ymcui/Chinese-LLaMA-Alpaca

Ziya-LLaMA-13B-v1

https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1

cd ./weights
git lfs clone https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1

命令行对话运行：

推理运行：

docker run --rm -it --gpus '"device=3"' --name chat_ziya_demo\
                   --shm-size 15G \
                   -v /data/donews/wangguisen/chat:/home \
                   wgs-torch:chat \
                   sh -c "python /home/run_ziya_llama.py >>/home/log/run_ziya_llama.log 2>>/home/log/run_ziya_llama.err"

Finetune

见：./finetune/README.md

finetune ChatGLM
- p-tuning（单卡、多卡）
- Lora（单卡、多卡）

Tools

欢迎关注我的公众号：

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

开源 LLMs 部署及微调（持续更新）

Dockerfile

MOSS

ChatGLM

LLaMA-Alpaca

Ziya-LLaMA-13B-v1

Finetune

Tools

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.idea		.idea
ChatGLM-6B		ChatGLM-6B
GPTQ-triton		GPTQ-triton
MOSS		MOSS
data		data
dk		dk
doc		doc
examples		examples
finetune		finetune
weights		weights
.dockerignore		.dockerignore
README.md		README.md
chatglm_cli.py		chatglm_cli.py
custom_autotune.py		custom_autotune.py
run_chatglm.py		run_chatglm.py
run_moss.py		run_moss.py
run_ziya_llama.py		run_ziya_llama.py

WGS-note/chat

Folders and files

Latest commit

History

Repository files navigation

开源 LLMs 部署及微调（持续更新）

Dockerfile

MOSS

ChatGLM

LLaMA-Alpaca

Ziya-LLaMA-13B-v1

Finetune

Tools

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages