- 一键运行 Qwen2.5 SakuraLLM 等本地 LLM 模型
- 可与众多支持 OpenAI 格式的翻译器、分析器应用搭配使用,包括但是不限于:
- 配合本页中的各应用的设置指南,可以得到最优化的性能,相较于默认设置可提升 3-5 倍
- 至少 8G 显存的独立显卡,NVIDIA 显卡最佳,其他显卡很慢
- 确保安装了
最新版本
的显卡驱动程序
-
从 发布页 下载最新版本的
OneClickLLAMA
并解压缩OneClickLLAMA_NV
是 NVIDIA 专用的版本OneClickLLAMA_VULKAN
是 所有显卡 通用的版本
-
根据用途和显存大小下载适合的模型并放入
OneClickLLAMA
文件夹 -
日文翻译到中文
显存大小 | 模型规模 | 启动脚本 | 下载链接 |
---|---|---|---|
8G/10G | 7B | 01_1280_NP16.bat | sakura-7b-qwen2.5-v1.0-iq4xs.gguf |
11G | 14B | 01_1280_NP4.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
12G | 14B | 01_1280_NP6.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
16G | 14B | 01_1280_NP16.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
24G | 14B | 01_1280_NP16.bat | sakura-14b-qwen2.5-v1.0-q6k.gguf |
- 其他语言翻译到中文
显存大小 | 模型规模 | 启动脚本 | 下载链接 |
---|---|---|---|
8G/10G | 7B | 01_1280_NP16.bat | Qwen2.5-7B-Instruct-IQ4_XS.gguf |
11G | 14B | 01_1280_NP4.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
12G | 14B | 01_1280_NP6.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
16G | 14B | 01_1280_NP16.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
24G | 14B | 01_1280_NP16.bat | Qwen2.5-14B-Instruct-Q6_K.gguf |
- 搭配 KeywordGacha 抓取实体词语表
显存大小 | 模型规模 | 启动脚本 | 下载链接 |
---|---|---|---|
8G/10G/11G/12G/16G/24G | 7B | 01_2k_NP16.bat | Qwen2.5-7B-Instruct-IQ4_XS.gguf |
- 现在你的文件结构应该类似于:
OneClickLLAMA\llama\...
\00_Core.bat
\01_1280_NP16.bat
\sakura-14b-qwen2.5-v1.0-iq4xs.gguf
\...
- 根据
你的显存和模型的搭配组合
选择对应的启动脚本,双击启动即可
- 根据你的需求和使用的应用查看对应设置教程
- 搭配 LinguaGacha 进行日中翻译 Wiki - LinguaGacha_Sakura
- 搭配 LinguaGacha 进行其他语言翻译 Wiki - LinguaGacha
- 搭配 AiNiee 进行日中翻译 Wiki - AiNiee_Sakura
- 搭配 轻小说翻译机器人(绿站) 进行日中翻译 Wiki - AutoNovel_Sakura
- 搭配 KeywordGacha 进行文本分析 Wiki - KeywordGacha
-
什么是
爆显存
,会导致什么问题?- 系统需求的显存超过了显卡实际的物理显存大小,称之为
爆显存
爆显存
时,翻译的速度和结果都会出现异常,基本丧失可用性,所以要避免这种情况
- 系统需求的显存超过了显卡实际的物理显存大小,称之为
-
如何判断是否
爆显存
- 如果爆的比较厉害,程序会直接报错或者退出
- 爆了一点又没有完全爆比较难判断
- 一个可参考的方式是通过第三方软件监测显卡功耗
- 满载执行任务时,显卡实际功耗应为最大功耗的
70%-80%
或者更高 - 如果显存接近用完,但是显卡实际功耗很低,则大概率是爆显存了
-
如何避免
爆显存
- 在模型启动后,模型占用的显存大小是固定的,不会变化,但是系统中的其他应用也会占用显存
- 本项目中的脚本都预留了一定的冗余空间,但如果开启过多应用,依然可能导致显存消耗完
- 所以在使用时,应尽量减少开启其他消耗显存的应用
- 比如
浏览器
、动态壁纸
、视频播放器
或QQNT
、VSCODE
等基于浏览器内核的应用