Skip to content

neavo/OneClickLLAMA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

48 Commits
 
 

Repository files navigation

OneClickLLAMA

要求

  • 至少 8G 显存的独立显卡,NVIDIA 显卡最佳,其他显卡很慢
  • 确保安装了 最新版本 的显卡驱动程序

步骤

  • 发布页 下载最新版本的 OneClickLLAMA 并解压缩

    • OneClickLLAMA_NV 是 NVIDIA 专用的版本
    • OneClickLLAMA_VULKAN 是 所有显卡 通用的版本
  • 根据用途和显存大小下载适合的模型并放入 OneClickLLAMA 文件夹

  • 日文翻译到中文

显存大小 模型规模 启动脚本 下载链接
8G/10G 7B 01_1280_NP16.bat sakura-7b-qwen2.5-v1.0-iq4xs.gguf
11G 14B 01_1280_NP4.bat sakura-14b-qwen2.5-v1.0-iq4xs.gguf
12G 14B 01_1280_NP6.bat sakura-14b-qwen2.5-v1.0-iq4xs.gguf
16G 14B 01_1280_NP16.bat sakura-14b-qwen2.5-v1.0-iq4xs.gguf
24G 14B 01_1280_NP16.bat sakura-14b-qwen2.5-v1.0-q6k.gguf
  • 其他语言翻译到中文
显存大小 模型规模 启动脚本 下载链接
8G/10G 7B 01_1280_NP16.bat Qwen2.5-7B-Instruct-IQ4_XS.gguf
11G 14B 01_1280_NP4.bat Qwen2.5-14B-Instruct-IQ4_XS.gguf
12G 14B 01_1280_NP6.bat Qwen2.5-14B-Instruct-IQ4_XS.gguf
16G 14B 01_1280_NP16.bat Qwen2.5-14B-Instruct-IQ4_XS.gguf
24G 14B 01_1280_NP16.bat Qwen2.5-14B-Instruct-Q6_K.gguf
  • 搭配 KeywordGacha 抓取实体词语表
显存大小 模型规模 启动脚本 下载链接
8G/10G/11G/12G/16G/24G 7B 01_2k_NP16.bat Qwen2.5-7B-Instruct-IQ4_XS.gguf

启动

  • 现在你的文件结构应该类似于:
  OneClickLLAMA\llama\...
                    \00_Core.bat
                    \01_1280_NP16.bat
                    \sakura-14b-qwen2.5-v1.0-iq4xs.gguf
                    \...
  • 根据 你的显存和模型的搭配组合 选择对应的启动脚本,双击启动即可

应用设置

常见问题

  • 什么是 爆显存,会导致什么问题?

    • 系统需求的显存超过了显卡实际的物理显存大小,称之为 爆显存
    • 爆显存 时,翻译的速度和结果都会出现异常,基本丧失可用性,所以要避免这种情况
  • 如何判断是否 爆显存

    • 如果爆的比较厉害,程序会直接报错或者退出
    • 爆了一点又没有完全爆比较难判断
    • 一个可参考的方式是通过第三方软件监测显卡功耗
    • 满载执行任务时,显卡实际功耗应为最大功耗的 70%-80% 或者更高
    • 如果显存接近用完,但是显卡实际功耗很低,则大概率是爆显存了
  • 如何避免 爆显存

    • 在模型启动后,模型占用的显存大小是固定的,不会变化,但是系统中的其他应用也会占用显存
    • 本项目中的脚本都预留了一定的冗余空间,但如果开启过多应用,依然可能导致显存消耗完
    • 所以在使用时,应尽量减少开启其他消耗显存的应用
    • 比如 浏览器动态壁纸视频播放器QQNTVSCODE 等基于浏览器内核的应用

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

No packages published