Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

新版本问题反馈:模型下载问题与历史记录问题 #39

Open
ZiLoong-L opened this issue Nov 6, 2024 · 6 comments
Open

Comments

@ZiLoong-L
Copy link

感谢大佬的更新!目前新版本我在使用的过程中遇到了2点问题,想向您反馈一下!
1、目前在软件内点击模型安装会卡0%进度无法下载,不知道是不是因为没有梯子的原因,而进到您的marketplace.json中手动下载模型是有下载速度的。但是在模型下载下来以后,不知道要放到哪个文件夹中,请问手动添加的话,要放到哪个文件夹里呀?
2、最新版本是不是取消了自动记录识别结果的功能呀?我在软件内没有看到自定义Log文件目录的模块,实际使用后也没有找到对应的.txt记录,这个功能感觉还挺好用的,不知道能不能添加回来TvT?

@ZiLoong-L
Copy link
Author

想问下额外下载的模型应该以什么命名格式放到哪个文件夹下呀?

@jxlpzqc
Copy link
Owner

jxlpzqc commented Nov 6, 2024

  1. 安装模型目前是直接到 github 下载,没有代理的情况下可能会下载失败,下一个版本考虑加上代理服务器和镜像服务器,便于墙内下载模型,除此以外后期可以考虑增加本地模块导入功能。
  2. 已收到反馈,下个版本加上该功能。
  3. 下载的模型会保存到%APPDATA%/TMSpeech/plugins当中,大概是这种结构。
%APPDATA%/TMSpeech/plugins
├── csukuangfj.streaming-zipformer-bilingual-zh-en
│   ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
│   │   ├── README.md
│   │   ├── bpe.model
│   │   ├── bpe.vocab
│   │   ├── decoder-epoch-99-avg-1.int8.onnx
│   │   ├── decoder-epoch-99-avg-1.onnx
│   │   ├── encoder-epoch-99-avg-1.int8.onnx
│   │   ├── encoder-epoch-99-avg-1.onnx
│   │   ├── joiner-epoch-99-avg-1.int8.onnx
│   │   ├── joiner-epoch-99-avg-1.onnx
│   │   ├── test_wavs
│   │   │   ├── 0.wav
│   │   │   ├── 1.wav
│   │   │   ├── 2.wav
│   │   │   ├── 3.wav
│   │   │   └── 8k.wav
│   │   └── tokens.txt
│   └── tmmodule.json

那个 tmmodule.json 的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 (
所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json)

https://github.com/jxlpzqc/TMSpeechCommunity/blob/5f30e20e0c57187b2632a2f765c3250f7f52b251/marketplace.json#L61-L88

{
    "id": "csukuangfj.streaming-zipformer-bilingual-zh-en",
    "type": "sherpaonnx_model",
    "name": "中英双语模型",
    "author": "csukuangfj",
    "publisher": "jxlpzqc",
    "desc": "中英双语流式 Zipformer-tranducer 模型",
    "version": 20230220,
    "displayVersion": "2023-02-20",
    "sherpaonnx": {
        "token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt",
        "encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx",
        "decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx",
        "joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx"
    }
}

@ZiLoong-L
Copy link
Author

  1. 安装模型目前是直接到 github 下载,没有代理的情况下可能会下载失败,下一个版本考虑加上代理服务器和镜像服务器,便于墙内下载模型,除此以外后期可以考虑增加本地模块导入功能。
  2. 已收到反馈,下个版本加上该功能。
  3. 下载的模型会保存到%APPDATA%/TMSpeech/plugins当中,大概是这种结构。
%APPDATA%/TMSpeech/plugins
├── csukuangfj.streaming-zipformer-bilingual-zh-en
│   ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
│   │   ├── README.md
│   │   ├── bpe.model
│   │   ├── bpe.vocab
│   │   ├── decoder-epoch-99-avg-1.int8.onnx
│   │   ├── decoder-epoch-99-avg-1.onnx
│   │   ├── encoder-epoch-99-avg-1.int8.onnx
│   │   ├── encoder-epoch-99-avg-1.onnx
│   │   ├── joiner-epoch-99-avg-1.int8.onnx
│   │   ├── joiner-epoch-99-avg-1.onnx
│   │   ├── test_wavs
│   │   │   ├── 0.wav
│   │   │   ├── 1.wav
│   │   │   ├── 2.wav
│   │   │   ├── 3.wav
│   │   │   └── 8k.wav
│   │   └── tokens.txt
│   └── tmmodule.json

那个 tmmodule.json 的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 ( 所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json)

https://github.com/jxlpzqc/TMSpeechCommunity/blob/5f30e20e0c57187b2632a2f765c3250f7f52b251/marketplace.json#L61-L88

{
    "id": "csukuangfj.streaming-zipformer-bilingual-zh-en",
    "type": "sherpaonnx_model",
    "name": "中英双语模型",
    "author": "csukuangfj",
    "publisher": "jxlpzqc",
    "desc": "中英双语流式 Zipformer-tranducer 模型",
    "version": 20230220,
    "displayVersion": "2023-02-20",
    "sherpaonnx": {
        "token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt",
        "encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx",
        "decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx",
        "joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx"
    }
}

感谢大佬的教程,已经安装好啦!不过我发现这个中英双语的模型,好像就是上个版本自带的那个模型😭,只有中文的那个模型的效果甚至还不如这个,感觉好像没有必要安装模型的样子?

@ZiLoong-L
Copy link
Author

还有个功能希望大佬能加上,就不新开一个issue啦!目前每次重新打开窗口,它的大小都会恢复成默认大小和位置,需要重新调整,请问大佬这个可以允许我们设置默认的窗口大小和显示位置嘛?

@am009
Copy link
Collaborator

am009 commented Nov 21, 2024

最新版优化了第一次使用的体验,应该能做到开箱即用了,同时实现了历史记录的功能。 记住窗口的大小和位置这一点确实没注意到,已经加入TODO list,感谢反馈!

国内下载:https://gitee.com/am009/TMSpeech/releases/tag/v0.4.2
Github:https://github.com/jxlpzqc/TMSpeech/releases/tag/v0.4.2

@am009
Copy link
Collaborator

am009 commented Nov 21, 2024

记住窗口的大小和位置,初步尝试实现了一下,可以在这里下载:

https://github.com/jxlpzqc/TMSpeech/actions/runs/11957676473/artifacts/2219940706

但是目前在多屏幕时还是有bug,就先不release了。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants