Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Feature]: 希望支持windows本地的OCR,速度快很多 #319

Closed
2 tasks done
hgaogao opened this issue Jul 26, 2023 · 7 comments · Fixed by #322
Closed
2 tasks done

[Feature]: 希望支持windows本地的OCR,速度快很多 #319

hgaogao opened this issue Jul 26, 2023 · 7 comments · Fixed by #322
Assignees

Comments

@hgaogao
Copy link

hgaogao commented Jul 26, 2023

Please confirm the following before submitting a new issue.

  • I have carefully reviewed the official website's usage documentation.
  • I have searched through the historical issues but could not find an answer.

Description

希望可以默认支持windows本地的OCR接口
因为我看到powertoys上面的OCR还挺快的,准确性也还不错,希望可以集成到软件里面

Application Scenario

接口申请起来有点繁琐,而且速度也不是很快,所以希望支持本地的OCR

References

windows本地的OCR接口
调用本地OCR接口的项目

@Pylogmon
Copy link
Member

在线OCR速度都是很快的,因为要做跨平台,Windows系统OCR其他平台没法用,后续可能会通过插件来支持。

@hgaogao
Copy link
Author

hgaogao commented Jul 26, 2023

作为用户来说,如果可以开箱即用的话就很完美了,我记得macOS也是有本地OCR接口的,希望可以通过插件系统也一起支持,或者等别的大佬来一起实现😁

@hiroi-sora
Copy link

hiroi-sora commented Jul 26, 2023

我是离线OCR软件 Umi-OCR 的开发者,Umi-OCR 支持通过读写剪贴板的方式与翻译软件联动。

刚发现pot支持命令行调用翻译,赞👍Umi-OCR 后续可能会增加与pot的命令行联动方式。

另,Umi-OCR也支持命令行调用OCR 。如果需要获取返回值,还有独立的离线引擎组件 PaddleOCR-json 。作者有兴趣可以看看~ @Pylogmon

@Pylogmon
Copy link
Member

刚发现pot支持命令行调用翻译,赞👍Umi-OCR 后续可能会增加与pot的命令行联动方式。

太好了!pot translate 命令在没有选择文本的时候是会读取剪切板的,可以通过这个来联动。

另,Umi-OCR也支持命令行调用OCR 。如果需要获取返回值,还有独立的离线引擎组件 PaddleOCR-json 。作者有兴趣可以看看~

PaddleOCR-json还不支持linux,所以我在考虑从浏览器端下手。

@hiroi-sora
Copy link

hiroi-sora commented Jul 26, 2023

我尝试写了通过命令行传输识别文本的方式,感觉效果一般,因为命令行没法传换行符。而且在一些环境中(虚拟机Win10),无法通过命令行调用Pot。还是用剪贴板来传文本的效果好一点。

目前Umi-OCR已支持通过剪贴板+按键事件的方式与Pot联动,简要步骤如下:

image

  1. 安装最新版本的 Pot 和 Umi-OCR
  2. Umi-OCR打开高级模式(设置页底部勾选高级选项,然后重启Umi-OCR软件)
  3. Umi-OCR在快捷识图设置中,勾选自动复制结果自动复制后发送按键
  4. Umi-OCR在自动复制后发送按键中录制一组按键,如 ctrl+shift+T
  5. Pot 设置相同的划词翻译快捷键 ctrl+shift+T

完成以上设置,后续使用Umi-OCR进行截图OCR,Umi就会将识别文本写入剪贴板,并发送按键唤起Pot进行翻译。

@Pylogmon
Copy link
Member

确实Windows下命令行传递字符串问题很多,我插件调用是通过http请求来调用的

@Pylogmon Pylogmon self-assigned this Jul 26, 2023
@Pylogmon Pylogmon linked a pull request Jul 26, 2023 that will close this issue
@Pylogmon
Copy link
Member

@hiroi-sora 我基于 PaddleOCR-json 开发了插件

https://github.com/pot-app/pot-app-recognize-plugin-paddle

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging a pull request may close this issue.

3 participants