-
Notifications
You must be signed in to change notification settings - Fork 39
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
外部加载数据 #6
Comments
有时间我统一拓展下吧
发自我的iPhone
…------------------ 原始邮件 ------------------
发件人: zzliux ***@***.***>
发送时间: 2024年2月25日 16:35
收件人: houbb/nlp-hanzi-similar ***@***.***>
抄送: Subscribed ***@***.***>
主题: Re: [houbb/nlp-hanzi-similar] 外部加载数据 (Issue #6)
作者大大:您好!
项目很不错,这是目前唯一能找到的基于字形计算字符相似度的工具,能解决实际问题,对于ocr识别结果与目标字符串比对结果有很大帮助;
我想使用autojs加载您这个字形相似度的工具使用,可以简单理解为android项目热加载dex使用,在目前测试的时候遇到了一些问题:
所有数据都是写死了资源路径,打包成jar再转成dex后所资源类文件会丢失,且资源数据占大头,希望能支持所有资源数据可通过外部加载,如:src/main/resources/nlp下的所有文件与用户定义等,依赖的pinyin与chaizi也能通过一样的方式加载,并且需要使用初始化方法加载,否则会因为类的初始化时就会因文件或文件路径不存在而报错
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: ***@***.***>
|
v1.4.0 你可以参考下下面的引导类写法,词典都是可以自定义的,改成你自己实现,比如外挂词库,数据库之类的。 拼音和拆字是另外的项目,以后版本看下能否支持。本身定死目录是为了对用户透明。 double rate = HanziSimilarBs.newInstance()
// 笔画数数据
.bihuashuData(HanziSimilarDatas.bihuashu())
// 笔画数相似算法
.bihuashuSimilar(HanziSimilars.bihuashu())
// 笔画数权重
.bihuashuRate(HanziSimilarRateConst.BIAHUASHU)
// 结构数据
.jiegouData(HanziSimilarDatas.jiegou())
// 结构相似算法
.jiegouSimilar(HanziSimilars.jiegou())
// 结构权重
.jiegouRate(HanziSimilarRateConst.JIEGOU)
// 部首数据
.bushouData(HanziSimilarDatas.bushou())
// 部首相似算法
.bushouSimilar(HanziSimilars.bushou())
// 部首权重
.bushouRate(HanziSimilarRateConst.BUSHOU)
// 四角数据
.sijiaoData(HanziSimilarDatas.sijiao())
// 四角相似算法
.sijiaoSimilar(HanziSimilars.sijiao())
// 四角权重
.sijiaoRate(HanziSimilarRateConst.SIJIAO)
// 拼音权重
.pinyinRate(HanziSimilarRateConst.PINYIN)
// 拼音相似算法
.pinyinSimilar(HanziSimilars.pinyin())
// 拆字权重
.chaiziRate(HanziSimilarRateConst.CHAIZI)
// 拆字相似算法
.chaiziSimilar(HanziSimilars.chaizi())
// 初始化
.init()
// 执行文本相似度对比
.similar('末', '未'); |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
作者大大:您好!
项目很不错,这是目前唯一能找到的基于字形计算字符相似度的工具,能解决实际问题,对于ocr识别结果与目标字符串比对结果有很大帮助;
我想使用autojs加载您这个字形相似度的工具使用,可以简单理解为android项目热加载dex使用,在目前测试的时候遇到了一些问题:
所有数据都是写死了资源路径,打包成jar再转成dex后所资源类文件会丢失,且资源数据占大头,希望能支持所有资源数据可通过外部加载,如:src/main/resources/nlp下的所有文件与用户定义等,依赖的pinyin与chaizi也能通过一样的方式加载,并且需要使用初始化方法加载,否则会因为类的初始化时就会因文件或文件路径不存在而报错
The text was updated successfully, but these errors were encountered: