refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205

xingchensong · 2023-12-08T07:26:14Z

将模型相关的配置从train args移动到yaml，比如ctc、cmvn、tokenizer
将sos设定为恒定=2，而不是vocab_size - 1,特殊化处理，此时不同字典可以share相同的特殊token

TODO (current PR)

验证可以训练
验证可以解码

TODO (next PR)

librispeech 适配 [recipe] refine yaml for librispeech #2227
wenetspeech 适配 [recipe] refine yaml for wenetspeech #2229
gigaspeech 适配 [recipe] refine yaml for gigaspeech #2230
multi_cn 适配
aishell2 适配 [recipe] refine yaml for aishell2 #2231
pretrained model 重新上传 [doc] update aishell url #2221
paraformer相关修改 @Mddct [paraformer] refine model class #2226

Mddct · 2023-12-08T12:42:24Z

great work

Mddct · 2023-12-08T12:53:54Z

TODO

paraformer special tokens @Mddct refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205 (comment)
tokenizer check special tokens valid @Mddct

robin1001

周哥，这个改动比较大，功能也很杂，强烈建议分开提 PR，每个 PR 只做一个功能，来自 Google 软件实践指南中的建议。

xingchensong · 2023-12-08T13:49:24Z

记一个TODO，后面runtime也要针对special id做对应的修改，比如blanckid不是0，sos不是vocabsize-1等

xingchensong · 2023-12-12T09:05:24Z

模型转换脚本（sos从vocabsize-1变成2）

import torch                                                                                                                                                                                                                  [3/528]

old_state = torch.load('/mnt/d/BaiduSyncdisk/downloads/ckpt/20210601_u2++_conformer_exp_aishell/final.pt')
new_state = {}
change_list = ['decoder.left_decoder.output_layer.weight',
               'decoder.left_decoder.output_layer.bias',
               'decoder.left_decoder.embed.0.weight',
               'decoder.right_decoder.output_layer.weight',
               'decoder.right_decoder.output_layer.bias',
               'decoder.right_decoder.embed.0.weight',
               'ctc.ctc_lo.weight',
               'ctc.ctc_lo.bias']
for key in old_state.keys():
    if key in change_list:
        print("processing {}, {}".format(key, old_state[key].size()))
        tensor = old_state[key]
        new_tensor = torch.zeros_like(tensor)
        if len(tensor.size()) == 2:  # weight
            new_tensor[:2, :] = tensor[:2, :]
            new_tensor[2, :] = tensor[-1, :]
            new_tensor[3:, :] = tensor[2:-1, :]
        elif len(tensor.size()) == 1:  # bias
            new_tensor[:2] = tensor[:2]
            new_tensor[2] = tensor[-1]
            new_tensor[3:] = tensor[2:-1]
        else:
            raise NotImplementedError
        new_state[key] = new_tensor
    elif "concat_linear" in key:
        continue
    else:
        new_state[key] = old_state[key]

torch.save(new_state, "/mnt/d/BaiduSyncdisk/downloads/ckpt/20210601_u2++_conformer_exp_aishell/final.sos2.pt")

转换后可以成功解码

xingchensong · 2023-12-12T09:52:54Z

解码结果一致

follow #2205

xingchensong force-pushed the xcsong-yaml branch from 6e2941e to 2a1ede8 Compare December 8, 2023 12:22

Mddct self-requested a review December 8, 2023 12:42

Mddct previously approved these changes Dec 8, 2023

View reviewed changes

Mddct requested a review from robin1001 December 8, 2023 13:04

robin1001 requested changes Dec 8, 2023

View reviewed changes

xingchensong dismissed Mddct’s stale review via f0bd69c December 8, 2023 13:52

xingchensong force-pushed the xcsong-yaml branch from 97d44a1 to a1fb531 Compare December 12, 2023 04:00

xingchensong force-pushed the xcsong-yaml branch from 04bfb7a to b8cb316 Compare December 12, 2023 10:18

Mddct self-requested a review December 12, 2023 10:31

Mddct previously approved these changes Dec 12, 2023

View reviewed changes

Mddct requested a review from robin1001 December 12, 2023 11:38

xingchensong added a commit that referenced this pull request Dec 12, 2023

[doc] update aishell url

fb18041

follow #2205

xingchensong mentioned this pull request Dec 12, 2023

[doc] update aishell url #2221

Closed

Mddct mentioned this pull request Dec 12, 2023

[paraformer] refine model class #2226

Merged

xingchensong dismissed Mddct’s stale review via b0f34a0 December 13, 2023 01:25

xingchensong added 10 commits December 13, 2023 09:26

refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml

185b971

refactor(yaml): pass training

259f159

refactor(yaml): try to pass unittest

807c874

refactor(yaml): remove lfmmi

1a04689

refactor(yaml): nst recipe

ffd6dc6

[refactor] refine run.sh

8032a37

[refactor] refine run.sh

6e7d876

[refactor] rebase main

9b078ed

[refactor] try to pass ut

847a35d

[refactor] refine librispeech in next PR

9acc3e9

xingchensong added 15 commits December 13, 2023 09:26

[refactor] add todo

d31fe15

[refactor] refine paraformer in next PR

9430a0b

[refactor] make sos = 2

ca302d3

[refactor] make sos = 2

fe0e9e0

[refactor] try to pass ut

1f9cbfa

[refactor] refine onnx_gpu

334b4b3

[refactor] try to pass ut

69f0364

[refactor] try to pass ut

3fb7e99

[refactor] try to pass ut

6eeb4e4

[refactor] try to pass ut

72a1e18

refactor: pass decoding

924289a

refactor: pass decoding

a7b009a

refactor: pass decoding

73d8742

refactor: refine tokenizer

5394ca1

refactor: try to pass ut

389d5f7

xingchensong force-pushed the xcsong-yaml branch from b0f34a0 to 389d5f7 Compare December 13, 2023 01:26

Merge branch 'main' into xcsong-yaml

e1f6c38

Mddct approved these changes Dec 13, 2023

View reviewed changes

robin1001 approved these changes Dec 13, 2023

View reviewed changes

robin1001 merged commit fac1f0c into main Dec 13, 2023
6 checks passed

robin1001 deleted the xcsong-yaml branch December 13, 2023 04:58

xingchensong mentioned this pull request Dec 13, 2023

[recipe] refine yaml for librispeech #2227

Merged

This was referenced Dec 13, 2023

[paraformer] fix cmvn files #2228

Merged

[tokenizer] 希望将tokenizer_type等写入yaml，从而可以在yaml中配置相关字段 #2204

Closed

This was referenced Dec 13, 2023

[recipe] refine yaml for wenetspeech #2229

Merged

[recipe] refine yaml for gigaspeech #2230

Merged

[recipe] refine yaml for aishell2 #2231

Merged

[example] refine yaml for aishell2-rnnt #2232

Merged

[recipe] refine yaml for aishell4 #2236

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205

refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205

xingchensong commented Dec 8, 2023 •

edited

Loading

Mddct commented Dec 8, 2023

Mddct commented Dec 8, 2023 •

edited

Loading

robin1001 left a comment

xingchensong commented Dec 8, 2023

xingchensong commented Dec 12, 2023

xingchensong commented Dec 12, 2023

refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205

refactor(yaml): Config ctc/cmvn/tokenizer in train.yaml #2205

Conversation

xingchensong commented Dec 8, 2023 • edited Loading

TODO (current PR)

TODO (next PR)

Mddct commented Dec 8, 2023

Mddct commented Dec 8, 2023 • edited Loading

robin1001 left a comment

Choose a reason for hiding this comment

xingchensong commented Dec 8, 2023

xingchensong commented Dec 12, 2023

xingchensong commented Dec 12, 2023

xingchensong commented Dec 8, 2023 •

edited

Loading

Mddct commented Dec 8, 2023 •

edited

Loading