vocab.txt如何生成？vocab_size为什么发生变化？ #6

wyqnumber · 2020-07-04T08:42:32Z

通过chinese_L-12_H-768_A-12模型训练生成simbert模型中的vocab.txt发生了变化，词的内容和数量都不同了，新simbert模型中的vocab.txt如何生成？

wyqnumber · 2020-07-04T08:46:15Z

keep_tokens=keep_tokens, # 只保留keep_tokens中的字，精简原字表

sssdjj · 2020-08-13T08:42:05Z

怎样保存精简词表呢

sssdjj · 2020-08-13T08:45:28Z

path = open("test/vocab.txt","w+")

for i in token_dict.keys():
path.write(i+"\n")
path.close()

lonngxiang · 2021-03-02T03:35:05Z

也感觉遇到类似问题，预训练后加载模型预测报错，不知道什么原因产生

Provide feedback