Qwen2和Qwen2.5的代码为什么在output之后加的是pad_token_id而不是eos_token_id，这有什么影响吗？ #326

zihao-ai · 2025-01-07T13:49:34Z

KMnO4-zx · 2025-01-07T14:40:32Z

没有影响，Qwen2.5 的 pad_token_id 和 eos_token_id 是一样的

HarryTMa · 2025-01-12T09:48:16Z

没有影响，Qwen2.5 的 pad_token_id 和 eos_token_id 是一样的

KMnO4-zx · 2025-01-13T02:41:56Z

感谢您的提醒！我们会抓紧修改一下！

Guncuke · 2025-01-13T09:52:28Z

没有影响，Qwen2.5 的 pad_token_id 和 eos_token_id 是一样的

您好！经查看发现，Qwen2.5的带instruct的模型的tokenizer的pad_token和eos_token不一样，前者是<|endoftext|>（id为151643），后者是<|im_end|>（id为151645）；不带instruct的模型的pad_token和eos_token是一样的，都是<|endoftext|>

我觉得应该补一个<|im_end|> 然后后面接<|endoftext|>，不然最后一句用户的im没有闭合

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Qwen2和Qwen2.5的代码为什么在output之后加的是pad_token_id而不是eos_token_id，这有什么影响吗？ #326

Qwen2和Qwen2.5的代码为什么在output之后加的是pad_token_id而不是eos_token_id，这有什么影响吗？ #326

zihao-ai commented Jan 7, 2025

KMnO4-zx commented Jan 7, 2025

HarryTMa commented Jan 12, 2025

KMnO4-zx commented Jan 13, 2025

Guncuke commented Jan 13, 2025

Qwen2和Qwen2.5的代码为什么在output之后加的是pad_token_id而不是eos_token_id，这有什么影响吗？ #326

Qwen2和Qwen2.5的代码为什么在output之后加的是pad_token_id而不是eos_token_id，这有什么影响吗？ #326

Comments

zihao-ai commented Jan 7, 2025

KMnO4-zx commented Jan 7, 2025

HarryTMa commented Jan 12, 2025

KMnO4-zx commented Jan 13, 2025

Guncuke commented Jan 13, 2025