Skip to content

Latest commit

 

History

History
20 lines (12 loc) · 954 Bytes

task.md

File metadata and controls

20 lines (12 loc) · 954 Bytes

OpenCompass 评测 InternLM-1.8B 实践

  • 记录复现过程并截图。

基础任务(完成此任务即完成闯关)

  • 使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。

进阶任务(闯关不要求完成此任务)

  • 使用 OpenCompass 进行主观评测(选做)
  • 使用 OpenCompass 评测 InternLM2-Chat-1.8B 模型使用 LMDeploy部署后在 ceval 数据集上的性能(选做)
  • 使用 OpenCompass 进行调用API评测(优秀学员必做)

闯关材料提交(完成任务并且提交材料视为闯关成功)