Skip to content

Latest commit

 

History

History
60 lines (34 loc) · 3.52 KB

README-ZH.md

File metadata and controls

60 lines (34 loc) · 3.52 KB

CPM-Live

直播训练开源大模型

官方网站计划书讨论区English

动态

  • 2023/05/27 CPM-Bee 发布了!
  • 2023/04/12 CPM-Ant 可以在HuggingFace Transformers中使用了!
  • 2022/10/12 中英双语模型 CPM-Ant+ 已经发布!除了能够生成中文/英文文本,现在模型还可以处理问答、摘要和翻译任务!
  • 2022/09/16 CPM-Ant 已经发布!
  • 2022/05/29 CPM-Live的训练今天启动! 详情请查看训练动态
  • 2022/05/25 CPM-Live的训练计划现已公布。期待训练开始!

里程碑

训练计划

考虑到数据和计算资源的规模,CPM-Live将从10B模型开始训练并持续学习。

在训练过程中,我们将进行:

  • 实时:显示模型训练指标
  • 每天:发布模型训练日志
  • 每周:处理社区的讨论和反馈
  • 不定期:在模型训练期间发布允许公开下载的检查点

在训练期间你可以:

  • 提出你的模型倡议:对模型架构、训练方法或数据源有好的想法?你可以在社区里提出你的模型倡议。如果该倡议得到更多的支持并且实际可行,我们将把它添加到我们正在训练的模型中,这样CPM-Live就可以在大家的帮助下不断学习和进步。

  • 开发你的应用程序:基于CPM-Live,你可以向社区提交你初期想法、原型、开发代码或完成的应用程序。我们将在网站上展示最受欢迎的应用程序。

  • 在论坛上聊天:你可以在我们的论坛上谈论任何与大模型有关的话题,如学术研究、工程实现、工具使用、应用设计等。无论你是否有经验,我们相信每个人都可以从积极和开放的讨论中受益。

  • 下载资源:模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力!

社区

我们的社区 基于GitHub Discussions。

阅读第一篇帖子,开始你对CPM-Live的探索吧!