OpenMMLab 官网 ^HOT OpenMMLab 开放平台 ^{TRY IT OUT}

English | 简体中文

简介

MMDetection 是一个基于 PyTorch 的目标检测开源工具箱。它是 OpenMMLab 项目的一部分。

主分支代码目前支持 PyTorch 1.8 及其以上的版本。

主要特性

模块化设计

MMDetection 将检测框架解耦成不同的模块组件，通过组合不同的模块组件，用户可以便捷地构建自定义的检测模型
支持多种检测任务

MMDetection 支持了各种不同的检测任务，包括目标检测，实例分割，全景分割，以及半监督目标检测。
速度快

基本的框和 mask 操作都实现了 GPU 版本，训练速度比其他代码库更快或者相当，包括 Detectron2, maskrcnn-benchmark 和 SimpleDet。
性能高

MMDetection 这个算法库源自于 COCO 2018 目标检测竞赛的冠军团队 MMDet 团队开发的代码，我们在之后持续进行了改进和提升。新发布的 RTMDet 还在实时实例分割和旋转目标检测任务中取得了最先进的成果，同时也在目标检测模型中取得了最佳的的参数量和精度平衡。

除了 MMDetection 之外，我们还开源了深度学习训练库 MMEngine 和计算机视觉基础库 MMCV，它们是 MMDetection 的主要依赖。

最新进展

亮点

v3.2.0 版本已经在 2023.10.12 发布：

1. 检测 Transformer SOTA 模型大合集 (1) 支持了 DDQ、CO-DETR、AlignDETR 和 H-DINO 4 个更新更强的 SOTA Transformer 模型 (2) 基于 CO-DETR, MMDet 中发布了 COCO 性能为 64.1 mAP 的模型 (3) DINO 等算法支持 AMP/Checkpoint/FrozenBN，可以有效降低显存

2. 提供了全面的 CNN 和 Transformer 的性能对比 RF100 是由 100 个现实收集的数据集组成，包括 7 个域，可以验证 DINO 等 Transformer 模型和 CNN 类算法在不同场景不同数据量下的性能差异。用户可以用这个 Benchmark 快速验证自己的算法在不同场景下的鲁棒性。

3. 支持了 GLIP 和 Grounding DINO 微调，全网唯一支持 Grounding DINO 微调 MMDet 中的 Grounding DINO 是全网唯一支持微调的算法库，且性能高于官方 1 个点，当然 GLIP 也比官方高。我们还提供了详细的 Grounding DINO 在自定义数据集上训练评估的流程，欢迎大家试用。

Model	Backbone	Style	COCO mAP	Official COCO mAP
Grounding DINO-T	Swin-T	Zero-shot	48.5	48.4
Grounding DINO-T	Swin-T	Finetune	58.1(+0.9)	57.2
Grounding DINO-B	Swin-B	Zero-shot	56.9	56.7
Grounding DINO-B	Swin-B	Finetune	59.7
Grounding DINO-R50	R50	Scratch	48.9(+0.8)	48.1

4. 支持开放词汇检测算法 Detic 并提供多数据集联合训练可能

5. 轻松使用 FSDP 和 DeepSpeed 训练检测模型

ID	AMP	GC of Backbone	GC of Encoder	FSDP	Peak Mem (GB)	Iter Time (s)
1					49 (A100)	0.9
2	√				39 (A100)	1.2
3		√			33 (A100)	1.1
4	√	√			25 (A100)	1.3
5		√	√		18	2.2
6	√	√	√		13	1.6
7		√	√	√	14	2.9
8	√	√	√	√	8.5	2.4

6. 支持了 V3Det 1.3w+ 类别的超大词汇检测数据集

我们很高兴向大家介绍我们在实时目标识别任务方面的最新成果 RTMDet，包含了一系列的全卷积单阶段检测模型。 RTMDet 不仅在从 tiny 到 extra-large 尺寸的目标检测模型上实现了最佳的参数量和精度的平衡，而且在实时实例分割和旋转目标检测任务上取得了最先进的成果。更多细节请参阅技术报告。预训练模型可以在这里找到。

Task	Dataset	AP	FPS(TRT FP16 BS1 3090)
Object Detection	COCO	52.8	322
Instance Segmentation	COCO	44.6	188
Rotated Object Detection	DOTA	78.9(single-scale)/81.3(multi-scale)	121

安装

请参考快速入门文档进行安装。

教程

请阅读概述对 MMDetection 进行初步的了解。

为了帮助用户更进一步了解 MMDetection，我们准备了用户指南和进阶指南，请阅读我们的文档：

用户指南
- 训练 & 测试
- 实用工具
进阶指南

我们提供了检测的 colab 教程和实例分割的 colab 教程

同时，我们还提供了 MMDetection 中文解读文案汇总

若需要将2.x版本的代码迁移至新版，请参考迁移文档。

基准测试和模型库

测试结果和模型可以在模型库中找到。

算法架构

Object Detection

Instance Segmentation

Panoptic Segmentation

Other

Fast R-CNN (ICCV'2015)
Faster R-CNN (NeurIPS'2015)
RPN (NeurIPS'2015)
SSD (ECCV'2016)
RetinaNet (ICCV'2017)
Cascade R-CNN (CVPR'2018)
YOLOv3 (ArXiv'2018)
CornerNet (ECCV'2018)
Grid R-CNN (CVPR'2019)
Guided Anchoring (CVPR'2019)
FSAF (CVPR'2019)
CenterNet (CVPR'2019)
Libra R-CNN (CVPR'2019)
TridentNet (ICCV'2019)
FCOS (ICCV'2019)
RepPoints (ICCV'2019)
FreeAnchor (NeurIPS'2019)
CascadeRPN (NeurIPS'2019)
Foveabox (TIP'2020)
Double-Head R-CNN (CVPR'2020)
ATSS (CVPR'2020)
NAS-FCOS (CVPR'2020)
CentripetalNet (CVPR'2020)
AutoAssign (ArXiv'2020)
Side-Aware Boundary Localization (ECCV'2020)
Dynamic R-CNN (ECCV'2020)
DETR (ECCV'2020)
PAA (ECCV'2020)
VarifocalNet (CVPR'2021)
Sparse R-CNN (CVPR'2021)
YOLOF (CVPR'2021)
YOLOX (CVPR'2021)
Deformable DETR (ICLR'2021)
TOOD (ICCV'2021)
DDOD (ACM MM'2021)
RTMDet (ArXiv'2022)
Conditional DETR (ICCV'2021)
DAB-DETR (ICLR'2022)
DINO (ICLR'2023)
GLIP (CVPR'2022)
DDQ (CVPR'2023)
DiffusionDet (ArXiv'2023)
EfficientDet (CVPR'2020)
ViTDet (ECCV'2022)
Detic (ECCV'2022)
CO-DETR (ICCV'2023)

Mask R-CNN (ICCV'2017)
Cascade Mask R-CNN (CVPR'2018)
Mask Scoring R-CNN (CVPR'2019)
Hybrid Task Cascade (CVPR'2019)
YOLACT (ICCV'2019)
InstaBoost (ICCV'2019)
SOLO (ECCV'2020)
PointRend (CVPR'2020)
DetectoRS (ArXiv'2020)
SOLOv2 (NeurIPS'2020)
SCNet (AAAI'2021)
QueryInst (ICCV'2021)
Mask2Former (ArXiv'2021)
CondInst (ECCV'2020)
SparseInst (CVPR'2022)
RTMDet (ArXiv'2022)
BoxInst (CVPR'2021)
ConvNeXt-V2 (Arxiv'2023)

Panoptic FPN (CVPR'2019)
MaskFormer (NeurIPS'2021)
Mask2Former (ArXiv'2021)
XDecoder (CVPR'2023)

Contrastive Learning

SwAV (NeurIPS'2020)
MoCo (CVPR'2020)
MoCov2 (ArXiv'2020)

Distillation

Localization Distillation (CVPR'2022)
Label Assignment Distillation (WACV'2022)

Semi-Supervised Object Detection

Soft Teacher (ICCV'2021)

模块组件

Backbones	Necks	Loss	Common
VGG (ICLR'2015) ResNet (CVPR'2016) ResNeXt (CVPR'2017) MobileNetV2 (CVPR'2018) HRNet (CVPR'2019) Generalized Attention (ICCV'2019) GCNet (ICCVW'2019) Res2Net (TPAMI'2020) RegNet (CVPR'2020) ResNeSt (ArXiv'2020) PVT (ICCV'2021) Swin (CVPR'2021) PVTv2 (ArXiv'2021) ResNet strikes back (ArXiv'2021) EfficientNet (ArXiv'2021) ConvNeXt (CVPR'2022) ConvNeXtv2 (ArXiv'2023)	PAFPN (CVPR'2018) NAS-FPN (CVPR'2019) CARAFE (ICCV'2019) FPG (ArXiv'2020) GRoIE (ICPR'2020) DyHead (CVPR'2021)	GHM (AAAI'2019) Generalized Focal Loss (NeurIPS'2020) Seasaw Loss (CVPR'2021)	OHEM (CVPR'2016) Group Normalization (ECCV'2018) DCN (ICCV'2017) DCNv2 (CVPR'2019) Weight Standardization (ArXiv'2019) Prime Sample Attention (CVPR'2020) Strong Baselines (CVPR'2021) Resnet strikes back (ArXiv'2021)

我们在基于 MMDetection 的项目中列举了一些其他的支持的算法。

常见问题

请参考 FAQ 了解其他用户的常见问题。

贡献指南

我们感谢所有的贡献者为改进和提升 MMDetection 所作出的努力。我们将正在进行中的项目添加进了GitHub Projects页面，非常欢迎社区用户能参与进这些项目中来。请参考贡献指南来了解参与项目贡献的相关指引。

致谢

MMDetection 是一款由来自不同高校和企业的研发人员共同参与贡献的开源项目。我们感谢所有为项目提供算法复现和新功能支持的贡献者，以及提供宝贵反馈的用户。我们希望这个工具箱和基准测试可以为社区提供灵活的代码工具，供用户复现已有算法并开发自己的新模型，从而不断为开源社区提供贡献。

引用

如果你在研究中使用了本项目的代码或者性能基准，请参考如下 bibtex 引用 MMDetection。

@article{mmdetection,
  title   = {{MMDetection}: Open MMLab Detection Toolbox and Benchmark},
  author  = {Chen, Kai and Wang, Jiaqi and Pang, Jiangmiao and Cao, Yuhang and
             Xiong, Yu and Li, Xiaoxiao and Sun, Shuyang and Feng, Wansen and
             Liu, Ziwei and Xu, Jiarui and Zhang, Zheng and Cheng, Dazhi and
             Zhu, Chenchen and Cheng, Tianheng and Zhao, Qijie and Li, Buyu and
             Lu, Xin and Zhu, Rui and Wu, Yue and Dai, Jifeng and Wang, Jingdong
             and Shi, Jianping and Ouyang, Wanli and Loy, Chen Change and Lin, Dahua},
  journal= {arXiv preprint arXiv:1906.07155},
  year={2019}
}

开源许可证

该项目采用 Apache 2.0 开源许可证。

OpenMMLab 的其他项目

MMEngine: OpenMMLab 深度学习模型训练基础库
MMCV: OpenMMLab 计算机视觉基础库
MMPreTrain: OpenMMLab 深度学习预训练工具箱
MMagic: OpenMMLab 新一代人工智能内容生成（AIGC）工具箱
MMDetection: OpenMMLab 目标检测工具箱
MMDetection3D: OpenMMLab 新一代通用 3D 目标检测平台
MMRotate: OpenMMLab 旋转框检测工具箱与测试基准
MMYOLO: OpenMMLab YOLO 系列工具箱与测试基准
MMSegmentation: OpenMMLab 语义分割工具箱
MMOCR: OpenMMLab 全流程文字检测识别理解工具包
MMPose: OpenMMLab 姿态估计工具箱
MMHuman3D: OpenMMLab 人体参数化模型工具箱与测试基准
MMSelfSup: OpenMMLab 自监督学习工具箱与测试基准
MMRazor: OpenMMLab 模型压缩工具箱与测试基准
MMFewShot: OpenMMLab 少样本学习工具箱与测试基准
MMAction2: OpenMMLab 新一代视频理解工具箱
MMTracking: OpenMMLab 一体化视频目标感知平台
MMFlow: OpenMMLab 光流估计工具箱与测试基准
MMEditing: OpenMMLab 图像视频编辑工具箱
MMGeneration: OpenMMLab 图片视频生成模型工具箱
MMDeploy: OpenMMLab 模型部署框架
MIM: OpenMMlab 项目、算法、模型的统一入口
MMEval: 统一开放的跨框架算法评测库
Playground: 收集和展示 OpenMMLab 相关的前沿、有趣的社区项目

欢迎加入 OpenMMLab 社区

扫描下方的二维码可关注 OpenMMLab 团队的知乎官方账号，扫描下方微信二维码添加喵喵好友，进入 MMDectection 微信交流社群。【加好友申请格式：研究方向+地区+学校/公司+姓名】

我们会在 OpenMMLab 社区为大家

📢 分享 AI 框架的前沿核心技术
💻 解读 PyTorch 常用模块源码
📰 发布 OpenMMLab 的相关新闻
🚀 介绍 OpenMMLab 开发的前沿算法
🏃 获取更高效的问题答疑和意见反馈
🔥 提供与各行各业开发者充分交流的平台

干货满满 📘，等你来撩 💗，OpenMMLab 社区期待您的加入 👬

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_zh-CN.md

README_zh-CN.md

简介

最新进展

亮点

安装

教程

基准测试和模型库

常见问题

贡献指南

致谢

引用

开源许可证

OpenMMLab 的其他项目

欢迎加入 OpenMMLab 社区

Files

README_zh-CN.md

Latest commit

History

README_zh-CN.md

File metadata and controls

简介

最新进展

亮点

安装

教程

基准测试和模型库

常见问题

贡献指南

致谢

引用

开源许可证

OpenMMLab 的其他项目

欢迎加入 OpenMMLab 社区