• Stars
    star
    614
  • Rank 73,061 (Top 2 %)
  • Language
    Python
  • License
    GNU General Publi...
  • Created almost 2 years ago
  • Updated about 1 year ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

这是一个yolov8-pytorch的仓库,可以用于训练自己的数据集。

YOLOV8:You Only Look Once目标检测模型在pytorch当中的实现


目录

  1. 仓库更新 Top News
  2. 相关仓库 Related code
  3. 性能情况 Performance
  4. 所需环境 Environment
  5. 文件下载 Download
  6. 训练步骤 How2train
  7. 预测步骤 How2predict
  8. 评估步骤 How2eval
  9. 参考资料 Reference

Top News

2023-03:仓库创建,支持step、cos学习率下降法、支持adam、sgd优化器选择、支持学习率根据batch_size自适应调整、新增图片裁剪、支持多GPU训练、支持各个种类目标数量计算、支持heatmap、支持EMA。

相关仓库

模型 路径
YoloV3 https://github.com/bubbliiiing/yolo3-pytorch
Efficientnet-Yolo3 https://github.com/bubbliiiing/efficientnet-yolo3-pytorch
YoloV4 https://github.com/bubbliiiing/yolov4-pytorch
YoloV4-tiny https://github.com/bubbliiiing/yolov4-tiny-pytorch
Mobilenet-Yolov4 https://github.com/bubbliiiing/mobilenet-yolov4-pytorch
YoloV5-V5.0 https://github.com/bubbliiiing/yolov5-pytorch
YoloV5-V6.1 https://github.com/bubbliiiing/yolov5-v6.1-pytorch
YoloX https://github.com/bubbliiiing/yolox-pytorch
YoloV7 https://github.com/bubbliiiing/yolov7-pytorch
YoloV7-tiny https://github.com/bubbliiiing/yolov7-tiny-pytorch

性能情况

训练数据集 权值文件名称 测试数据集 输入图片大小 mAP 0.5:0.95 mAP 0.5
COCO-Train2017 yolov8_n.pth COCO-Val2017 640x640 36.7 52.1
COCO-Train2017 yolov8_s.pth COCO-Val2017 640x640 44.1 61.0
COCO-Train2017 yolov8_m.pth COCO-Val2017 640x640 49.3 66.3
COCO-Train2017 yolov8_l.pth COCO-Val2017 640x640 52.0 68.9
COCO-Train2017 yolov8_x.pth COCO-Val2017 640x640 52.9 69.9

所需环境

torch==1.2.0
为了使用amp混合精度,推荐使用torch1.7.1以上的版本。

文件下载

训练所需的权值可在百度网盘中下载。
链接: https://pan.baidu.com/s/1-khkEUiH-J3YJHVaYuuVbw
提取码: ss9t

VOC数据集下载地址如下,里面已经包括了训练集、测试集、验证集(与测试集一样),无需再次划分:
链接: https://pan.baidu.com/s/19Mw2u_df_nBzsC2lg20fQA
提取码: j5ge

训练步骤

a、训练VOC07+12数据集

  1. 数据集的准备
    本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集,解压后放在根目录

  2. 数据集的处理
    修改voc_annotation.py里面的annotation_mode=2,运行voc_annotation.py生成根目录下的2007_train.txt和2007_val.txt。

  3. 开始网络训练
    train.py的默认参数用于训练VOC数据集,直接运行train.py即可开始训练。

  4. 训练结果预测
    训练结果预测需要用到两个文件,分别是yolo.py和predict.py。我们首先需要去yolo.py里面修改model_path以及classes_path,这两个参数必须要修改。
    model_path指向训练好的权值文件,在logs文件夹里。
    classes_path指向检测类别所对应的txt。

    完成修改后就可以运行predict.py进行检测了。运行后输入图片路径即可检测。

b、训练自己的数据集

  1. 数据集的准备
    本文使用VOC格式进行训练,训练前需要自己制作好数据集,
    训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。
    训练前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。

  2. 数据集的处理
    在完成数据集的摆放之后,我们需要利用voc_annotation.py获得训练用的2007_train.txt和2007_val.txt。
    修改voc_annotation.py里面的参数。第一次训练可以仅修改classes_path,classes_path用于指向检测类别所对应的txt。
    训练自己的数据集时,可以自己建立一个cls_classes.txt,里面写自己所需要区分的类别。
    model_data/cls_classes.txt文件内容为:

cat
dog
...

修改voc_annotation.py中的classes_path,使其对应cls_classes.txt,并运行voc_annotation.py。

  1. 开始网络训练
    训练的参数较多,均在train.py中,大家可以在下载库后仔细看注释,其中最重要的部分依然是train.py里的classes_path。
    classes_path用于指向检测类别所对应的txt,这个txt和voc_annotation.py里面的txt一样!训练自己的数据集必须要修改!
    修改完classes_path后就可以运行train.py开始训练了,在训练多个epoch后,权值会生成在logs文件夹中。

  2. 训练结果预测
    训练结果预测需要用到两个文件,分别是yolo.py和predict.py。在yolo.py里面修改model_path以及classes_path。
    model_path指向训练好的权值文件,在logs文件夹里。
    classes_path指向检测类别所对应的txt。

    完成修改后就可以运行predict.py进行检测了。运行后输入图片路径即可检测。

预测步骤

a、使用预训练权重

  1. 下载完库后解压,在百度网盘下载权值,放入model_data,运行predict.py,输入
img/street.jpg
  1. 在predict.py里面进行设置可以进行fps测试和video视频检测。

b、使用自己训练的权重

  1. 按照训练步骤训练。
  2. 在yolo.py文件里面,在如下部分修改model_path和classes_path使其对应训练好的文件;model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类
_defaults = {
    #--------------------------------------------------------------------------#
    #   使用自己训练好的模型进行预测一定要修改model_path和classes_path!
    #   model_path指向logs文件夹下的权值文件,classes_path指向model_data下的txt
    #
    #   训练好后logs文件夹下存在多个权值文件,选择验证集损失较低的即可。
    #   验证集损失较低不代表mAP较高,仅代表该权值在验证集上泛化性能较好。
    #   如果出现shape不匹配,同时要注意训练时的model_path和classes_path参数的修改
    #--------------------------------------------------------------------------#
    "model_path"        : 'model_data/yolov8_s.pth',
    "classes_path"      : 'model_data/coco_classes.txt',
    #---------------------------------------------------------------------#
    #   anchors_path代表先验框对应的txt文件,一般不修改。
    #   anchors_mask用于帮助代码找到对应的先验框,一般不修改。
    #---------------------------------------------------------------------#
    "anchors_path"      : 'model_data/yolo_anchors.txt',
    "anchors_mask"      : [[6, 7, 8], [3, 4, 5], [0, 1, 2]],
    #---------------------------------------------------------------------#
    #   输入图片的大小,必须为32的倍数。
    #---------------------------------------------------------------------#
    "input_shape"       : [640, 640],
    #------------------------------------------------------#
    #   所使用到的yolov8的版本:
    #   n : 对应yolov8_n
    #   s : 对应yolov8_s
    #   m : 对应yolov8_m
    #   l : 对应yolov8_l
    #   x : 对应yolov8_x
    #------------------------------------------------------#
    "phi"               : 's',
    #---------------------------------------------------------------------#
    #   只有得分大于置信度的预测框会被保留下来
    #---------------------------------------------------------------------#
    "confidence"        : 0.5,
    #---------------------------------------------------------------------#
    #   非极大抑制所用到的nms_iou大小
    #---------------------------------------------------------------------#
    "nms_iou"           : 0.3,
    #---------------------------------------------------------------------#
    #   该变量用于控制是否使用letterbox_image对输入图像进行不失真的resize,
    #   在多次测试后,发现关闭letterbox_image直接resize的效果更好
    #---------------------------------------------------------------------#
    "letterbox_image"   : True,
    #-------------------------------#
    #   是否使用Cuda
    #   没有GPU可以设置成False
    #-------------------------------#
    "cuda"              : True,
}
  1. 运行predict.py,输入
img/street.jpg
  1. 在predict.py里面进行设置可以进行fps测试和video视频检测。

评估步骤

a、评估VOC07+12的测试集

  1. 本文使用VOC格式进行评估。VOC07+12已经划分好了测试集,无需利用voc_annotation.py生成ImageSets文件夹下的txt。
  2. 在yolo.py里面修改model_path以及classes_path。model_path指向训练好的权值文件,在logs文件夹里。classes_path指向检测类别所对应的txt。
  3. 运行get_map.py即可获得评估结果,评估结果会保存在map_out文件夹中。

b、评估自己的数据集

  1. 本文使用VOC格式进行评估。
  2. 如果在训练前已经运行过voc_annotation.py文件,代码会自动将数据集划分成训练集、验证集和测试集。如果想要修改测试集的比例,可以修改voc_annotation.py文件下的trainval_percent。trainval_percent用于指定(训练集+验证集)与测试集的比例,默认情况下 (训练集+验证集):测试集 = 9:1。train_percent用于指定(训练集+验证集)中训练集与验证集的比例,默认情况下 训练集:验证集 = 9:1。
  3. 利用voc_annotation.py划分测试集后,前往get_map.py文件修改classes_path,classes_path用于指向检测类别所对应的txt,这个txt和训练时的txt一样。评估自己的数据集必须要修改。
  4. 在yolo.py里面修改model_path以及classes_path。model_path指向训练好的权值文件,在logs文件夹里。classes_path指向检测类别所对应的txt。
  5. 运行get_map.py即可获得评估结果,评估结果会保存在map_out文件夹中。

Reference

https://github.com/ultralytics/ultralytics

More Repositories

1

yolov4-pytorch

这是一个YoloV4-pytorch的源码,可以用于训练自己的模型。
Python
2,100
star
2

yolo3-pytorch

这是一个yolo3-pytorch的源码,可以用于训练自己的模型。
Python
1,993
star
3

faster-rcnn-pytorch

这是一个faster-rcnn的pytorch实现的库,可以利用voc数据集格式的数据进行训练。
Python
1,559
star
4

unet-pytorch

这是一个unet-pytorch的源码,可以训练自己的模型
Python
1,314
star
5

yolov5-pytorch

这是一个YoloV5-pytorch的源码,可以用于训练自己的模型。
Python
1,019
star
6

deeplabv3-plus-pytorch

这是一个deeplabv3-plus-pytorch的源码,可以用于训练自己的模型。
Python
883
star
7

yolox-pytorch

这是一个yolox-pytorch的源码,可以用于训练自己的模型。
Python
879
star
8

yolov7-pytorch

这是一个yolov7的库,可以用于训练自己的数据集。
Python
868
star
9

yolov4-tiny-pytorch

这是一个YoloV4-tiny-pytorch的源码,可以用于训练自己的模型。
Python
778
star
10

ssd-pytorch

这是一个ssd-pytorch的源码,可以用于训练自己的模型。
Python
669
star
11

Siamese-pytorch

这是一个孪生神经网络(Siamese network)的库,可进行图片的相似性比较。
Python
572
star
12

yolo3-keras

这是一个yolo3-keras的源码,可以用于训练自己的模型。
Python
535
star
13

yolov4-keras

这是一个YoloV4-keras的源码,可以用于训练自己的模型。
Python
491
star
14

Semantic-Segmentation

I will upload many semantic segmentation models to this repository for you to learn
Python
433
star
15

classification-pytorch

这是各个主干网络分类模型的源码,可以用于训练自己的分类模型。
Python
387
star
16

mobilenet-yolov4-pytorch

这是一个mobilenet-yolov4的库,把yolov4主干网络修改成了mobilenet,修改了Panet的卷积组成,使参数量大幅度缩小。
Python
365
star
17

centernet-pytorch

这是一个centernet-pytorch的源码,可以用于训练自己的模型。
Python
364
star
18

pspnet-pytorch

这是一个pspnet-pytorch的源码,可以用于训练自己的模型。
Python
357
star
19

yolov4-tf2

这是一个yolo4-tf2(tensorflow2)的源码,可以用于训练自己的模型。
Python
314
star
20

mask-rcnn-keras

这是一个mask-rcnn的库,可以用于训练自己的实例分割模型。
Python
313
star
21

efficientdet-pytorch

这是一个efficientdet-pytorch的源码,可以用于训练自己的模型。
Python
305
star
22

faster-rcnn-keras

这是一个faster-rcnn的keras实现的库,可以利用voc数据集格式的数据进行训练。
Python
285
star
23

segformer-pytorch

这是一个segformer-pytorch的源码,可以用于训练自己的模型。
Python
251
star
24

GAN-keras

里面包含许多GAN算法的Keras源码,可以用于训练自己的模型。
Python
236
star
25

keras-face-recognition

这是一个基于mtcnn和facenet的人脸识别模型,可实现在线人脸识别。
Python
224
star
26

retinaface-pytorch

这是一个retinaface-pytorch的源码,可以用于训练自己的模型。
Python
211
star
27

ddpm-pytorch

这个是一个ddpm的pytorch仓库,可以用于训练自己的数据集。
Python
207
star
28

facenet-retinaface-pytorch

这是一个利用facenet和retinaface实现人脸识别的库,可以进行在线的人脸识别。
Python
193
star
29

yolov7-tiny-pytorch

这是一个yolov7-tiny-pytorch的源码,可以用于训练自己的模型。
Python
184
star
30

retinanet-pytorch

这是一个retinanet-pytorch的源码,可以用于训练自己的模型。
Python
175
star
31

faster-rcnn-tf2

这是一个faster-rcnn的tensorflow2实现的库,可以利用voc数据集格式的数据进行训练。
Python
171
star
32

ssd-keras

这是一个ssd-keras的源码,可以用于训练自己的模型。
Python
167
star
33

clip-pytorch

这是一个clip-pytorch的模型,可以训练自己的数据集。
Python
164
star
34

yolov4-tiny-keras

这是一个YoloV4-tiny-keras的源码,可以用于训练自己的模型。
Python
160
star
35

detr-pytorch

这是一个DETR-pytorch的仓库,可以训练自己的数据集
Python
158
star
36

object-detection-augmentation

这里面存放了一些目标检测算法的数据增强方法。如mosaic、mixup。
Python
150
star
37

efficientnet-yolo3-pytorch

这是一个efficientnet-yolo3-pytorch的源码,将yolov3的主干特征提取网络修改成了efficientnet
Python
142
star
38

mask-recognize

这是一个简单的人工智障识别口罩佩戴的库
Python
142
star
39

classic-convolution-network

里面会保存许多优秀的卷积神经网络结构,这些结构可以帮助我们更好的设计网络。
Python
139
star
40

ssd-tf2

这是一个ssd-tf2(tensorflow2)的源码,可以用于训练自己的模型。
Python
138
star
41

yolov4-tiny-tf2

这是一个YoloV4-tiny-tf2的源码,可以用于训练自己的模型。
Python
134
star
42

segmentation-format-fix

该仓库中放置了一些工具,用于调整语义分割算法的数据集格式,使其符合训练要求。
Python
131
star
43

arcface-pytorch

这是一个arcface-pytorch的源码,可以用于训练自己的模型。
Python
130
star
44

count-mAP-txt

这个是一个在SSD的基础上用于生成绘制mAP代码所用的txt的例子。(目的是生成txt)
Python
128
star
45

Keras-Attention

这个仓库主要包含了LSTM、卷积神经网络中,注意力机制的实现。
Python
126
star
46

mtcnn-keras

这是一个利用keras实现mtcnn的代码,可以实现人脸检测。
Python
124
star
47

yolov5-v6.1-pytorch

这是一个yolov5-v6.1-pytorch的源码,可以用于训练自己的模型。
Python
115
star
48

retinanet-keras

这是一个retinanet-keras的源码,可以用于训练自己的模型。
Python
111
star
49

unet-keras

这是一个unet-keras的源码,可以用于训练自己的模型。
Python
107
star
50

hrnet-pytorch

这是一个hrnet-pytorch的库,可用于训练自己的语义分割数据集
Python
106
star
51

mobilenet-ssd-keras

这是一个mobilenet-ssd-keras的源码,可以用于训练自己的轻量级ssd模型。
Python
105
star
52

stable-diffusion

这是一个stable-diffusion的库。
Python
102
star
53

yolov5-tf2

这是一个YoloV5-tensorflow2的源码,可以用于训练自己的模型。
Python
101
star
54

Bubbliiiing

91
star
55

efficientdet-keras

这是一个efficientdet-keras的源码,可以用于训练自己的模型。
Python
89
star
56

Transfer-Learning

这是一个有关迁移学习的仓库,在这里可以看到迁移学习的各种用法。
Python
88
star
57

yolo3-tf2

这是一个yolo3-tf2的源码,可以用于训练自己的模型。
Python
80
star
58

Mobilenet-SSD-Essay

这是Mobilenet-SSD的论文版,可用于训练与预测。
Python
78
star
59

yolox-tf2

这是一个yolox-tf2的源码,可以用于训练自己的模型。
Python
73
star
60

yolact-pytorch

这是一个yolact-pytorch的库,可用于训练自己的数据集
Python
71
star
61

mobilenet-yolov4-keras

这是一个mobilenet-yolov4的库,把yolov4主干网络修改成了mobilenet,修改了Panet的卷积组成,使参数量大幅度缩小。
Python
71
star
62

M2det-Keras

这是一个M2det的Keras实现的库,可以实时检测与训练。
Python
67
star
63

Siamese-keras

这是一个孪生神经网络(Siamese network)的库,可进行图片的相似性比较。
Python
66
star
64

classification-keras

这是各个主干网络分类模型的源码,可以用于训练自己的分类模型。
Python
66
star
65

yolox-keras

这是一个yolox-keras的源码,可以用于训练自己的模型。
Python
65
star
66

unet-tf2

这是一个unet-tf2的源码,可以用于训练自己的模型。
Python
64
star
67

RFB-keras

这是一个利用Keras实现RFBnet的库,RFBnet是SSD的改进版,其整体的结构与SSD相差不大,其主要特点是在SSD的特征提取网络上用了RFB模块。
Python
63
star
68

centernet-keras

这是一个centernet-keras的源码,可以用于训练自己的模型。
Python
63
star
69

mask-rcnn-tf2

这是一个mask-rcnn-tf2的库,可以用于训练自己的模型。
Python
63
star
70

facenet-keras

这是一个facenet-keras的源码,可以用于训练自己的模型。
Python
62
star
71

retinaface-keras

这是一个retinaface-keras的源码,可以用于训练自己的模型。
Python
60
star
72

DiT-pytorch

这是一个DiT-pytorch的代码,主要用于学习DiT结构。
Python
60
star
73

efficientdet-tf2

这是一个efficientdet-tf2(tensorflow2)的源码,可以用于训练自己的模型。
Python
59
star
74

efficientnet-yolo3-keras

这是一个efficientnet-yolo3-keras的源码,将yolov3的主干特征提取网络修改成了efficientnet
Python
55
star
75

retinaface-tf2

这是一个retinaface-tf2的源码,可以用于训练自己的模型。
Python
53
star
76

srgan-pytorch

这是一个srgan-keras的源码,可以用于训练自己的模型。
Python
53
star
77

pspnet-keras

这是一个pspnet-keras的源码,可以用于训练自己的模型。
Python
51
star
78

Siamese-tf2

这是一个孪生神经网络(Siamese network)的库,可进行图片的相似性比较。
Python
51
star
79

seq2seq-keras

这是一个利用keras实现seq2seq模型的仓库,大家可以通过这个仓库学习到许多的seq2seq的例子
Python
50
star
80

deeplabv3-plus-tf2

这是一个deeplabv3-plus-tf2的源码,可以用于训练自己的模型。
Python
49
star
81

dcgan-pytorch

这是一个dcgan-pytorch的源码,可以用于训练自己的模型。
Python
49
star
82

deeplabv3-plus-keras

这是一个deeplabv3-plus-keras的源码,可以用于训练自己的模型。
Python
49
star
83

classification-tf2

这是各个主干网络分类模型的源码,可以用于训练自己的分类模型。
Python
47
star
84

mobilenet-yolov4-tf2

这是一个mobilenet-yolov4的库,把yolov4主干网络修改成了mobilenet,修改了Panet的卷积组成,使参数量大幅度缩小。
Python
46
star
85

centernet-tf2

这是一个centernet-tf2的源码,可以用于训练自己的模型。
Python
46
star
86

dcgan-keras

这是一个dcgan-keras的源码,可以用于训练自己的模型。
Python
44
star
87

blip-pytorch

这是一个blip-pytorch简化的代码,适用于了解Attention与Transformer的结构。
Python
42
star
88

facenet-tf2

这是一个facenet-tf2的库,可以用于训练自己的人脸识别模型
Python
42
star
89

facenet-retinaface-keras

这是一个利用facenet和retinaface实现人脸识别的库,可以进行在线的人脸识别。
Python
40
star
90

QRcode-location

This is an Example about how to locate QRcode.
C++
39
star
91

poems-generator

这个例子可以用LSTM来写五言诗。
Python
37
star
92

cyclegan-pytorch

这是一个cyclegan-pytorch的源码,可以用于训练自己的模型。
Python
37
star
93

srgan-keras

这是一个srgan-keras的源码,可以用于训练自己的模型。
Python
34
star
94

yolov5-keras

这是一个YoloV5-keras的源码,可以用于训练自己的模型。
Python
34
star
95

pspnet-tf2

这是一个pspnet-tf2的源码,可以用于训练自己的模型。
Python
31
star
96

yolov7-tf2

这是一个YoloV7-tf2的源码,可以用于训练自己的模型。
Python
28
star
97

yolov7-keras

这是一个yolov7-keras的源码,可以用于训练自己的模型。
Python
26
star
98

fcos-pytorch

这是一个fcos-pytorch的仓库,可以用于训练自己的数据集。
Python
24
star
99

Colab

这是一个Colab使用的示例notebook。配合博文使用。
Jupyter Notebook
22
star
100

yolov5-v6.1-tf2

这是一个yolov5-v6.1-tf2的源码,可以用于训练自己的模型。
Python
19
star