• Stars
    star
    415
  • Rank 103,710 (Top 3 %)
  • Language
    Python
  • Created about 4 years ago
  • Updated almost 3 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

目标检测数据集制作:VOC,COCO,YOLO等常用数据集格式的制作和互相转换脚本

objectDetectionDatasets

目标检测数据集制作:VOC,COCO,YOLO等常用数据集格式的制作和互相转换脚本,demo/目录提供的原始的voc格式的20张原图和对应20个.xml标注. 下面的脚本都可以通过这个demo数据跑通.

voc_split_trainVal.py

该脚本用于生成voc/目录下的ImageSets/..目录,分割了训练和验证集

voc_to_coco_V1.py 和 voc_to_coco_V2.py

这两个脚本都是实现从voc的.xml标注格式转换到coco的.json格式,只是有所区别

  • v1版本实现了转换的同时进行训练/验证的分割
  • v2版本包含了segemetation字段(当训练htc等需要分割的任务时候网络需要用到)

convert_voc_to_yoloV5.py 和 convert_voc_to_yoloV3.py

两个脚本实现的功能几乎相同,灵活取用

  • V5脚本实现将voc格式的数据转化为yoloV5需要的.txt标注文件,运行该脚本,会在voc/目录下生成 worktxt/目录(yolo需要的格式).
  • V3这个脚本除了生成.txt的标注(同上),还会生成一个trianval.txt的索引,以前的yolov3系列用的多一点

coco_split_trainVal.py

该脚本实现coco格式的数据分割出训练集和验证集,同时里面还实现了一个去除背景图的方法(没有标注框的图),可以结合上面的 voc_to_coco_v2.py使用.

make_voc.py(其余各种格式转voc)

前面没有写coco转voc格式的脚本,make_voc.py就提供了一个制作voc格式数据的通用套路(核心代码).

`img = cv2.imread(image_path)
            height, width, depth = img.shape
            with codecs.open(anno_dir + imgId_frame_name[:-4] + '.xml', 'w', 'utf-8') as xml:
                xml.write('<annotation>\n')
                xml.write('\t<filename>' + imgId_frame_name + '</filename>\n')
                xml.write('\t<size>\n')
                xml.write('\t\t<width>' + str(width) + '</width>\n')
                xml.write('\t\t<height>' + str(height) + '</height>\n')
                xml.write('\t\t<depth>' + str(depth) + '</depth>\n')
                xml.write('\t</size>\n')
                cnt = 0
                for bbox in bboxs:
                    xmin, ymin, xmax, ymax = bbox
                    class_name = 'obstacles'
                    #
                    xml.write('\t<object>\n')
                    xml.write('\t\t<name>' + class_name + '</name>\n')
                    xml.write('\t\t<bndbox>\n')
                    xml.write('\t\t\t<xmin>' + str(xmin) + '</xmin>\n')
                    xml.write('\t\t\t<ymin>' + str(ymin) + '</ymin>\n')
                    xml.write('\t\t\t<xmax>' + str(xmax) + '</xmax>\n')
                    xml.write('\t\t\t<ymax>' + str(ymax) + '</ymax>\n')
                    xml.write('\t\t</bndbox>\n')
                    xml.write('\t</object>\n')
                    cnt += 1
                assert cnt > 0
                xml.write('</annotation>')`

More Repositories

1

baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
Python
2,443
star
2

data-science-competition

该仓库用于记录作者本人参加的各大数据科学竞赛的获奖方案源码以及一些新比赛的原创baseline. 主要涵盖:kaggle, 阿里天池,华为云大赛校园赛,百度aistudio,和鲸社区,datafountain等
Python
1,306
star
3

DataAugmentation_ForObjectDetect

本仓库主要包含了针对目标检测数据集的增强手段和源码:图像的旋转,镜像,裁剪,亮度/对比度的变换等
Python
126
star
4

MultiClassify_LSTM_ForChinese

本项目主要是利用LSTM来对中文文本进行情感分类,包含四个类别(愤怒,焦虑,抑郁,伤感)
Python
52
star
5

Fashion-MNIST

这是一个入门机器学习/深度学习的小项目,包含随机森林,多层感知器,卷积神经网络,实现了训练可视化,多分类混淆矩阵等计算
Python
40
star
6

GarbageDetection

华为云杯”2020深圳开放数据应用创新大赛·生活垃圾图片分类.排名:50/4388;方案:SSD-efficientd3-DiouLoss
Python
13
star
7

Baidu_BigData2020

2020第六届百度&西安交大大数据竞赛暨IKCEST第二届“一带一路”国际大数据竞赛
Jupyter Notebook
11
star
8

TianChi-Sunsport

阿里天池太阳黑子分类--赛道一方案分享(0.908第十名)
Python
9
star
9

DIGIX-ImageRetrieval

华为DIGIX图像检索
Python
9
star
10

Tianchi-competition-ZhiHuiHaiYang

智慧海洋初赛testB-0.8742方案
Jupyter Notebook
8
star
11

Antai_Cup

(阿里天池安泰杯国际人工智能电子商务的挑战)Antai Cup-International E-commerce Artificial Intelligence Challenge
Python
4
star
12

kaggle-Sartorius

Sartorius - Cell Instance Segmentation Detect single neuronal cells in microscopy images
Python
1
star
13

BioPulmonaryNodules

Python
1
star