数据标注工具【LabelImg】安装使用 & 用VOC制作自己的数据集
Labelimg是一款开源的数据标注工具,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用,它可以标注三种格式。1 VOC标签格式,保存为xml文件。2 yolo标签格式,保存为txt文件。3 createML标签格式,保存为json格式。
⭐️LabelImg简介
Labelimg是一款开源的数据标注工具
,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用,它可以标注三种格式。
1 VOC标签格式,保存为xml文件。
2 yolo标签格式,保存为txt文件。
3 createML标签格式,保存为json格式。
⭐️LabelImg的安装
首先,用conda创建一个新的环境
conda create -n py38 python=3.8
查看已有环境列表:
conda envs list
然后,激活环境py38
conda activate py38
然后在py38这个环境中下载labelImg即可
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple
然后在py38
环境下输入 labelImg
即可打开labelImg
打开如图界面:
labelImg的使用
比较常用的快捷键:
画框 W
下一张
⭐️labelImg标注数据集
Open Dir
我选择水果数据集进行标注
该数据集一共有五个标签。
为方便标注,选取了一部分各类别的水果至一个文件夹JPEGImages
中进行标注。
点击Change save Dir
我将标注的数据集存放在路径
标注好的数据集如下,为xml格式:
⭐️利用VOC制作自己的数据集
新建文件夹,并在新建的文件夹下新建Annotations
、ImageSets
、JPEImages
三个文件夹,在ImageSets下新建Main
文件夹。
将自己的数据集图片拷贝到JPEGImages目录下。
即:
将数据集label文件拷贝到Annotations目录下。
即:
在主文件夹下新建test.py
文件夹,输入以下代码进去运行,将生成四个文件:train.txt,val.txt,test.txt和trainval.txt。
import os
import random
trainval_percent = 0.8 #val即Validation(验证),即训练集和验证机占全体数据的比例
train_percent = 0.9 #训练集占训练集和验证集总体的比例
xmlfilepath = 'D:\\A_data\\fruits\VOC\\Annotations' #这里是我的绝对路径
txtsavepath = 'D:\\A_data\\fruits\\VOC\\ImageSets\Main' #我的绝对路径 如果使用需要修改
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent) # 训练集和验证集总个数
tr = int(tv * train_percent) # 训练集总个数
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
#需要生成以下四个文件,分别是test.txt,train.txt,trainval.txt,val.txt
#分别代表测试集、训练集、训练-验证集、验证集
ftrainval = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\trainval.txt', 'w')
ftest = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\test.txt', 'w')
ftrain = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\train.txt', 'w')
fval = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\val.txt', 'w')
for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
ftrainval.write(name)
if i in train:
ftest.write(name)
else:
fval.write(name)
else:
ftrain.write(name)
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()
运行结束后,我们可以查看txt文件,我们的数据集已经制作完成。
test数据集:
103
105
109
11
111
115
117
119
125
129
131
135
137
139
143
149
15
151
153
157
161
163
165
167
169
23
25
29
3
31
33
35
37
39
43
45
47
49
5
51
53
55
57
61
63
67
7
71
73
75
77
79
81
85
87
89
9
93
95
97
99
train数据集
:
101
107
113
121
123
133
141
147
155
159
17
19
21
41
59
65
83
91
训练验证集
:
1
103
105
109
11
111
115
117
119
125
127
129
13
131
135
137
139
143
145
149
15
151
153
157
161
163
165
167
169
171
23
25
27
29
3
31
33
35
37
39
43
45
47
49
5
51
53
55
57
61
63
67
69
7
71
73
75
77
79
81
85
87
89
9
93
95
97
99
验证集
:
1
127
13
145
171
27
69
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)