找回密码
 立即注册
查看: 420|回复: 0

[其它] 深度学习标注文件格式转换

[复制链接]

224

主题

0

回帖

773

积分

高级会员

积分
773
发表于 2024-7-4 12:54:03 | 显示全部楼层 |阅读模式
本帖最后由 御坂主机 于 2024-7-4 13:15 编辑

1. 引言
深度学习模型的训练需要大量的标注数据,而标注文件格式的多样性往往给数据处理带来了挑战。为了更高效地处理不同格式的标注文件,我们需要掌握格式转换的技巧。本文将介绍几种常见的深度学习标注文件格式,并演示如何进行格式转换。

1.1 常见标注文件格式
在深度学习领域,不同的任务和框架可能使用不同的标注文件格式。以下是几种常见的标注文件格式:
(1) COCO格式
(2) Pascal VOC格式
(3) YOLO格式

1.1.1 COCO格式
COCO (Common Objects in Context)格式是一种广泛使用的标注格式,主要用于目标检测任务。COCO格式的标注文件通常是一个JSON文件,包含图像信息、标注信息等。

1.1.2 Pascal VOC格式
Pascal VOC格式也是一种常见的标注格式,主要用于目标检测和图像分割任务。Pascal VOC格式的标注文件通常是一个XML文件,包含图像的路径、尺寸以及标注框的信息。

1.1.3 YOLO格式
YOLO (You Only Look Once)格式是一种高效的目标检测标注格式,标注文件通常是一个TXT文件,每行表示一个标注对象的信息,包括类别、中心坐标和宽高比等。

1.2 格式转换的必要性
不同的深度学习框架和任务可能要求不同的标注文件格式。为了在不同框架之间灵活切换,或者将数据集用于不同的任务,掌握标注文件格式转换的技能是非常必要的。

2. 标注文件格式转换
在本节中,我们将介绍如何在不同的标注文件格式之间进行转换。我们将以COCO格式和YOLO格式之间的转换为例进行演示。

2.1 COCO格式转换为YOLO格式
COCO格式转换为YOLO格式的过程涉及从COCO的JSON文件中提取标注信息,并将其转换为YOLO格式的TXT文件。

读取COCO格式的JSON文件,解析图像和标注信息

  1. json_file = 'path/to/coco/annotations.json'
  2. with open(json_file, 'r') as f:
  3.     coco_data = json.load(f)
复制代码


创建一个字典,用于存储每个图像的标注信息

  1. image_annotations = {}
  2. for annotation in coco_data['annotations']:
  3.     image_id = annotation['image_id']
  4.     if image_id not in image_annotations:
  5.         image_annotations[image_id] = []
  6.     image_annotations[image_id].append(annotation)
复制代码


将COCO格式的标注信息转换为YOLO格式

  1. for image_info in coco_data['images']:
  2.     image_id = image_info['id']
  3.     file_name = image_info['file_name']
  4.     width = image_info['width']
  5.     height = image_info['height']

  6.     if image_id in image_annotations:
  7.         yolo_annotations = []
  8.         for annotation in image_annotations[image_id]:
  9.             category_id = annotation['category_id'] - 1
  10.             bbox = annotation['bbox']
  11.             x_center = (bbox[0] + bbox[2] / 2) / width
  12.             y_center = (bbox[1] + bbox[3] / 2) / height
  13.             w = bbox[2] / width
  14.             h = bbox[3] / height
  15.             yolo_annotations.append(f'{category_id} {x_center} {y_center} {w} {h}')

  16.         with open(f'path/to/yolo/labels/{file_name.split(".")[0]}.txt', 'w') as f:
  17.             f.write('\n'.join(yolo_annotations))
复制代码


2.2 YOLO格式转换为COCO格式
YOLO格式转换为COCO格式的过程涉及读取YOLO的TXT文件,解析标注信息,并将其转换为COCO格式的JSON文件。

读取YOLO格式的TXT文件,解析标注信息

  1. yolo_files = glob.glob('path/to/yolo/labels/*.txt')
  2. coco_annotations = []
  3. for yolo_file in yolo_files:
  4.     with open(yolo_file, 'r') as f:
  5.         lines = f.readlines()
  6.     image_id = int(yolo_file.split('/')[-1].split('.')[0])
  7.     for line in lines:
  8.         category_id, x_center, y_center, w, h = map(float, line.split())
  9.         bbox = [
  10.             (x_center - w / 2) * width,
  11.             (y_center - h / 2) * height,
  12.             w * width,
  13.             h * height
  14.         ]
  15.         annotation = {
  16.             'image_id': image_id,
  17.             'category_id': int(category_id) + 1,
  18.             'bbox': bbox,
  19.             'area': bbox[2] * bbox[3],
  20.             'iscrowd': 0
  21.         }
  22.         coco_annotations.append(annotation)
复制代码

将YOLO格式的标注信息转换为COCO格式的JSON文件

  1. coco_data = {
  2.     'images': [],
  3.     'annotations': coco_annotations,
  4.     'categories': [{'id': i, 'name': name} for i, name in enumerate(category_names, 1)]
  5. }
  6. with open('path/to/coco/annotations.json', 'w') as f:
  7.     json.dump(coco_data, f)
复制代码


3. 结论
标注文件格式转换是深度学习数据处理中的重要环节。掌握不同格式之间的转换方法,可以提高数据处理的效率,增强数据集的适用性。希望本文的介绍和示例代码能对你有所帮助。





------------------------------------------------------------------------------------------------------------------------------------------

========  御 坂 主 机  ========

>> VPS主机 服务器 前沿资讯 行业发布 技术杂谈 <<

>> 推广/合作/找我玩  TG号 : @Misaka_Offical <<

-------------------------------------------------------------------------------------------------------------------------------------------

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系站长|Archiver|手机版|小黑屋|主机论坛

GMT+8, 2025-4-4 13:53 , Processed in 0.060825 second(s), 24 queries .

Powered by 主机论坛 HostSsss.Com

HostSsss.Com

快速回复 返回顶部 返回列表