【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（九）

旅途中的宽~

3351人浏览 · 2023-09-21 10:54:57

旅途中的宽~ · 2023-09-21 10:54:57 发布

文章目录

一、BreakHis (Breast Cancer Histopathological Database)

乳腺癌组织病理学图像分类 (BreakHis) 由使用不同放大倍数（40 倍、100 倍、200 倍和 400 倍）从 82 名患者收集的 9,109 张乳腺肿瘤组织显微图像组成。它包含 2,480 个良性样本和 5,429 个恶性样本（700X460 像素，3 通道 RGB，每个通道 8 位深度，PNG 格式）。该数据库是与巴西巴拉那州 P&D 病理解剖学和细胞病理学实验室合作建立的。

在这里插入图片描述

二、Chaoyang

Chaoyang数据集包含1111个正常样本、842个锯齿状样本、1404个腺癌样本、664个腺瘤样本，以及705个正常样本、321个锯齿状样本、840个腺癌样本、273个腺瘤样本分别用于训练和测试。这个嘈杂的数据集是在真实场景中构建的。

详情：来自朝阳医院的结肠切片，补片尺寸为512×512。我们邀请了3位专业病理学家分别对补片进行标记。我们将3位病理学家一致结果的标记补丁部分作为测试集。其他我们用作训练集。对于训练集中三位医生标注意见不一致的样本（这部分约占40%），我们随机选取三位医生其中一位的意见。

原始 WSI 以 20 倍物镜放大倍数进行扫描。

在这里插入图片描述

三、Colored-MNIST(with spurious correlation)

这是一个具有虚假相关性的数据集，可用于评估分布外泛化、因果推理和相关领域的机器学习方法。

四、F-CelebA (10 tasks) (Federated-CelebA (10 tasks))

F-CelebA - 该数据集改编自联邦学习。联邦学习是一种新兴的机器学习范式，强调数据隐私。这个想法是通过模型聚合而不是传统的数据聚合进行训练，并将本地数据保留在本地设备上。该数据集自然由类似的任务组成，这 10 个任务中的每一个都包含名人的图像，并根据他/她是否微笑进行标记。更详细请查看页面https://github.com/ZixuanKe/CAT

五、Grocery Store

杂货店是杂货自然图像的数据集。所有自然图像都是用智能手机相机在不同的杂货店拍摄的。它包含来自 81 种不同类别的水果、蔬菜和纸盒物品（例如果汁、牛奶、酸奶）的 5,125 张自然图像。这 81 个类别分为 42 个粗粒度类别，例如细粒度类“Royal Gala”和“Granny Smith”属于同一个粗粒度类“Apple”。此外，每个细粒度类别都有关联的标志性图像和该项目的产品描述。

在这里插入图片描述

六、Kannada-MNIST

Kannada-MNIST 数据集是卡纳达语言标准 MNIST 数据集的直接替代品。

在这里插入图片描述

七、MLRSNet

MLRSNet 是一个用于语义场景理解的多标签高空间分辨率遥感数据集。它提供了从卫星捕捉到的世界的不同视角。即，它由高空间分辨率的光学卫星图像组成。 MLRSNet包含109,161张遥感图像，标注为46个类别，每个类别的样本图像数量从1,500到3,000不等。图像的固定尺寸为 256×256 像素，具有各种像素分辨率（~10m 到 0.1m）。此外，数据集中的每个图像都标有 60 个预定义类标签中的几个，与每个图像关联的标签数量从 1 到 13 不等。该数据集可用于基于多标签的图像分类、基于多标签的图像检索和图像分割。

在这里插入图片描述

八、PS-Battles

PS-Battles 数据集来自大量图像处理爱好者社区，为视觉领域的媒体推导和处理检测提供了基础。该数据集由 102’028 个图像组成，分为 11’142 个子集，每个子集包含原始图像以及不同数量的操纵导数。

在这里插入图片描述

九、PlantDoc

PlantDoc 是用于视觉植物病害检测的数据集。该数据集包含 13 种植物和多达 17 类疾病的 2,598 个数据点，涉及约 300 个小时的工作时间来注释互联网抓取的图像。

十、iCartoonFace

iCartoonFace 数据集是一个大规模数据集，可用于两个不同的任务：卡通人脸检测和卡通人脸识别。

在这里插入图片描述

十一、AIDER

数据集旨在对无人机上的灾难事件进行自动空中场景分类。

十二、Bamboo

Bamboo 数据集是一个超大规模、信息密集的数据集，用于分类和检测预训练。它建立在集成 24 个公共数据集（例如 ImagenNet、Places365、Object365、OpenImages）的基础上，并通过主动学习添加了新的注释。 Bamboo 拥有 69M 个图像分类注释和 32M 个对象边界框。

在这里插入图片描述

十三、Food2K

Food2K 是一个大型食品识别数据集，包含 2,000 个类别和超过 100 万张图像。与现有的食物识别数据集相比，Food2K 在类别和图像方面都绕过了它们一个数量级，从而为开发食物视觉表示学习的高级模型建立了一个新的具有挑战性的基准。可以进一步探索 Food2K，以使更多与食品相关的任务受益，包括新兴的和更复杂的任务（例如，对食物的营养理解），并且 Food2K 上经过训练的模型有望成为提高更多与食品相关的任务性能的支柱。

在这里插入图片描述