cover

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十）

旅途中的宽~

2327人浏览 · 2023-09-21 11:07:20

旅途中的宽~ · 2023-09-21 11:07:20 发布

文章目录

一、ImageNet-9

ImageNet-9 由具有不同数量的背景和前景信号的图像组成，您可以使用它们来测量模型对图像背景的依赖程度。该数据集有助于测试视觉模型对图像背景的依赖性的鲁棒性。

二、KaoKore

由从前现代日本艺术品中提取的面孔组成。

三、Malaria Dataset

该数据集总共包含 27,558 个细胞图像，其中寄生细胞和未感染细胞的实例相同。

四、Red MiniImageNet 20% label noise

受控噪声网络标签数据集的一部分。

五、SI-SCORE (Synthetic Interventions on Scenes for Robustness Evaluation)

综合数据集用于对常见变异因素进行系统分析。

六、Tencent ML-Images

腾讯ML-Images是一个大型开源多标签图像数据库，包含17,609,752个训练图像URL和88,739个验证图像URL，注释了多达11,166个类别。

在这里插入图片描述

七、Urban Environments

城市环境数据集是包含 300 个欧洲城市的 20 个土地利用类别的数据集，并配有卫星图像数据。

在这里插入图片描述

八、DF20 (Danish Fungi 2020)

丹麦真菌 2020 (DF20) 是一个细粒度的数据集和基准。该数据集是根据提交给丹麦真菌图集的观察结果构建的，其独特之处在于分类准确的类标签、少量错误、高度不平衡的长尾类分布、丰富的观察元数据和明确定义的类层次结构。 DF20 与 ImageNet 零重叠，允许对从公开可用的 ImageNet 检查点微调的模型进行无偏差比较。

该数据集有 1,604 个不同的类别，有 248,466 个训练图像和 27,608 个测试图像。

在这里插入图片描述

九、DiagSet

DiagSet 是用于前列腺癌检测的组织病理学数据集。拟议的数据集由超过 260 万个组织斑块组成，这些组织斑块是从 430 个完全注释的扫描、4675 个指定二元诊断的扫描以及由一组组织病理学家独立给出诊断的 46 个扫描中提取的。

在这里插入图片描述

十、Food-101N

Food-101N 数据集在“CleanNet: Transfer Learning for Scalable Image Training with Label Noise (CVPR’18)”中介绍。它是一个图像数据集，包含约 310,009 个食物食谱图像，分为 101 个类别（类别）。Food-101N 和 Food-101 数据集共享相同的 101 个类别，而 Food-101N 具有更多图像且噪声更大。

Food-101N 专为以下两个任务而设计：1）学习带有标签噪声的图像分类2）标签噪声检测

十一、Galaxy Zoo DECaLS

大约。 300,000 张按形状标记的星系图像。

标签来自 www.galaxyzoo.org 志愿者，而且很吵。图像来自 DECaLS 望远镜调查。还包括来自 EfficientNet 集合的预测，每个预测都使用 MC Dropout 和新颖的概率损失函数。

十二、Intel Image Classification

背景这是世界各地自然场景的图像数据。

内容该数据包含大约 25k 个大小为 150x150 的图像，分布在 6 个类别下。 {‘建筑物’ -> 0、‘森林’ -> 1、‘冰川’ -> 2、‘山’ -> 3、‘海’ -> 4、‘街道’ -> 5 }

训练、测试和预测数据在每个 zip 文件中分开。 Train 中有大约 14k 个图像，Test 中有 3k 个图像，Prediction 有 7k 个图像。该数据最初由英特尔发布在 https://datahack.analyticsvidhya.com 上，以举办图像分类挑战赛。

致谢感谢 https://datahack.analyticsvidhya.com 的挑战和英特尔的数据

照片由 Jan Böttinger 在 Unsplash 上拍摄

灵感想要建立强大的神经网络，可以更准确地对这些图像进行分类。

十三、Kuzushiji-Kanji

Kuzushiji-Kanji 是一个总共 3832 个汉字字符（64x64 灰度，140,426 个图像）的不平衡数据集，范围从 1,766 个示例到每个类只有一个示例。草书是一种日本草书书写风格。

在这里插入图片描述

十四、MNIST Large Scale dataset

MNIST 大规模数据集基于经典的 MNIST 数据集，但包含高达 16 倍的大规模变化。创建此数据集的动机是为了测试不同算法在存在大规模变化的情况下学习的能力，以及特别是泛化到大尺度范围内的训练集中不存在的新尺度的能力。

该数据集包含相对于原始 MNIST 数据集的相对大小因子 1、2 和 4 中每一个的训练数据以及 1/2 和 8 之间的相对缩放因子的测试数据。

在这里插入图片描述

十五、MuMiN

MuMiN 是一个错误信息图数据集，包含丰富的社交媒体数据（推文、回复、用户、图像、文章、主题标签），涵盖属于 26000 个 Twitter 线程的 2100 万条推文，每个线程在语义上都与 13000 个经过事实检查的声明相关联跨越数十个主题、事件和领域，以 41 种不同语言，跨越十多年。

MuMiN 通过多种方式填补了现有错误信息数据集的空白：

通过拥有大量社交媒体信息，这些信息在语义上与个人的事实核查声明相关联。
通过支持 41 种语言，可以评估多语言错误信息检测模型。
通过推文、文章、图像、社交关系和主题标签，实现错误信息检测的多模式方法。
MuMiN 具有两个节点分类任务，与声明的真实性相关：

声明分类：根据社交网络背景确定声明的准确性。
推文分类：根据社交网络背景，确定要进行事实核查的社交媒体帖子讨论误导性主张的可能性。

在这里插入图片描述

十六、SIPaKMeD (SIPaKMeD Pap Smear dataset)

数据集特征的高级解释
解释动机及其内容摘要
数据集的潜在用例

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

第二届开放原子大赛首批创新成果集结武汉，诚邀广大开发者共鉴开源技术盛宴

第二届开放原子大赛首批创新成果集结武汉，诚邀广大开发者共鉴开源技术盛宴

开放原子开发者工作坊

诚邀报名 | 开源基础设施能力建设分论坛：打造开源生态的“心脏”

诚邀报名 | 开源基础设施能力建设分论坛：打造开源生态的“心脏”

开放原子开发者工作坊

诚邀报名 | 编程语言分论坛：AI时代的技术革新与开源实践

诚邀报名 | 编程语言分论坛：AI时代的技术革新与开源实践

开放原子开发者工作坊

所有评论(0)

查看更多评论

旅途中的宽~

已为社区贡献36条内容