常用眼底图像数据集简介及下载--糖尿病视网膜病变(Eyepacs,APTOS2019,Messdior,Messdior-2,STARE数据集)
常用眼底图像数据集简介及下载--糖尿病视网膜病变(Eyepacs,APTOS2019,Messdior,Messdior-2,STARE数据集)
文章目录
一、糖尿病视网膜病变图像介绍
1.微动脉瘤通常出现在病变早期,它是由于眼部毛细血管缺氧导致血管壁变薄,从而在视网膜上呈现出深红色的点状物
2.出血点一般出现在血管附近,它是由于血管阻塞导致血液渗出形成的,呈现暗斑状
3.软性和硬性渗出物的形成代表病变已经到了相对严重的程度,当血管长时间血液供应不良会导致末端毛细血管坏死,这部分坏死的血管就会在视网膜上呈现出大规模亮点状物或者絮状物
4.当眼球长时间处于缺氧状态时,眼球会增生新的血管来获取氧气和血液,增生血管的过程导致患者失明的可能性极大
二、常见糖尿病视网膜病变数据集介绍
1.EyePACS 数据集
如上图所示,eyepacs数据集共包含35129张图像,数据集由印度的Aravind眼科医院技术人员前往医疗资源贫乏的农村地区拍摄,然后依靠经验丰富的眼科医生检查图像并进行分类标注。从433 X 289像素到5184 X 3456像素不等在此数据集中,一些图像包含瑕疵、失焦、曝光不足或曝光过度。
对于分类不均衡问题,可采用数据扩充的方式来均衡样本数。
2.APTOS2019
该数据集由3662张训练图像和1928张测试图像组成,也只有分级标签。分级数为0-4共五级,该数据集还存在图像和标签中的噪声。
3.Messdior
Messidor是由法国国防研究部在 2004 年资助研究的 TECHNO-VISION 项目中建立的, 也是目前公开的最大的眼底图数据库, 共 1200 幅眼底图, 来自于 3 个不同的眼科机构. 其中图像分辨率分别为 1440×960, 2240×1488 和 2304×1536, TIFF 格式; 它给出了对应糖尿病视网膜病变分期和黄斑性水肿症状, 同时给出了专家手动标定的视盘, 也是常用的眼底图像库。
Messidor:这包含1200张眼底图像,但其DR分级标准与之前的数据集不同,只有四个级别(0到3)。除了DR分级外,还为每个分级标签为0到2的图像提供了黄斑水肿的风险
4.Messdior-2
该数据集共包含约1700张眼底图像,共有0-4五个级别,由专业眼科医生对其分类,该数据集质量直接用于病变分级。
5.STARE
STARE(视网膜结构分析)项目是由加州大学圣地亚哥分校的医学博士迈克尔·戈德鲍姆于1975年构想并发起的。该研究由美国国立卫生研究院资助。在它的历史上,超过30人为这个项目做出了贡献,他们的背景从医学到科学到工程。图像和临床数据由加州大学圣地亚哥分校的希利眼科中心和圣地亚哥退伍军人管理局医学中心提供。该数据集也可用于血管分割。
根据给出的csv标签文件来进行分类操作
import os
import shutil
import pandas as pd
import random
# 打开表格文件并读取
f = open("E:train1/trainLabels.csv", "rb") # 打开csv文件
list = pd.read_csv(f) # 这句不能少
# print(list)
# 创建文件夹
for i in range(3): # "6"指的是0-5总共6个类别
if not os.path.exists('E:/train1/' + str(i)): # 最后一个 / 不要漏
os.mkdir('E:/train1/' + str(i))
# 进行分类
for i in range(3):
listnew = list[list["level"] == i] # 对应csv文件标签 那一栏的标题
l = listnew["image"].tolist() # 对应csv文件图片那一栏的标题
j = str(i)
for each in l:
shutil.move('E:/train1/train/' + each +'.jpeg', 'E:/train1/' + j)
print("完成")
下图是根据数据标签分类时,文件存放位置:
数据集下载方式
数据集下载可以
下方推广公众号
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)