图像预处理-为CNN创建数据集

我在CNN上还很新,我需要建立一个管道来加载图像并为CNN做好准备。问题是我需要建立一个由图像组成的数据集。共有三类图像:COVID-19,健康的肺和肺炎。我拥有的文件是:

  • 1个文件夹,其中包含带有covid-19的肺部图像
  • 1个包含健康肺部图像的文件夹
  • 1个包含肺炎图像的文件夹
  • 1 .txt文件,其中包含将为其形成训练数据集的所有图像
  • 1 .txt文件,其中包含将为其形成验证数据集的所有图像
  • 1 .txt文件,其中包含将要形成文本数据集的所有图像

我一直在Internet上进行搜索,但没有找到建立由所有图像组成的数据集的方法,甚至没有找到如何将它们与.txt文件关联以及建立相关的训练,测试和验证数据集的方法。有什么建议吗?请在下面找到.txt文件的结构作为示例:

2   PNEUMONIA/person888_bacteria_2812.jpeg
2   PNEUMONIA/person1209_bacteria_3161.jpeg
2   PNEUMONIA/person1718_bacteria_4540.jpeg
2   PNEUMONIA/person549_bacteria_2303.jpeg
2   PNEUMONIA/person831_bacteria_2742.jpeg
2   PNEUMONIA/person1571_bacteria_4108.jpeg
2   PNEUMONIA/person1310_bacteria_3300.jpeg