pytorch数据读入

news/2024/10/3 22:25:44 标签: pytorch, 人工智能, python

在机器学习和深度学习中,数据读入是一个非常重要的步骤。PyTorch提供了非常灵活的数据读取方式,主要是通过DatasetDataLoader两个类来完成的。

一、PyTorch常见的数据读取方式

PyTorch中的数据读取主要依赖于两个核心类:DatasetDataLoader

  1. Dataset: 定义数据集的格式和数据变换形式。
  2. DataLoader: 将数据集按批次读入,并且可以进行多进程数据加载。
1.1 Dataset

Dataset类是一个抽象类,我们通常需要继承它并实现以下三个方法:

  • __init__: 初始化函数,用于传入外部参数,如数据集的路径、数据变换等。
  • __getitem__: 用于逐个读取样本数据,可以进行一定的数据变换,并返回训练所需的数据和标签。
  • __len__: 返回数据集的样本总数。
1.2 DataLoader

DataLoader类用于按批次读入数据。它提供了许多参数来控制数据的读取方式,如batch_sizenum_workersshuffle等。

二、构建自己的数据读取流程

为了更好地理解这些概念,我们可以通过一个具体的例子来展示如何构建自己的数据读取流程。

2.1 使用PyTorch自带的ImageFolder

PyTorch提供了一个方便的ImageFolder类,用于读取按一定结构存储的图片数据。我们可以直接使用这个类来读取数据集。

python">import torch
from torchvision import datasets

# 假设train_path和val_path是数据集的路径
train_data = datasets.ImageFolder(train_path, transform=data_transform)
val_data = datasets.ImageFolder(val_path, transform=data_transform)

这里的data_transform可以对图像进行一定的变换,如翻转、裁剪等操作。你可以在transform模块中定义自己的变换。

2.2例子

假设你有一个图像数据集,用于训练一个猫狗分类模型。你的数据集结构如下:

python">dataset/
    train/
        cats/
            cat1.jpg
            cat2.jpg
            cat3.jpg
        dogs/
            dog1.jpg
            dog2.jpg
            dog3.jpg
    val/
        cats/
            val_cat1.jpg
            val_cat2.jpg
        dogs/
            val_dog1.jpg
            val_dog2.jpg

在这个数据集中:

  • train文件夹包含训练数据,其中有两个子文件夹catsdogs,分别存放猫和狗的图片。
  • val文件夹包含验证数据,同样有两个子文件夹catsdogs

具体代码示例

接下来我们写一段Python代码来使用ImageFolder类加载这个数据集。

python">import torch
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 步骤1: 定义数据变换
data_transform = transforms.Compose([
    transforms.Resize((256, 256)),  # 调整图像大小为256x256
    transforms.RandomHorizontalFlip(),  # 进行随机水平翻转
    transforms.ToTensor(),  # 将图像转换为张量格式
])

# 步骤2: 定义数据集路径
train_path = 'dataset/train'  # 训练集路径
val_path = 'dataset/val'      # 验证集路径

# 步骤3: 使用ImageFolder加载数据集
train_data = datasets.ImageFolder(train_path, transform=data_transform)
val_data = datasets.ImageFolder(val_path, transform=data_transform)

# 步骤4: 创建DataLoader以便批量加载数据
train_loader = DataLoader(train_data, batch_size=32, shuffle=True)
val_loader = DataLoader(val_data, batch_size=32, shuffle=False)

# 步骤5: 访问一个批次的数据
for images, labels in train_loader:
    print(f'Batch of images shape: {images.shape}')  # 打印图片的batch尺寸
    print(f'Batch of labels shape: {labels.shape}')   # 打印标签的batch尺寸
    break  # 只输出一批数据,便于查看

代码详解

  1. 导入必要的库

    python">import torch
    from torchvision import datasets, transforms
    from torch.utils.data import DataLoader
    
    • 导入PyTorch和必要的模块。
  2. 定义数据变换

    python">data_transform = transforms.Compose([
        transforms.Resize((256, 256)),  # 将图像大小调整为256x256
        transforms.RandomHorizontalFlip(),  # 随机水平翻转
        transforms.ToTensor(),  # 将图像转换为张量格式
    ])
    
    • 在这里,定义了对每张图像的处理,首先将其调整为256x256像素,然后进行随机翻转,最后将图像转换为PyTorch可以理解的张量格式。
  3. 定义数据集路径

    python">train_path = 'dataset/train'  # 训练集路径
    val_path = 'dataset/val'      # 验证集路径
    
    • 定义你的训练集和验证集的文件夹路径。
  4. 加载数据集

    python">train_data = datasets.ImageFolder(train_path, transform=data_transform)
    val_data = datasets.ImageFolder(val_path, transform=data_transform)
    
    • 使用ImageFolder加载训练集和验证集。
    • ImageFolder自动根据文件夹名称生成标签:cats会被标记为类别0,dogs会被标记为类别1。
  5. 创建DataLoader

    python">train_loader = DataLoader(train_data, batch_size=32, shuffle=True)
    val_loader = DataLoader(val_data, batch_size=32, shuffle=False)
    
    • DataLoader用于将数据集分批次加载。这里定义了每批次包含32个图像。
    • shuffle=True表示在每个epoch开始时打乱数据顺序,通常在训练过程中使用。
  6. 访问数据

    python">for images, labels in train_loader:
        print(f'Batch of images shape: {images.shape}')  # 打印图片的batch尺寸
        print(f'Batch of labels shape: {labels.shape}')   # 打印标签的batch尺寸
        break  # 只输出一批数据,便于查看
    
    • 最后,遍历train_loader中的一批次数据,输出图像和标签的维度信息。
    • images.shape将在(batch_size, channels, height, width)的格式下输出图像的尺寸。
    • labels.shape输出的会是一个一维张量,表示每张图像的分类标签。


http://www.niftyadmin.cn/n/5689047.html

相关文章

【HTML+CSS】仿电子美学打造响应式留言板

创建一个响应式的留言板 在这篇文章中,我们将学习如何创建一个简单而美观的留言板,它将包括基本的样式和动画效果,以及响应式设计,确保在不同设备上都能良好显示。 HTML 结构 首先,我们创建基本的HTML结构。留言板由…

C++ WebDriver扩展

概述 WebDriver协议基于HTTP,使用JSON进行数据传输,定义了client与driver之间的通信标准。无论client的实现语言(如Java或C#),都能通过协议中的endpoints准确指示driver执行各种操作,覆盖了Selenium的所有功…

Service层瘦身思考

背景 传统的MVC架构中,业务逻辑一般在service层实现,但随着业务的发展,service层也在不断充斥、嵌入各种业务逻辑代码,导致service层代码过于臃肿、庞大,不利于代码的维护和业务的后续迭代发展。此时我们需要对servic…

k8s-pod的管理及优化设置

Pod是Kubernetes(k8s)中最小的资源管理组件,也是最小化运行容器化应用的资源对象。以下是对Pod的详细介绍: 一、Pod的基本概念 定义:Pod是Kubernetes中可以创建和管理的最小单元,是资源对象模型中由用户创…

滚雪球学Oracle[2.5讲]:数据库初始化配置

全文目录: 前言一、配置文件的高级参数设置1.1 open_cursors:游标打开数量限制案例演示 1.2 session_cached_cursors:会话缓存游标数量案例演示 1.3 pga_aggregate_target与sga_target:内存分配优化案例演示 二、内存管理模式的选…

每日一练:杨辉三角

118. 杨辉三角 - 力扣(LeetCode) 题目要求: 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 示例 1: 输入: numRows 5 输出: [[1],[1,1],[1,…

Qt 中的 QChartView

深入理解 Qt 的 QChartView:图表展示与交互 QChartView 是 Qt Charts 模块中的一个核心类,它用于在 Qt 应用程序中显示图表,并支持多种用户交互方式。它继承自 QGraphicsView,通过封装 QChart,为用户提供了强大的图表…

【Linux】进程管理:状态与优先级调度的深度分析

✨ 山海自有归期,风雨自有相逢 🌏 📃个人主页:island1314 🔥个人专栏:Linux—登神长阶 ⛺️ 欢迎关注:👍点赞 &#x1…