PyTorch实用技巧：冻结模型参数并验证状态

摘要：🔥在PyTorch实战中，冻结模型参数并验证其状态是提升训练效率的关键。🚀通过调整requires_grad属性，我们可以轻松冻结模型中的特定层，使其在训练过程中保持不变。🌈为了确认参数状态，我们需要仔细检查named_parameters()的输出。🎉在实战案例中，我们将展示如何冻结预训练模型的部分层，并微调剩余部分，以加速收敛并保护重要特征。#PyTorch #模型参数冻结 #验

迎南而上

2965人浏览 · 2023-04-03 14:02:31

迎南而上 · 2023-04-03 14:02:31 发布

PyTorch实用技巧：冻结模型参数并验证状态

在这里插入图片描述

🌈 个人主页：高斯小哥
🔥 高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 👈 希望得到您的订阅和支持~
💡 创作高质量博文，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）

一、引言 🔥

在深度学习中，模型训练经常需要耗费大量的时间和计算资源。有时，为了加速训练过程或者保护某些重要层的参数不被更新，我们需要冻结模型的部分或全部参数。PyTorch提供了非常方便的方式来冻结和解冻模型参数。本文将详细介绍如何在PyTorch中冻结模型参数，并验证参数的状态。

二、冻结模型参数🚀

要冻结模型参数，我们可以使用requires_grad属性。requires_grad是一个布尔值，当它为True时，表示该参数在训练过程中需要计算梯度；当它为False时，表示该参数不需要计算梯度，即参数被冻结。

下面是一个简单的示例，展示如何冻结模型中的某个层：

import torch
import torch.nn as nn

# 定义一个简单的模型
model = nn.Sequential(
    nn.Linear(10, 20),
    nn.ReLU(),
    nn.Linear(20, 1)
)

# 冻结第一个线性层
for param in model[0].parameters():
    param.requires_grad = False

# 验证参数状态
for name, param in model.named_parameters():
    print(f"{name}: {param.requires_grad}")

输出：

0.weight: False
0.bias: False
2.weight: True
2.bias: True

进程已结束,退出代码0

从输出中可以看出，第一个线性层的权重和偏置参数的requires_grad属性都被设置为了False，表示这些参数被冻结了。

三、验证参数状态 🌈

在冻结参数后，我们还需要验证参数的状态，确保它们真的被冻结了。这可以通过检查requires_grad属性来实现。

下面是一个示例，展示如何验证参数状态：

# 验证参数状态
for name, param in model.named_parameters():
    if param.requires_grad:
        print(f"{name} 的参数正在被训练")
    else:
        print(f"{name} 的参数已被冻结")

输出：

0.weight 的参数已被冻结
0.bias 的参数已被冻结
2.weight 的参数正在被训练
2.bias 的参数正在被训练

进程已结束,退出代码0

从输出中可以看出，第一个线性层的权重和偏置参数的状态都被标记为“已被冻结”，而其他层的参数仍在训练中。

四、实战案例 🎉

现在，让我们通过一个实战案例来加深对冻结模型参数的理解。假设我们有一个预训练的模型，我们想在某个任务上微调它，但是希望保留某些层的参数不变。

首先，加载预训练模型：

# 加载预训练模型
pretrained_model = torch.load('pretrained_model.pth')

然后，我们只想微调最后一个线性层，而其他层保持不变。因此，我们需要冻结除最后一个线性层以外的所有参数：

# 冻结除最后一个线性层以外的所有参数
for name, param in pretrained_model.named_parameters():
    if 'linear2' not in name:  # 根据名称判断是否为需要冻结的层
        param.requires_grad = False

接下来，我们可以对模型进行微调：

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(pretrained_model.parameters(), lr=0.001)

# 加载数据集并进行训练
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True)
for epoch in range(num_epochs):
    for inputs, targets in train_loader:
        optimizer.zero_grad()
        outputs = pretrained_model(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step()

在训练过程中，只有最后一个线性层的参数会被更新，而其他层的参数保持不变。

五、总结 🎯

通过本文的介绍，你应该已经掌握了如何在PyTorch中冻结模型参数并验证参数状态。冻结模型参数是一种有效的优化手段，可以帮助我们加速训练过程或保护重要层的参数不被更新。在实际应用中，你可以根据具体需求灵活地冻结和解冻模型参数。同时，也请注意，在冻结参数后，确保在训练过程中不会意外地修改这些参数。

六、最后 🤝

亲爱的读者，感谢您每一次停留和阅读，这是对我们最大的支持和鼓励！🙏在茫茫网海中，您的关注让我们深感荣幸。您的独到见解和建议，如明灯照亮我们前行的道路。🌟若在阅读中有所收获，一个赞或收藏，对我们意义重大。

我们承诺，会不断自我挑战，为您呈现更精彩的内容。📚有任何疑问或建议，欢迎在评论区畅所欲言，我们时刻倾听。💬让我们携手在知识的海洋中航行，共同成长，共创辉煌！🌱🌳感谢您的厚爱与支持，期待与您共同书写精彩篇章！

您的点赞👍、收藏🌟、评论💬和关注💖，是我们前行的最大动力！

🎉 感谢阅读，祝你编程愉快！ 🎉

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

“小满”安全车控操作系统正式在AtomGit开源

10月24日，由中国汽车工业协会指导，普华基础软件股份有限公司主办的“小满”安全车控操作系统开源发布会暨共建计划说明会成功举行。普华基础软件宣布将安全车控操作系统“小满”（简称“小满”）V24.10源代码正式在开放原子开源基金会（简称“基金会”）旗下AtomGit开源协作平台开源，并在AtomGit平