validation

荒流2019/10/16大约 1 分钟约 308 字

增加验证集。

打乱训练数据的顺序通常是避免不同批数据的相关性和模型过拟合的重要步骤。然而，对于验证集，无论是否打乱其顺序计算出的验证集损失都是一样的，且打乱顺序还会消耗额外的时间，我们没有必要shuffle the validation data.

由于验证集不需要进行反向传播，因而它不需要储存梯度而将占用较小的内存，故我们可以将在验证集上用到的每批数据的数量是训练集的两倍。

train_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True)

valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=bs * 2)

我们将在每轮（epoch）结束后计算并输出验证集上的损失值：

注意：在训练前我们总是会调用model.train()函数，在推断前调用model.eval()函数，这是因为这些会被层nn.BatchNorm2d, nn.Dropout等使用以确保在不同阶段的适当行为。

model, opt = get_model()
for epoch in range(epochs):
    model.train()
    for xb, yb in train_dl:
        pred = model(xb)
        loss = loss_func(pred, yb)

        loss.backward()
        opt.step()
        opt.zero_grad()

    model.eval()
    with torch.no_grad():
        valid_loss = sum(loss_func(model(xb), yb) for xb, yb in valid_dl)
print(epoch, valid_loss / len(valid_dl))
# 0 tensor(0.3204)
# 1 tensor(0.2949)

更新日志

2024/4/2 13:51

查看所有更新日志

47fa5-根据OneNote记录，设置相关笔记的创建日期于 2024/4/2
c9215-给所有markdown文件塞入vuepress要求的frontmatter于 2024/2/20
75141-docsify代码使用webpack改造，并放置_app目录于 2024/1/8
730b3-笔记移至notebook子目录于 2024/1/7
069cd-add python/pytorch于 2022/1/22

validation

更新日志

详情