Adversary_resistant_CV/Train.py at master · McClain-Thiel/Adversary_resistant_CV · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
from SE import SE_ResNet
import torch.optim
import torch.nn as nn
from Data import TinyImNet
from torch.utils.data import DataLoader
import pandas as pd
import numpy as np


NUM_EPOCHS = 100

params = { 'batch_size': 1,
           'shuffle': True,
           'num_workers': 6
            }

def calc_acc(outputs, labels):
    max_vals, max_indices = torch.max(outputs, 1)
    n = max_indices.size(0)  # index 0 for extracting the # of elements
    train_acc = (max_indices == labels).sum(dtype=torch.float32) / n
    return train_acc

def main():
    model = SE_ResNet(num_classes=200).get_model()
    opt = torch.optim.Adam(model.parameters(), lr = 0.001)
    crit = nn.CrossEntropyLoss()

    train_set = TinyImNet('tiny-imagenet-200/train', True, 'tiny-imagenet-200/train',)
    train_gen = DataLoader(train_set, **params)

    val_set = TinyImNet('tiny-imagenet-200/val', False, 'tiny-imagenet-200/train',)
    val_gen = DataLoader(val_set, **params)

    use_cuda = torch.cuda.is_available()
    device = torch.device("cuda:0" if use_cuda else "cpu")
    model = model.to(device)
    crit = crit.to(device)

    print("Don't compare val loss to train loss, they are on different scales.")
    train_acc_arr, val_acc_arr = [], []
    for epoch in range(NUM_EPOCHS):
        print(torch.cuda.memory_stats(device=device))
        curr_loss, val_loss = 0.0, 0.0
        for (X, y), (val_X, val_y) in zip(train_gen, val_gen):
            X, y = X.to(device), y.to(device)
            opt.zero_grad()

            print("Starting forward pass for epoch: ", epoch)
            outputs = model.forward(X)
            print("Starting backward pass for epoch: ", epoch)
            loss = crit(outputs, y)
            loss.backward()
            opt.step()

            val_X, val_y = val_X.to(device), val_y.to(device)

            val_output = model.forward(val_X)
            val_loss += crit(val_output, val_y)
            curr_loss += loss.item()
            torch.cuda.empty_cache()

        print("Loss for Epoch ", epoch, ': ', curr_loss)
        print("Val Loss for Epoch ", epoch, ': ', val_loss)

        with torch.no_grad():
            (X, y),  (val_X, val_y) = next(train_gen).to(device), next(val_gen).to(device)
            train_outputs, val_outputs = model.forward(X), model.forward(val_X)
            train_acc, val_acc = calc_acc(train_outputs, y), calc_acc(val_outputs, val_y)
            print("Epoch: ", epoch, " Train Accuracy: ", train_acc, " Test Accuracy: ", val_acc)
            train_acc_arr.append(train_acc)
            val_acc_arr.append(val_acc)


    data = {"epoch":np.arange(0,100),
            "train_acc": train_acc_arr,
            "val_acc": val_acc_arr}

    df = pd.DataFrame(data=data)
    df.to_csv('data.csv')

    torch.save(model.state_dict(), "model/resnet")

if __name__ == '__main__':
    main()