EEC/multiple_auto_decay.py at main · aliayub7/EEC

History

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

import numpy as np

import sys

import os

import time

import pickle

from PIL import Image

from copy import deepcopy

import random

from sklearn.model_selection import train_test_split

import json

#from multiprocessing import Pool as cpu_pool

import torch

import torch.nn as nn

import torch.optim as optim

import torchvision

import torchvision.transforms as transforms

from models.resnet import resnet18

from models.resnet import resnet34

import torch.nn.functional as F

from get_incremental_data import getIncrementalData

from get_transformed_data_with_decay import getTransformedData

from get_previous_data import getPreviousData

#from get_transformed_data import getTransformedData

from my_models.new_shallow import auto_shallow

from training_functions import train_reconstruction

from training_functions import eval_reconstruction

from training_functions import get_embeddings

from training_functions import get_pseudoimages

from training_functions import train

from training_functions import eval_training

from training_functions import train_with_decay

from training_functions import eval_training_with_decay

from get_centroids import getCentroids

from Functions_new import get_pseudoSamples

from label_smoothing import LSR

#seed = random.randint(0,1000)

seed = 7

np.random.seed(seed)

torch.manual_seed(seed)

random.seed(seed)

if __name__ == '__main__':

dataset_name = 'imagenet'

features_name = 'multiple_65000'

save_data = False

use_saved_images = True

path_to_previous = '/home/ali/Ali_Work/clean_autoencoder_based/Imagenet-50/previous_classes'

validation_based = False

if dataset_name == 'imagenet':

path_to_train = '/media/ali/860 Evo/ali/ILSVRC2012_Train'

path_to_test = '/media/ali/860 Evo/ali/ILSVRC2012_Test'

# incremental steps info

total_classes = 10

full_classes = 1000

limiter = 50

# Image transformation mean and std

imagenet_mean = [0.485, 0.456, 0.406]

imagenet_std = [0.229, 0.224, 0.225]

# hyperparameters

weight_decay = 5e-4

classify_lr = 0.1

reconstruction_lr = 0.001

reconstruction_epochs = 100

classification_epochs = 70

batch_size = 64

sample_decay_coeff = 0.05

decay_type = 'exponential'

# for centroids

distance_threshold = 5000

get_covariances = True

diag_covariances = True

clustering_type = 'k_means'

centroids_limit = 10000

centroid_finder = getCentroids(None,None,total_classes,seed=seed,get_covariances=get_covariances,diag_covariances=diag_covariances,centroids_limit=centroids_limit)

# autoencoders_set

auto_1 = auto_shallow(total_classes,seed=seed)

auto_2 = auto_shallow(total_classes,seed=seed)

auto_3 = auto_shallow(total_classes,seed=seed)

auto_4 = auto_shallow(total_classes,seed=seed)

auto_5 = auto_shallow(total_classes,seed=seed)

auto_1 = auto_1.cuda()

auto_2 = auto_2.cuda()

auto_3 = auto_3.cuda()

auto_4 = auto_4.cuda()

auto_5 = auto_5.cuda()

autoencoder_set = [auto_1,auto_2,auto_3,auto_4,auto_5]

#classifier

classify_net = resnet18(total_classes)

#classify_net = resnet18(limiter)

# loss functions and optimizers

#loss_classify = nn.CrossEntropyLoss()

loss_classify = LSR(reduction='none')

loss_rec = nn.MSELoss()

# Variable to generate incremental data

incremental_data_creator = getIncrementalData(path_to_train,path_to_test,full_classes=full_classes,seed=seed)

incremental_data_creator.incremental_data(total_classes=total_classes,limiter=limiter)

# define transforms

transforms_classification_train = transforms.Compose([

transforms.ToPILImage(),

transforms.Resize(32),

transforms.RandomCrop(32, padding=4),

transforms.RandomHorizontalFlip(),

transforms.RandomRotation(15),

transforms.ToTensor(),

transforms.Normalize(imagenet_mean,imagenet_std)

])

transforms_classification_test = transforms.Compose([

transforms.ToPILImage(),

transforms.Resize(32),

transforms.CenterCrop(32),

transforms.ToTensor(),

transforms.Normalize(imagenet_mean,imagenet_std)

])

transforms_reconstruction = transforms.Compose([

transforms.ToPILImage(),

transforms.Resize(32),

transforms.CenterCrop(32),

transforms.ToTensor(),

transforms.Normalize(imagenet_mean,imagenet_std)

])

################################# INCREMENTAL LEARNING PHASE ##################################

complete_x_train = []

complete_y_train = []

complete_x_test = []

complete_y_test = []

complete_centroids = []

complete_covariances = []

complete_centroids_num = []

ages = []

training_accuracies = []

Accus = []

full_classes = limiter

for increment in range(0,int(full_classes/total_classes)):

print ('This is increment number: ',increment)

# get data for the current increment

train_images_increment,train_labels_increment,test_images_increment,test_labels_increment = incremental_data_creator.incremental_data_per_increment(increment)

if increment==0:

previous_images = deepcopy(train_images_increment)

previous_labels = deepcopy(train_labels_increment)

current_increment_ages = [1.0 for x in range(len(train_labels_increment))]

else:

previous_images = []

previous_labels = []

most_recent_images = []

most_recent_labels = []

if use_saved_images:

starter = len(complete_centroids)-total_classes

else:

starter = 0+(increment-1)*total_classes

for i in range(starter,len(complete_centroids)):

temp = complete_centroids[i] # feature vectors for class i

previous_labels.extend([i for x in range(0,len(complete_centroids[i]))]) # labels for class i

if i>=(len(complete_centroids)-total_classes):

most_recent_labels.extend([i for x in range(0,len(complete_centroids[i]))])

# converting to Torch format

temp = np.array(temp)

temp = torch.from_numpy(temp)

temp = temp.float()

# convert feature vectors to images by passing them through the decoder

temp_images,_ = get_pseudoimages(autoencoder_set[increment-1],temp,class_number=i,seed=seed)

temp_images = list(temp_images)

if i>=(len(complete_centroids)-total_classes):

most_recent_images.extend(temp_images)

# update the overall images variable for the previous classes

if use_saved_images == False:

previous_images.extend(temp_images)

if use_saved_images:

# For loading previous class' reconstructed images

previous_data_creator = getPreviousData(path_to_previous,total_classes=total_classes+(increment-1)*total_classes,seed=seed)

previous_images,previous_labels = previous_data_creator.previous_data()

# Finding sample decay

previous_dataset = getTransformedData(most_recent_images,most_recent_labels,transform=transforms_classification_train,seed=seed)

previous_loader = torch.utils.data.DataLoader(previous_dataset,batch_size = batch_size,

shuffle=True, num_workers = 4)

new_accuracy = eval_training_with_decay(classify_net,previous_loader,loss_classify,seed)

new_accuracy = new_accuracy.cpu().numpy().tolist()

sample_decay_coeff = 1 - (new_accuracy/training_accuracies[increment-1])

#new_ages = [np.exp(-sample_decay_coeff*1.0) for x in range(0,len(most_recent_images))]

new_ages = [np.exp(-sample_decay_coeff*0.0) for x in range(0,len(most_recent_images))] # for no decay

ages.extend(new_ages)

current_increment_ages = deepcopy(ages)

current_increment_ages.extend([1.0 for x in range(len(train_labels_increment))])

print ('previous images',np.array(previous_images).shape)

print ('previous labels',np.array(previous_labels).shape)

# append images of the new classes

previous_images.extend(train_images_increment)

previous_labels.extend(train_labels_increment)

print ('total train images',np.array(previous_images).shape)

print ('total train labels',np.array(previous_labels).shape)

# complete x test update with new classes' test images

complete_x_test.extend(test_images_increment)

complete_y_test.extend(test_labels_increment)

if validation_based:

# Creating a validation split

x_train,x_test,y_train,y_test = train_test_split(previous_images,previous_labels,test_size=0.2,stratify=previous_labels)

else:

# otherwise just rename variables

x_train = previous_images

y_train = previous_labels

#x_test = complete_x_test

#y_test = complete_y_test

############################## Classifier Training ######################################

# get dataloaders

train_dataset_classification = getTransformedData(x_train,y_train,transform=transforms_classification_train,seed=seed,ages=current_increment_ages)

test_dataset_classification = getTransformedData(complete_x_test,complete_y_test,transform=transforms_classification_test,seed=seed)

dataloaders_train_classification = torch.utils.data.DataLoader(train_dataset_classification,batch_size = batch_size,

shuffle=True, num_workers = 4)

dataloaders_test_classification = torch.utils.data.DataLoader(test_dataset_classification,batch_size = batch_size,

shuffle=False, num_workers = 4)

if validation_based:

val_dataset_classification = getTransformedData(x_test,y_test,transform=transforms_classification_test,seed=seed)

dataloaders_val_classification = torch.utils.data.DataLoader(val_dataset_classification,batch_size = batch_size,

shuffle=False, num_workers = 4)

# update classifier's fc layer and optimizer

classify_net.fc = nn.Linear(512,total_classes+(total_classes*increment))

optimizer = optim.SGD(classify_net.parameters(),lr=classify_lr,weight_decay=weight_decay,momentum=0.9)

train_scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[60,120,160], gamma=0.2) #learning rate decay

classify_net = classify_net.cuda()

# for faster training times after the first increment

if increment>0:

classification_epochs = 45

train_scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[37], gamma=0.1) #learning rate decay

# load the classifier from file if it has already been trained on the classes of this increment

classifier_path = './checkpoint/'+str(total_classes+(increment*total_classes))+"classes_"+dataset_name

if os.path.exists(classifier_path):

classify_net.load_state_dict(torch.load(classifier_path))

epoch_acc = eval_training_with_decay(classify_net,dataloaders_test_classification,loss_classify,seed=seed)

Accus.append(epoch_acc.cpu().numpy().tolist())

else:

since = time.time()

best_acc = 0.0

for epoch in range(0, classification_epochs):

classification_loss = train_with_decay(classify_net,dataloaders_train_classification,optimizer,loss_classify,seed=seed)

print ('epoch:', epoch, ' classification loss:', classification_loss, ' learning rate:', optimizer.param_groups[0]['lr'])

train_scheduler.step(epoch)

if validation_based:

epoch_acc = eval_training_with_decay(classify_net,dataloaders_val_classification,loss_classify,seed=seed)

if epoch_acc>=best_acc:

best_acc = epoch_acc

best_model_wts = deepcopy(classify_net.state_dict())

print (' ')

time_elapsed = time.time() - since

print('Training complete in {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))

if validation_based:

#print ('best_acc',best_acc)

classify_net.load_state_dict(best_model_wts)

epoch_acc = eval_training_with_decay(classify_net,dataloaders_test_classification,loss_classify,seed=seed)

print ('test_acc',epoch_acc)

Accus.append(epoch_acc.cpu().numpy().tolist())

if validation_based:

torch.save(best_model_wts, "./checkpoint/"+str(total_classes+(increment*total_classes))+"classes_"+dataset_name)

else:

torch.save(classify_net.state_dict(),"./checkpoint/"+str(total_classes+(increment*total_classes))+"classes_"+dataset_name)

# find training accuracy of images of this increment

current_dataset = getTransformedData(train_images_increment,train_labels_increment,transform=transforms_classification_train,seed=seed)

current_loader = torch.utils.data.DataLoader(current_dataset,batch_size = batch_size,

shuffle=True, num_workers = 4)

print('Finding Training Accuracy')

new_accuracy = eval_training_with_decay(classify_net,current_loader,loss_classify,seed)

new_accuracy = new_accuracy.cpu().numpy().tolist()

training_accuracies.append(new_accuracy)

############################## Autoencoder Training ######################################

# get dataloaders

train_dataset_reconstruction = getTransformedData(train_images_increment,train_labels_increment,

transform=transforms_reconstruction,seed=seed)

test_dataset_reconstruction = getTransformedData(test_images_increment,test_labels_increment,transform=transforms_reconstruction,seed=seed)

dataloaders_train_reconstruction = torch.utils.data.DataLoader(train_dataset_reconstruction,batch_size = batch_size,

shuffle=True, num_workers = 4)

dataloaders_test_reconstruction = torch.utils.data.DataLoader(test_dataset_reconstruction,batch_size = batch_size,

shuffle=True, num_workers = 4)

for_embeddings_dataloader = torch.utils.data.DataLoader(train_dataset_reconstruction,batch_size = batch_size,

shuffle=False, num_workers = 4)

# load the autoencoder from file if it has already been trained on the classes of this increment

autoencoder_path = './checkpoint/autoencoder_'+str(total_classes+(increment*total_classes))+"classes_"+dataset_name

if os.path.exists(autoencoder_path):

autoencoder_set[increment].load_state_dict(torch.load(autoencoder_path))

else:

optimizer_rec = optim.Adam(autoencoder_set[increment].parameters(), lr=reconstruction_lr, weight_decay=weight_decay)

train_scheduler_rec = optim.lr_scheduler.MultiStepLR(optimizer_rec, milestones=[50], gamma=0.1) #learning rate decay

since = time.time()

best_loss = 100.0

for epoch in range(1, reconstruction_epochs):

#reconstruction_loss = train_reconstruction(autoencoder_set[increment],dataloaders_train_reconstruction,

#optimizer_rec,loss_rec,lambda_based=True,classify_net=classify_net,seed=seed,epoch=epoch)

reconstruction_loss = train_reconstruction(autoencoder_set[increment],dataloaders_train_reconstruction,optimizer_rec,loss_rec,seed=seed,epoch=epoch)

print ('epoch:', epoch, ' reconstruction loss:', reconstruction_loss)

train_scheduler_rec.step(epoch)

"""

#test_loss = eval_reconstruction(net,dataloaders_test_reconstruction,loss_rec,seed=seed)

test_loss = eval_reconstruction(autoencoder_set[increment],dataloaders_test_reconstruction,loss_rec,seed=seed)

if test_loss<=best_loss:

best_loss = test_loss

#best_model_wts = deepcopy(net.state_dict())

best_model_wts = deepcopy(autoencoder_set[increment].state_dict())

"""

time_elapsed = time.time() - since

print('Training complete in {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))

print (' ')

#autoencoder_set[increment].load_state_dict(best_model_wts)

if validation_based:

torch.save(best_model_wts, "./checkpoint/autoencoder_"+str(total_classes+(increment*total_classes))+"classes_"+dataset_name)

else:

torch.save(autoencoder_set[increment].state_dict(),

"./checkpoint/autoencoder_"+str(total_classes+(increment*total_classes))+"classes_"+dataset_name)

# get embeddings from the trained autoencoder

embeddings = get_embeddings(autoencoder_set[increment],for_embeddings_dataloader,total_classes,seed=seed,increment=increment)

print ('embeddings',np.array(embeddings).shape)

complete_centroids.extend(embeddings)

print ('complete centroids',np.array(complete_centroids).shape)

print ('All accuracies yet', Accus)

experimental_data = dict()

experimental_data['seed'] = seed

experimental_data['acc'] = Accus

if save_data == True:

with open('data.json','r') as f:

data=json.load(f)

if features_name not in data:

data[features_name] = dict()

data[features_name][str(len(data[features_name])+1)] = experimental_data

with open('data.json', 'w') as fp:

json.dump(data, fp, indent=4, sort_keys=True)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

multiple_auto_decay.py

multiple_auto_decay.py

Files

multiple_auto_decay.py

Latest commit

History

multiple_auto_decay.py

File metadata and controls