Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

07 六月

星期日, 07 六月 2020 07:58 Last Updated on 星期日, 07 六月 2020 07:58 0 Comments

准备训练的数据集

由于我原本的数据集是没有经过任何处理的，格式如图所示：
Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客- data文件夹对应的图像集的标签在training.csv文件夹中，如图所示：

而输入的图像文件却需要满足ImageFolder的格式：

class ImageFolder(DatasetFolder): """A generic data loader where the images are arranged in this way: ::          root/dog/xxx.png         root/dog/xxy.png         root/dog/xxz.png          root/cat/123.png         root/cat/nsdf3.png         root/cat/asd932_.png

我通过convert_dataset.py文件对图像格式进行转化。

import pandas as pd import shutil import os  def convert_dataset(csv_filename, pre_path, root_path):     path_lst = [] # pre_path = "af2020cv-2020-05-09-v5-dev/data"       data_file = pd.read_csv(csv_filename)     id_tuple = tuple(data_file["FileID"].values.tolist())     classes_tuple = tuple(data_file["SpeciesID"].values.tolist()) try: for i in range(len(id_tuple)):             new_path = os.path.join(root_path, str(classes_tuple[i])) if not os.path.exists(new_path):                 os.makedirs(new_path)             shutil.copy(os.path.join(pre_path, id_tuple[i]+".jpg"),os.path.join(new_path,id_tuple[i]+".jpg")) except: print("match error")   pre_path = "af2020cv-2020-05-09-v5-dev/data" #图片文件之前所在文件夹 train_root_path = "images/train" #待训练图片存储文件夹的路径 test_root_path = "images/test" #训练时验证集存储文件夹的路径 train_filename = 'af2020cv-2020-05-09-v5-dev/training.csv' #待读取的训练csv文件 test_filename = 'af2020cv-2020-05-09-v5-dev/annotation.csv' #待读取的验证csv文件 # 生成ImageFolder所要求的图片格式 if __name__ == '__main__':     convert_dataset(train_filename, pre_path, train_root_path)     convert_dataset(test_filename, pre_path, test_root_path) print("dataset converting is finished!")

处理结果如图所示：
Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

训练自己的数据集及绘制acc_loss图像

训练和预测模型代码参考两篇博客：

基于上述两篇博客，我得到自己的模型代码：underwater_classify.py

from __future__ import print_function, division  import torch import torch.nn as nn import torch.optim as optim from torch.autograd import Variable from torchvision import datasets, models, transforms import time import os import json from efficientnet_pytorch.model import EfficientNet from PIL import Image, ImageDraw, ImageFont import matplotlib.pyplot as plt  # some parameters image_dir = './tests/fe803d232e3c959f95e4df9b9b383432.jpg' use_gpu = torch.cuda.is_available() os.environ["CUDA_VISIBLE_DEVICES"] = "0" data_dir = 'images' batch_size = 64 lr = 0.01 momentum = 0.9 num_epochs = 80 input_size = 224 class_num = 20 net_name = 'efficientnet-b3' def loaddata(data_dir, batch_size, set_name, shuffle):     data_transforms = { 'train': transforms.Compose([             transforms.Resize(input_size),             transforms.CenterCrop(input_size),             transforms.RandomAffine(degrees=0, translate=(0.05, 0.05)),             transforms.RandomHorizontalFlip(),             transforms.ToTensor(),             transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), 'test': transforms.Compose([             transforms.Resize(input_size),             transforms.CenterCrop(input_size),             transforms.ToTensor(),             transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), }      image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in [set_name]} # print(image_datasets) # num_workers=0 if CPU else =1     dataset_loaders = {x: torch.utils.data.DataLoader(image_datasets[x],                                                       batch_size=batch_size,                                                       shuffle=shuffle, num_workers=1) for x in [set_name]}     data_set_sizes = len(image_datasets[set_name]) return dataset_loaders, data_set_sizes   def train_model(model_ft, criterion, optimizer, lr_scheduler, num_epochs=50):     train_loss = []     loss_all = []     acc_all = []     since = time.time()     best_model_wts = model_ft.state_dict()     best_acc = 0.0     model_ft.train(True) for epoch in range(num_epochs):         dset_loaders, dset_sizes = loaddata(data_dir=data_dir, batch_size=batch_size, set_name='train', shuffle=True) # print(dset_loaders) print('Data Size', dset_sizes) print('Epoch {}/{}'.format(epoch, num_epochs - 1)) print('-' * 10)         optimizer = lr_scheduler(optimizer, epoch)          running_loss = 0.0         running_corrects = 0         count = 0 for data in dset_loaders['train']: # print(data)             inputs, labels = data             labels = torch.squeeze(labels.type(torch.LongTensor)) if use_gpu:                 inputs, labels = Variable(inputs.cuda()), Variable(labels.cuda()) else:                 inputs, labels = Variable(inputs), Variable(labels)              outputs = model_ft(inputs)             loss = criterion(outputs, labels)             _, preds = torch.max(outputs.data, 1)              optimizer.zero_grad()             loss.backward()             optimizer.step()              count += 1 if count % 30 == 0 or outputs.size()[0] < batch_size: print('Epoch:{}: loss:{:.3f}'.format(epoch, loss.item()))                 train_loss.append(loss.item())              running_loss += loss.item() * inputs.size(0)             running_corrects += torch.sum(preds == labels.data)          epoch_loss = running_loss / dset_sizes         epoch_acc = running_corrects.double() / dset_sizes         loss_all.append(int(epoch_loss*100))         acc_all.append(int(epoch_acc*100)) # print(epoch_loss) print('Loss: {:.4f} Acc: {:.4f}'.format(             epoch_loss, epoch_acc)) if epoch_acc > best_acc:             best_acc = epoch_acc             best_model_wts = model_ft.state_dict() if epoch_acc > 0.999: break # save best model     save_dir = data_dir + '/model'     model_ft.load_state_dict(best_model_wts)     model_out_path = save_dir + "/" + net_name + '.pth'     torch.save(best_model_wts, model_out_path) # plot the figure of acc and loss     x1 = list(range(len(acc_all)))     x2 = list(range(len(loss_all)))     y1 = acc_all     y2 = loss_all     plt.subplot(2, 1, 1) # plt.plot(x1, y1, 'o-',color='r')     plt.plot(x1, y1, 'o-', label="Train_Accuracy")     plt.title('train acc vs. iter')     plt.ylabel('train accuracy')     plt.legend(loc='best')     plt.subplot(2, 1, 2)     plt.plot(x2, y2, '.-', label="Train_Loss")     plt.xlabel('train loss vs. iter')     plt.ylabel('train loss')     plt.legend(loc='best')     plt.savefig(save_dir + "/"+"acc_loss.png")     plt.show()      time_elapsed = time.time() - since     print('Training complete in {:.0f}m {:.0f}s'.format(         time_elapsed // 60, time_elapsed % 60)) return train_loss, best_model_wts   def test_model(model, criterion):     model.eval()     running_loss = 0.0     running_corrects = 0     cont = 0     outPre = []     outLabel = []     dset_loaders, dset_sizes = loaddata(data_dir=data_dir, batch_size=16, set_name='test', shuffle=False) for data in dset_loaders['test']:         inputs, labels = data         labels = torch.squeeze(labels.type(torch.LongTensor))         inputs, labels = Variable(inputs.cuda()), Variable(labels.cuda())         outputs = model(inputs)         _, preds = torch.max(outputs.data, 1)         loss = criterion(outputs, labels) if cont == 0:             outPre = outputs.data.cpu()             outLabel = labels.data.cpu() else:             outPre = torch.cat((outPre, outputs.data.cpu()), 0)             outLabel = torch.cat((outLabel, labels.data.cpu()), 0)         running_loss += loss.item() * inputs.size(0)         running_corrects += torch.sum(preds == labels.data)         cont += 1 print('Loss: {:.4f} Acc: {:.4f}'.format(running_loss / dset_sizes,                                             running_corrects.double() / dset_sizes)) def exp_lr_scheduler(optimizer, epoch, init_lr=0.01, lr_decay_epoch=10): """Decay learning rate by a f#            model_out_path ="./model/W_epoch_{}.pth".format(epoch) #            torch.save(model_W, model_out_path) actor of 0.1 every lr_decay_epoch epochs."""     lr = init_lr * (0.8**(epoch // lr_decay_epoch)) print('LR is set to {}'.format(lr)) for param_group in optimizer.param_groups:         param_group['lr'] = lr      return optimizer   # train pth_map = { 'efficientnet-b0': 'efficientnet-b0-355c32eb.pth', 'efficientnet-b1': 'efficientnet-b1-f1951068.pth', 'efficientnet-b2': 'efficientnet-b2-8bb594d6.pth', 'efficientnet-b3': 'efficientnet-b3-5fb5a3c3.pth', 'efficientnet-b4': 'efficientnet-b4-6ed6700e.pth', 'efficientnet-b5': 'efficientnet-b5-b6417697.pth', 'efficientnet-b6': 'efficientnet-b6-c76e70fd.pth', 'efficientnet-b7': 'efficientnet-b7-dcc49843.pth', } # 自动下载到本地预训练 # model_ft = EfficientNet.from_pretrained('efficientnet-b0') model_ft = EfficientNet.from_name('efficientnet-b3') # 离线加载预训练，需要事先下载好 # model_ft = EfficientNet.from_name(net_name) # net_weight = 'eff_weights/' + pth_map[net_name] # state_dict = torch.load(net_weight) # model_ft.load_state_dict(state_dict) # 修改全连接层 num_ftrs = model_ft._fc.in_features model_ft._fc = nn.Linear(num_ftrs, class_num)  criterion = nn.CrossEntropyLoss() if use_gpu:     model_ft = model_ft.cuda()     criterion = criterion.cuda()  optimizer = optim.SGD((model_ft.parameters()), lr=lr,                       momentum=momentum, weight_decay=0.0004)  train_loss, best_model_wts = train_model(model_ft, criterion, optimizer, exp_lr_scheduler, num_epochs=num_epochs) # test print('-' * 10) print('Test Accuracy:') model_ft.load_state_dict(best_model_wts) criterion = nn.CrossEntropyLoss().cuda() test_model(model_ft, criterion)

运行以上代码，得到的训练好的模型存储在images/model路径中
Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-
绘制得到的acc_loss图像也存储在images/model中，图像如图所示：

此外我们还得到了一个整体分类评估结果：

分类自己的数据集

生成label_map

由于分类的时候需要得到每一张图片的labels，这样我们通过预测的准确率和对应的labels就可以知道对输入图片的分类的结果，因此首先我们需要生成自己的labels_map，其格式为json。
运行create_map.py

import pandas as pd import os import json  def create_map(csv_filename, txt_name): # if not os.path.exists(txt_name): # os.makedirs(txt_name)     data_file = pd.read_csv(csv_filename)     id_list = data_file["ID"].values.tolist()     classes_list = data_file["ScientificName"].values          # dict_map = dict(zip(id_list, classes_list))     dict_map = dict(zip(id_list, id_list))     json_map = json.dumps(dict_map) # print(json_map) with open(txt_name, 'w', encoding='utf8') as f:         f.write(json_map) if __name__ == "__main__":     csv_filename = "af2020cv-2020-05-09-v5-dev/species.csv"     txt_name = "underwater.txt"     create_map(csv_filename, txt_name)

通过以上代码，便得到了标签，如图所示：
Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

分类自己的数据集

训练的时候也得到了一个分类结果，但是那个不属于完整意义的分类，可以理解为对认为分类好的结果的整体评估。
因此如何实现模型自动分类呢？

对单张图片实现分类

运行test_prediction.py

from __future__ import print_function, division  import torch import torch.nn as nn from torch.autograd import Variable from torchvision import datasets, transforms import numpy as np import torch.nn.functional as FUN import os from scipy import io import json from efficientnet_pytorch.model import EfficientNet from PIL import Image, ImageDraw, ImageFont  input_size = 224 class_num = 20 image_dir = './images/test/10/0b38a8ed01e51cd614bc8ffb0197a598.jpg' use_gpu = torch.cuda.is_available() def test_model(model):     model.eval()     tfms = transforms.Compose([transforms.Resize(224), transforms.ToTensor(),     transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),])     image = Image.open(image_dir)     img = tfms(image).unsqueeze(0)     img = Variable(img.cuda()) # print(img.shape) # torch.Size([1, 3, 224, 224])          labels_map = json.load(open('examples/simple/underwater.txt'))     labels_map = [labels_map[str(i)] for i in range(20)] with torch.no_grad():         outputs = model(img) # Print predictions print('-----')     cout = 0 for idx in torch.topk(outputs, k=20).indices.squeeze(0).tolist():         cout += 1         prob = torch.softmax(outputs, dim=1)[0, idx].item() print('{label:<75} ({p:.2f}%)'.format(label=labels_map[idx], p=prob*100)) if __name__ == '__main__': # 自动下载到本地预训练 # model_ft = EfficientNet.from_pretrained('efficientnet-b0')     model_ft = EfficientNet.from_name('efficientnet-b1') # 离线加载预训练，需要事先下载好 # model_ft = EfficientNet.from_name(net_name) # net_weight = 'eff_weights/' + pth_map[net_name] # state_dict = torch.load(net_weight) # model_ft.load_state_dict(state_dict) # 修改全连接层     num_ftrs = model_ft._fc.in_features     model_ft._fc = nn.Linear(num_ftrs, class_num) if use_gpu:         model_ft = model_ft.cuda() print('-' * 10) print('Test Accuracy:')     model_ft.load_state_dict(torch.load("./images/model/efficientnet-b1.pth")) # criterion = nn.CrossEntropyLoss().cuda()     test_model(model_ft)

分类结果如图所示：

结果中我只打印了准确度前五的物体标签，测试的图片就是标签为0，对应的物体是Eretmochelys imbricata。百度信息如下：
Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-
而我输入的图片为下图：

因此此次预测单张图片的分类结果是准确的，准确度为95.03%！

对多张图片进行分类

由于需要读取多张图片，因此我们首先需要解决的就是图片的路径问题。
未完待续
附：以上代码将用于未来杯水下图片发类比赛，请参加同一比赛的同学谨慎使用，6.23号（比赛结束时间）以后可以自由使用！

展开阅读全文

2
评论 1
x
海报

扫一扫，海报
1
手机看

到微信朋友圈

x

扫一扫，手机阅读
打赏

打赏

whisperLiang

“你的鼓励将是我创作的最大动力”

5C币 10C币 20C币 50C币 100C币 200C币

确定

Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

本页所有内容来自官方网站 https://www.imapbox.com 新闻来源：互联网搜索引擎和新闻站

本网页所有图片由 ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片，下载并得到。

ImageBox 图片批量下载器工具地址: 网页图片批量下载工具-最新版本下载

非凡下载站地址：https://www.crsky.com/soft/35838.html

本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器下载并得到。

ImovieBox网页视频下载器下载地址: ImovieBox网页视频下载器-最新版本下载

本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.

阅读和此文章类似的: 全球云计算

Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

准备训练的数据集

训练自己的数据集及绘制acc_loss图像

分类自己的数据集

生成label_map

分类自己的数据集

对单张图片实现分类

对多张图片进行分类

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

Efficientnetpytorch训练自己的数据集，并对数据进行分类Whisperlg的博客-

准备训练的数据集

训练自己的数据集及绘制acc_loss图像

分类自己的数据集

生成label_map

分类自己的数据集

对单张图片实现分类

对多张图片进行分类

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

登录