LIME算法：图像分类解释器（代码实现）人工智能weixin42347070的博客-

01 六月

星期一, 01 六月 2020 10:09 Last Updated on 星期一, 01 六月 2020 10:09 0 Comments

在上一篇博客LIME算法：模型的可解释性（代码实现）中，我整理了LIME算法的原理及在文本分类模型中的应用。在这篇笔记中，我记录了LIME算法在图像分类模型中的应用及过程中遇到的问题和解决方法。

一、算法简介

LIME算法是Marco Tulio Ribeiro2016年发表的论文《“Why Should I Trust You?” Explaining the Predictions of Any Classiﬁer》中介绍的局部可解释性模型算法。该算法主要是用在文本类与图像类的模型中。
LIME算法：图像分类解释器（代码实现）人工智能weixin42347070的博客-
在日常测试图像分类模型时，常常会得到一些莫名其妙的预测结果。我拿我家小猫的照片做测试，得出的预测结果竟然有“纸箱、安全带”这样的分类：

我忍不住想知道，我家小猫到底哪部分长得像安全带？而要得到这个答案，就可以利用LIME解释器来帮助解释。

二、LIME解释器代码实现

要实现LIME解释器在图像分类模型中的应用，首先要有一个已经建模完成的图像分类模型，这里参考lime算法的GitHub实例，基于keras框架下载Google Inception net-v3深度神经网络模型。

#加载需要的包 import os import keras from keras.applications import inception_v3 as inc_net from keras.preprocessing import image from keras.applications.imagenet_utils import decode_predictions from skimage.io import imread import matplotlib.pyplot as plt import numpy as np print('Notebook run using keras:', keras.__version__) #下载Google Inception net-v3深度神经网络模型 inet_model = inc_net.InceptionV3()

对待分类图像做数据预处理

def transform_img_fn(path_list):     out = [] for img_path in path_list:         img = image.load_img(img_path, target_size=(299, 299))         x = image.img_to_array(img)         x = np.expand_dims(x, axis=0)         x = inc_net.preprocess_input(x)         out.append(x) return np.vstack(out)

读取图像，输出预测结果。

images = transform_img_fn([os.path.join('./','cat.jpg')])#加载图像后直接进行数据处理 plt.imshow(images[0] / 2 + 0.5) preds = inet_model.predict(images) for x in decode_predictions(preds)[0]: print(x)#输出预测结果

可以看到输出的预测结果TOP5，分别为埃及猫、猞猁、纸箱、窗口屏幕、安全带。
LIME算法：图像分类解释器（代码实现）人工智能weixin42347070的博客-

预测结果的最大概率”埃及猫“和实际猫咪是吻合的，但是为什么会预测出纸箱、安全带之类的结果，就让人一头雾水了。这样的情况通过LIME算法是可以得到解答的。

LIME模型的原理是，把原始图片转成可解释的特征表示，通过可解释的特征表示对样本进行扰动，得到N个扰动后的样本。然后再将这N个样本还原到原始特征空间，并把预测值作为真实值，用可解释的特征数据表示建立简单的数据表示，观察哪些超像素的系数较大。这部分的原理解释在上一篇博客中已经进行了详细的解释，这里主要关注代码的实现。

#加载lime包 import lime from lime import lime_image

建立解释器，explain_instance的参数包括：

image：代解释图像
classifier_fn：分类器
labels：可解释标签
hide_color：隐藏颜色
top_labels：预测概率最高的K个标签生成解释
num_features：说明中出现的最大功能数
num_samples：学习线性模型的领域大小
batch_size：批处理大小
distance_metric：距离度量
model_regressor：模型回归器，默认为岭回归
segmentation_fn：分段，将图像分为多少个大小
random_seed：随机整数，用作分割算法的随机种子

explainer = lime_image.LimeImageExplainer() x=images[0].astype(np.double) #lime要求numpy array explanation = explainer.explain_instance(x, inet_model.predict, top_labels=5, hide_color=0, num_samples=1000)

解释器进度条跑完说明解释器运行完成。