ImageNet 数据集

ImageNet 是根据 WordNet 层次结构组织的图像数据集。WordNet 中的每个有意义的概念，可能由多个单词或单词短语描述，称为同义词集或 synset。

ImageNet 有大约 100 K 个同义词集，平均每个同义词集约有 1,000 个人工注释图像。 ImageNet 仅存储对图像的引用，而图像存储在互联网上的原始位置。在深度学习论文中，ImageNet-1K 是指作为 ImageNet 的大规模视觉识别挑战（ ILSVRC ）的一部分发布的数据集，用于将数据集分类为 1,000 个类别：

可以在以下 URL 找到 1,000 个挑战类别：

http://image-net.org/challenges/LSVRC/2017/browse-synsets http://image-net.org/challenges/LSVRC/2016/browse-synsets http://image-net.org/challenges/LSVRC/2015/browse-synsets http://image-net.org/challenges/LSVRC/2014/browse-synsets http://image-net.org/challenges/LSVRC/2013/browse-synsets http://image-net.org/challenges/LSVRC/2012/browse-synsets http://image-net.org/challenges/LSVRC/2011/browse-synsets http://image-net.org/challenges/LSVRC/2010/browse-synsets.

我们编写了一个自定义函数来从 Google 下载 ImageNet 标签：

def build_id2label(self):
    base_url = 'https://raw.githubusercontent.com/tensorflow/models/master/research/inception/inception/data/'
  synset_url = '{}/imagenet_lsvrc_2015_synsets.txt'.format(base_url)
    synset_to_human_url = '{}/imagenet_metadata.txt'.format(base_url)

    filename, _ = urllib.request.urlretrieve(synset_url)
    synset_list = [s.strip() for s in open(filename).readlines()]
    num_synsets_in_ilsvrc = len(synset_list)
    assert num_synsets_in_ilsvrc == 1000

  filename, _ = urllib.request.urlretrieve(synset_to_human_url)
    synset_to_human_list = open(filename).readlines()
    num_synsets_in_all_imagenet = len(synset_to_human_list)
    assert num_synsets_in_all_imagenet == 21842

  synset2name = {}
    for s in synset_to_human_list:
        parts = s.strip().split('\t')
        assert len(parts) == 2
  synset = parts[0]
        name = parts[1]
        synset2name[synset] = name

    if self.n_classes == 1001:
        id2label={0:'empty'}
        id=1
  else:
        id2label = {}
        id=0

  for synset in synset_list:
        label = synset2name[synset]
        id2label[id] = label
        id += 1

  return id2label

我们将这些标签加载到我们的 Jupyter 笔记本中，如下所示：

### Load ImageNet dataset for labels
from datasetslib.imagenet import imageNet
inet = imageNet()
inet.load_data(n_classes=1000)  
#n_classes is 1001 for Inception models and 1000 for VGG models

在 ImageNet-1K 数据集上训练过的热门预训练图像分类模型如下表所示：

模型名称	Top-1 准确率	Top-5 准确率	Top-5 错误率	原始文件的链接
AlexNet			15.3%	https://www.cs.toronto.edu/~fritz/absps/imagenet.pdf
盗梦空间也称为 Inception V1	69.8	89.6	6.67%	https://arxiv.org/abs/1409.4842
BN-启-V2 也称为 Inception V2	73.9	91.8	4.9%	https://arxiv.org/abs/1502.03167
Inception v3	78.0	93.9	3.46%	https://arxiv.org/abs/1512.00567
成立 V4	80.2	95.2		http://arxiv.org/abs/1602.07261
Inception-Resnet-V2	80.4	95.2		http://arxiv.org/abs/1602.07261
VGG16	71.5	89.8	7.4%	https://arxiv.org/abs/1409.1556
VGG19	71.1	89.8	7.3%	https://arxiv.org/abs/1409.1556
ResNet V1 50	75.2	92.2	7.24%	https://arxiv.org/abs/1512.03385
Resnet V1 101	76.4	92.9		https://arxiv.org/abs/1512.03385
Resnet V1 152	76.8	93.2		https://arxiv.org/abs/1512.03385
ResNet V2 50	75.6	92.8		https://arxiv.org/abs/1603.05027
ResNet V2 101	77.0	93.7		https://arxiv.org/abs/1603.05027
ResNet V2 152	77.8	94.1		https://arxiv.org/abs/1603.05027
ResNet V2 200	79.9	95.2		https://arxiv.org/abs/1603.05027
Xception	79.0	94.5		https://arxiv.org/abs/1610.02357
MobileNet V1 版本	41.3 至 70.7	66.2 至 89.5		https://arxiv.org/pdf/1704.04861.pdf

在上表中，Top-1 和 Top-5 指标指的是模型在 ImageNet 验证数据集上的表现。

Google Research 最近发布了一种名为 MobileNets 的新模型。 MobileNets 采用移动优先策略开发，牺牲了低资源使用的准确性。 MobileNets 旨在消耗低功耗并提供低延迟，以便在移动和嵌入式设备上提供更好的体验。谷歌为 MobileNet 模型提供了 16 个预训练好的检查点文件，每个模型提供不同数量的参数和乘法累加（ MAC ）。 MAC 和参数越高，资源使用和延迟就越高。因此，您可以在更高的准确性与更高的资源使用/延迟之间进行选择。

模型检查点	百万 MAC	百万参数	Top-1 准确率	Top-5 准确率
MobileNet_v1_1.0_224	569	4.24	70.7	89.5
MobileNet_v1_1.0_192	418	4.24	69.3	88.9
MobileNet_v1_1.0_160	291	4.24	67.2	87.5
MobileNet_v1_1.0_128	186	4.24	64.1	85.3
MobileNet_v1_0.75_224	317	2.59	68.4	88.2
MobileNet_v1_0.75_192	233	2.59	67.4	87.3
MobileNet_v1_0.75_160	162	2.59	65.2	86.1
MobileNet_v1_0.75_128	104	2.59	61.8	83.6
MobileNet_v1_0.50_224	150	1.34	64.0	85.4
MobileNet_v1_0.50_192	110	1.34	62.1	84.0
MobileNet_v1_0.50_160	77	1.34	59.9	82.5
MobileNet_v1_0.50_128	49	1.34	56.2	79.6
MobileNet_v1_0.25_224	41	0.47	50.6	75.0
MobileNet_v1_0.25_192	34	0.47	49.0	73.6
MobileNet_v1_0.25_160	21	0.47	46.0	70.7
MobileNet_v1_0.25_128	14	0.47	41.3	66.2

有关 MobileNets 的更多信息，请访问以下资源：

https://research.googleblog.com/2017/06/mobilenets-open-source-models-for.html

https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet_v1.md

https://arxiv.org/pdf/1704.04861.pdf.

ImageNet 数据集

ImageNet 数据集

results matching ""

No results matching ""