Siamese networks and Triplet Loss

问题背景

相区别于传统的分类器，Siamese networks采取的分类策略为比较模型的两个输入是否相似，如果相似，那么就可以判断两个输入属于同一个类；如果不相似，则属于不同类别。
与传统分类器更大的区别在于，前者需要每个类都拥有非常大的样本量供模型提取特征以便判断后续样本样本是否属于某个类，而Siamese networks可以基于只有一个样本的情况下做出决定，判断两个输入是否相同。

实现原理

实现思路类似于聚类算法，已有的不同类别的样本在样本空间中分别聚集在一起，相同类别的样本之间距离很近，不同类别的样本之间距离很远。当新进入一个样本时，计算新样本在样本空间中的位置，并且与样本空间中的其他样本计算距离，根据距离即可判断出所属类别。

实现流程

本次实验的数据为Mnist数据集，形状为(28, 28)，一般情况下不直接使用原数据进行距离计算，因此需要一个网络结构进行编码同时实现降维（这个过程称为Embeddings）。同时，处理后的数据需要进行L2归一化，即使其位于一个单位超球面上。对于具体用多少维度的向量来表示，需要进行实验尝试，本次实验中选择使用10维。

对样本处理完后，需要设计Loss。在本次实验中选择使用了Triple Loss，即一个训练样本中包含了三张图片：