“—
title: 人脸识别的loss
date: 2018-08-16 17:42:27
tags:
—“
1. 原有softmax
hardmax

softmax

区别
soft max比hard max更容易达到终极目标one-hot形式, 因为它大的会被放大
softmax鼓励不同类别的特征分开,但并不鼓励特征分离很多
(5,1,1,1)时loss就已经很小了,此时CNN接近收敛梯度不再下降