squared error and softmax 发表于 2018-08-Sun | 阅读次数: squared error 下,梯度是 y * (1-y) *(-2 * (t - y)) 如果y=0,那么梯度不见了softmax error下,梯度是 y * (1-y) / (y) 如果y=0,那么梯度还蛮大请作者喝一杯咖啡☕️打赏微信支付