使用错误分布q来表示来自真实分布p的平均编码长度
交叉熵
发表于 | 阅读次数:
hexo 双线性插值核
发表于 | 阅读次数:
u(s) = { 0 |s| > 1
{ 1 – |s| |s| < 1 }
fish-shell
发表于 | 阅读次数:
1 | sudo apt-add-repository ppa:fish-shell/release-2 |
1 | > ls l*.p* |
python -m pip
发表于 | 阅读次数:
python yield使用
发表于 | 阅读次数:
KD树
发表于 | 阅读次数:
pytorch那些坑
发表于 | 阅读次数:
1. network 不存在
用了非推荐的save方式,然后load的模型的名字和自己写的文件名不一样
2. 记录loss信息的时候直接使用了输出的Variable
1 | for data, label in trainloader: |
3. model.eval
在训练每个batch之前记得加model.train(),训练完若干个iteration之后在验证前记得加model.eval()
否则会影响dropout和BN.
4. F.dropout()
用F.dropout()时一定要手动设参数self.training,正确用法:F.dropout(x, 0.2, self.training)
5. zero_grad
6. zero
如果是tensor:
1 | tensor.new(tensor.size()).zero_() |
如果是Variable,得是:
1 | Variable(tensor.new(tensor.size()).zero_()) |
7. Inference
在做inference时,千万要记住对输入的Variable设置volatile 为true.而不能设置requires_grad 为false.血的教训。。。
mac系统编码设置
发表于 | 阅读次数:
遇到了
1 | ascii codec can not decode byte 0xc3 in position 875: ordinal not in range(128) |
1 | $ vim ~/.bash_profile |