使用了net = torch.nn.DataParallel(net)
后会多一个module
如果没使用这个,就会少一个module.
truediv代替div
发表于 | 阅读次数:
1 | def __truediv__(): |
空格转成tab
发表于 | 阅读次数:
1 | :set tabstop=2 " To match the sample file |
python读文件
发表于 | 阅读次数:
1 | import binascii |
python3调用c
发表于 | 阅读次数:
c函数
1 | #include <Python.h> |
1 | #include <Python.h> |
setup.py
1 | from setuptools import setup, Extension |
或者是用gcc
1 | g++ -fPIC -shared great_class_wrap.cxx -o _great_class.so -I/usr/include/python2.7/ -lpython2.7 |
原始的c函数文件
1 | #include <Python.h> |
1 | gcc -fPIC -shared great_module.c -o great_module.so -I/home/xxx/miniconda2/envs/env3.6/include/python3.6m -lpython3.6m |
多个参数
1 | #include <Python.h> |
动态库查找路径
发表于 | 阅读次数:
1 | gcc --print-search-dirs |
网络权重正交化
发表于 | 阅读次数:
$F^n$ 的操作和矩阵的特征根有关系,如果特征根不是和1接近,那么对于RNN来说
梯度会爆炸。 因为里面包含了多个这样的操作。
然后正交矩阵的特征根都是1/-1, 所以能比较好的保持这种性质。
ffmpeg使用
发表于 | 阅读次数:
numpy None转nan
发表于 | 阅读次数:
1 | a = a.astype(float) |
pytorch按batch softmax
发表于 | 阅读次数:
1 | x = Variable(torch.cat((torch.ones(1, 1, 10, 10), torch.ones(1, 1, 10, 10)*2), dim=0)) |