Add cudnn.BatchNormalization and cudnn.VolumetricBatchNormalization

author: Sam Gross <sgross@fb.com> 2016-02-25 01:19:52 +0300
committer: Sam Gross <sgross@fb.com> 2016-02-25 01:19:52 +0300
commit: 83b5b6c6bbed0fb1a9457fc285d187341a040e90 (patch)
tree: 0cadfd57fc5a2e7c564261ee0fb2d2a46b768701 /SpatialBatchNormalization.lua
parent: f1cfa7ca2d379ac9c336147a59b45fbf2039ffbf (diff)
1 files changed, 4 insertions, 134 deletions
diff --git a/SpatialBatchNormalization.lua b/SpatialBatchNormalization.lua
index 53e8f7e..2c80fc7 100644
--- a/SpatialBatchNormalization.lua
+++ b/SpatialBatchNormalization.lua
@@ -1,135 +1,5 @@
-local SpatialBatchNormalization, parent = torch.class('cudnn.SpatialBatchNormalization', 'nn.Module')
-local ffi = require 'ffi'
-local errcheck = cudnn.errcheck
+local SpatialBatchNormalization, parent =
+   torch.class('cudnn.SpatialBatchNormalization', 'cudnn.BatchNormalization')
 
-function SpatialBatchNormalization:__init(nFeature, eps, momentum, affine)
-   parent.__init(self)
-   assert(nFeature and type(nFeature) == 'number',
-          'Missing argument #1: Number of feature planes. ')
-   assert(nFeature ~= 0, 'To set affine=false call SpatialBatchNormalization'
-     .. '(nFeature,  eps, momentum, false) ')
-   if affine ~= nil then
-      assert(type(affine) == 'boolean', 'affine has to be true/false')
-      self.affine = affine
-   else
-      self.affine = true
-   end
-   self.eps = eps or 1e-5
-   self.train = true
-   self.momentum = momentum or 0.1
-
-   self.running_mean = torch.zeros(nFeature)
-   self.running_std = torch.ones(nFeature)
-   if self.affine then
-      self.weight = torch.Tensor(nFeature)
-      self.bias = torch.Tensor(nFeature)
-      self.gradWeight = torch.Tensor(nFeature)
-      self.gradBias = torch.Tensor(nFeature)
-      self:reset()
-   end
-   self.mode = 'CUDNN_BATCHNORM_SPATIAL'
-end
-
-function SpatialBatchNormalization:reset()
-   if self.weight then
-      self.weight:uniform()
-   end
-   if self.bias then
-      self.bias:zero()
-   end
-   self.running_mean:zero()
-   self.running_std:fill(1)
-end
-
-function SpatialBatchNormalization:createIODescriptors(input)
-   assert(input:dim() == 4)
-   assert(torch.typename(self.weight) == 'torch.CudaTensor' and torch.typename(self.bias) == 'torch.CudaTensor',
-          'Only CUDA tensors are supported for cudnn.SpatialBatchNormalization!')
-   if not self.iDesc or not self.oDesc or
-      input:size(1) ~= self.iSize[1] or input:size(2) ~= self.iSize[2]
-   or input:size(3) ~= self.iSize[3] or input:size(4) ~= self.iSize[4] then
-      local nFeature = self.running_mean:numel()
-      self.iSize = input:size()
-      self.output:resizeAs(input)
-      self.gradInput:resizeAs(input)
-      self.iDesc = cudnn.toDescriptor(input)
-      self.oDesc = cudnn.toDescriptor(self.output)
-      self.sDesc = cudnn.toDescriptor(self.bias:view(1, nFeature, 1, 1))
-   end
-end
-
-local one = torch.FloatTensor({1});
-local zero = torch.FloatTensor({0});
-local scaleTens = torch.FloatTensor(1);
-
-function SpatialBatchNormalization:updateOutput(input)
-   self:createIODescriptors(input)
-
-   self.save_mean = self.save_mean or input.new()
-   self.save_mean:resizeAs(self.running_mean)
-   self.save_std = self.save_std or input.new()
-   self.save_std:resizeAs(self.running_std)
-
-   if self.train then
-      errcheck('cudnnBatchNormalizationForwardTraining',
-            cudnn.getHandle(), self.mode, one:data(), zero:data(),
-            self.iDesc[0], input:data(), self.oDesc[0], self.output:data(),
-            self.sDesc[0], self.weight:data(), self.bias:data(),
-            self.momentum, self.running_mean:data(), self.running_std:data(), self.eps, self.save_mean:data(), self.save_std:data());
-   else
-      errcheck('cudnnBatchNormalizationForwardInference',
-            cudnn.getHandle(), self.mode, one:data(), zero:data(),
-            self.iDesc[0], input:data(), self.oDesc[0], self.output:data(),
-            self.sDesc[0], self.weight:data(), self.bias:data(),
-            self.running_mean:data(), self.running_std:data(), self.eps);
-   end
-   return self.output
-end
-
-local function backward(self,input,gradOutput, scale)
-   assert(gradOutput:isContiguous())
-   self:createIODescriptors(input)
-   scale = scale or 1
-   scaleTens:fill(scale)
-   errcheck('cudnnBatchNormalizationBackward',
-      cudnn.getHandle(), self.mode, one:data(), zero:data(), scaleTens:data(), one:data(),
-      self.iDesc[0], input:data(), self.iDesc[0], gradOutput:data(), self.iDesc[0], self.gradInput:data(),
-                     -- input is bottom, gradOutput is topDiff, self.gradInput is resultBottomDiff
-      self.sDesc[0], self.weight:data(), self.gradWeight:data(), self.gradBias:data(),
-      self.eps, self.save_mean:data(), self.save_std:data());
-   return self.gradInput
-end
-
-function SpatialBatchNormalization:updateGradInput(input, gradOutput, scale)
--- will in fact update gradWeight and gradBias too, accGradParameters call is empty
-  return backward(self, input,gradOutput, scale)
-end
-
-
-function SpatialBatchNormalization:backward(input, gradOutput, scale)
-  return backward(self, input,gradOutput, scale)
-end
-
-function SpatialBatchNormalization:accGradParameters(input, gradOutput, scale)
-end
-
-function SpatialBatchNormalization:clearDesc()
-   self.iDesc = nil
-   self.oDesc = nil
-   self.sDesc = nil
-end
-
-function SpatialBatchNormalization:write(f)
-   self:clearDesc()
-   local var = {}
-   for k,v in pairs(self) do
-      var[k] = v
-   end
-   f:writeObject(var)
-end
-
-function SpatialBatchNormalization:clearState()
-   self:clearDesc()
-   nn.utils.clear(self, 'save_mean', 'save_std')
-   return parent.clearState(self)
-end
+SpatialBatchNormalization.mode = 'CUDNN_BATCHNORM_SPATIAL'
+SpatialBatchNormalization.nDim = 4
author	Sam Gross <sgross@fb.com>	2016-02-25 01:19:52 +0300
committer	Sam Gross <sgross@fb.com>	2016-02-25 01:19:52 +0300
commit	83b5b6c6bbed0fb1a9457fc285d187341a040e90 (patch)
tree	0cadfd57fc5a2e7c564261ee0fb2d2a46b768701 /SpatialBatchNormalization.lua
parent	f1cfa7ca2d379ac9c336147a59b45fbf2039ffbf (diff)