first sketch ASGD

author: Marco Scoffier <github@metm.org> 2011-10-17 18:23:12 +0400
committer: Marco Scoffier <github@metm.org> 2011-10-17 18:23:12 +0400
commit: 38eeb494818ddeffc1a4322e080bb08680b8c6c5 (patch)
tree: c1c91bd8e56733364bb5fee1a7899e7b7ef8fa46
parent: f708b5967f0c99c35c0f95ba0e36e4e82aec5a94 (diff)
3 files changed, 66 insertions, 0 deletions
diff --git a/ASGDOptimization.lua b/ASGDOptimization.lua
new file mode 100644
index 0000000..8678adb
--- /dev/null
+++ b/ASGDOptimization.lua
@@ -0,0 +1,64 @@
+local ASGD,parent = torch.class('nn.ASGDOptimization', 'nn.SGDOptimization')
+
+-- ASGD: 
+--     w := (1 - lambda eta_t) w - eta_t dL/dw(z,w)
+--     a := a + mu_t [ w - a ]
+--
+--  eta_t = eta_0 / (1 + lambda eta0 t) ^ 0.75
+--   mu_t = 1/max(1,t-t0)
+-- 
+-- implements ASGD algoritm as in L.Bottou's sgd-2.0
+
+function ASGD:__init(...)
+   parent.__init(self,...)
+   xlua.unpack_class(self, {...},
+     'ASGDOptimization', nil,
+     {arg='eta0', type='number',
+      help='eta0 parameter for ASGD', default=1e-4},
+     {arg='t0', type='number',
+      help='point at which to start averaging', default=1e6},
+     {arg='lambda', type='number',
+      help='lambda for ASGD --decay term', default=1},
+     {arg='alpha', type='number',
+      help='alpha for ASGD -- power for eta update', default=0.75}
+  )
+   self.eta_t = self.eta0
+   self.mu_t  = 1
+   self.t     = 0
+end
+
+function ASGD:optimize() 
+   -- (1) decay term  
+   --     w := (1 - lambda eta_t) w
+   self.parameters:mul(1 - self.lambda * self.eta_t)
+   -- (2) parameter update with single or individual learningRates
+   --     w += - eta_t dL/dw(z,w)
+   if self.learningRates then
+      -- we are using diagHessian and have individual learningRates
+      self.deltaParameters = self.deltaParameters or 
+         self.parameters.new():resizeAs(self.gradParameters)
+      self.deltaParameters:copy(self.learningRates):cmul(self.gradParameters)
+      self.parameters:add(-self.eta_t, self.deltaParameters)
+   else
+      -- normal single learningRate parameter update
+      self.parameters:add(-self.eta_t, self.gradParameters)
+   end
+   -- (3) Average part
+   self.a = self.a or self.parameters.new():resizeAs(self.parameters):zero()
+   if self.mu_t ~= 1 then
+      self.tmp = self.tmp or self.a.new():resizeAs(self.a)
+      self.tmp:copy(self.parameters):add(-1,self.a):mul(self.mu_t)
+      self.a:add(self.tmp)
+   else 
+      self.a:copy(self.parameters)
+   end
+   -- (4) update eta_t and mu_t
+   -- (4a) increment time counter
+   self.t = self.t + 1
+   -- (4b) update eta_t
+   --  eta_t = eta_0 / (1 + lambda eta0 t) ^ 0.75
+   self.eta_t = self.eta0 / math.pow((1 + self.lambda * self.eta0 * self.t ),0.75)
+   -- (4c) update mu_t
+   --   mu_t = 1/max(1,t-t0)
+   self.mu_t = 1 / math.max(1,self.t - self.t0)
+end
+\ No newline at end of file
diff --git a/CMakeLists.txt b/CMakeLists.txt
index d0739ef..5b90102 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -121,6 +121,7 @@ install_files(${INSTALL_PREFIX} Optimization.lua)
 install_files(${INSTALL_PREFIX} LBFGSOptimization.lua)
 install_files(${INSTALL_PREFIX} CGOptimization.lua)
 install_files(${INSTALL_PREFIX} SGDOptimization.lua)
+install_files(${INSTALL_PREFIX} ASGDOptimization.lua)
 install_files(${INSTALL_PREFIX} GeneticSGDOptimization.lua)
 install_files(${INSTALL_PREFIX} BatchOptimization.lua)
 install_files(${INSTALL_PREFIX} SNESOptimization.lua)
diff --git a/init.lua b/init.lua
index 5f3daf2..8e98483 100644
--- a/init.lua
+++ b/init.lua
@@ -105,6 +105,7 @@ torch.include('nnx', 'Optimization.lua')
 torch.include('nnx', 'BatchOptimization.lua')
 torch.include('nnx', 'SNESOptimization.lua')
 torch.include('nnx', 'SGDOptimization.lua')
+torch.include('nnx', 'ASGDOptimization.lua')
 torch.include('nnx', 'LBFGSOptimization.lua')
 torch.include('nnx', 'CGOptimization.lua')
 torch.include('nnx', 'GeneticSGDOptimization.lua')
author	Marco Scoffier <github@metm.org>	2011-10-17 18:23:12 +0400
committer	Marco Scoffier <github@metm.org>	2011-10-17 18:23:12 +0400
commit	38eeb494818ddeffc1a4322e080bb08680b8c6c5 (patch)
tree	c1c91bd8e56733364bb5fee1a7899e7b7ef8fa46
parent	f708b5967f0c99c35c0f95ba0e36e4e82aec5a94 (diff)