Divide loss by batch size, initialize 2D activations

author: SeanNaren <taz838@hotmail.co.uk> 2016-05-18 10:33:05 +0300
committer: SeanNaren <taz838@hotmail.co.uk> 2016-05-18 10:33:05 +0300
commit: 56c8aa664c3979069f8ad93b538daa8672af87bd (patch)
tree: b271b274817e46f757830203317d823fb799be78
parent: 73a49c80b5c090230dd1605e20c683cbf04e684e (diff)
2 files changed, 12 insertions, 4 deletions
diff --git a/CTCCriterion.lua b/CTCCriterion.lua
index 6d4a2ec..9c24683 100644
--- a/CTCCriterion.lua
+++ b/CTCCriterion.lua
@@ -24,8 +24,8 @@ function CTCCriterion:updateOutput(input, target, sizes)
     assert(sizes,
         "You must pass the size of each sequence in the batch as a tensor")
     local acts = self.acts
+    acts:resizeAs(input):copy(input)
     if input:dim() == 3 then
-        acts:resizeAs(input):copy(input)
         if self.batchFirst then
             acts = acts:transpose(1, 2)
             acts = self:makeContiguous(acts)
@@ -42,7 +42,7 @@ function CTCCriterion:updateOutput(input, target, sizes)
         self.gradInput = self.gradInput:float()
         self.output = sumCosts(cpu_ctc(acts, self.gradInput, target, self.sizes))
     end
-    return self.output
+    return self.output / sizes:size(1)
 end
 
 function CTCCriterion:updateGradInput(input, target)
diff --git a/test/test-all.lua b/test/test-all.lua
index edc69aa..80ed910 100644
--- a/test/test-all.lua
+++ b/test/test-all.lua
@@ -547,7 +547,7 @@ function nnxtest.CTCCriterion()
    }):transpose(1, 2):contiguous()
    local targets = {{1},{3,3},{2,3}}
    local sizes = torch.Tensor({1,3,3})
-   mytester:eq(criterion:updateOutput(acts, targets, sizes), 13.904030799866, precision, "CTCCriterion.batchTest")
+   mytester:eq(criterion:updateOutput(acts, targets, sizes), 13.904030799866 / 3, precision, "CTCCriterion.batchTest")
    local gradOutputNorm = criterion:updateGradInput(acts, targets, sizes)
    criterion = nn.CTCCriterion(true) -- batchFirst true, input is batch x seqLength x inputDim
    local batchFirstActs =
@@ -556,9 +556,17 @@ function nnxtest.CTCCriterion()
       {{1,2,3,4,5},{6,7,8,9,10},{11,12,13,14,15}},
       {{-5,-4,-3,-2,-1},{-10,-9,-8,-7,-6},{-15,-14,-13,-12,-11}}
    })
-   mytester:eq(criterion:updateOutput(batchFirstActs, targets, sizes), 13.904030799866, precision, "CTCCriterion.batchFirstTest")
+   mytester:eq(criterion:updateOutput(batchFirstActs, targets, sizes), 13.904030799866 / 3, precision, "CTCCriterion.batchFirstTest")
    local gradOutputBatchFirst = criterion:updateGradInput(acts, targets, sizes)
    mytester:assertTensorEq(gradOutputBatchFirst:transpose(1, 2), gradOutputNorm, precision, "CTCCriterion.gradCheckTest")
+   torch.Tensor({
+      {0,0,0,0,0},{1,2,3,4,5},{-5,-4,-3,-2,-1},
+      {0,0,0,0,0},{6,7,8,9,10},{-10,-9,-8,-7,-6},
+      {0,0,0,0,0},{11,12,13,14,15},{-15,-14,-13,-12,-11},
+   })
+   mytester:eq(criterion:updateOutput(batchFirstActs, targets, sizes), 13.904030799866 / 3, precision, "CTCCriterion.batchFirstTest")
+   local gradOutputBatchFirst = criterion:updateGradInput(acts, targets, sizes)
+   mytester:assertTensorEq(gradOutputBatchFirst:transpose(1, 2), gradOutputNorm, precision, "CTCCriterion.2DTensorTest")
 end
 
 local function blur(mean, stdv, size)
author	SeanNaren <taz838@hotmail.co.uk>	2016-05-18 10:33:05 +0300
committer	SeanNaren <taz838@hotmail.co.uk>	2016-05-18 10:33:05 +0300
commit	56c8aa664c3979069f8ad93b538daa8672af87bd (patch)
tree	b271b274817e46f757830203317d823fb799be78
parent	73a49c80b5c090230dd1605e20c683cbf04e684e (diff)