From 70adafcae259f67129c2de6e1048594aa0283e59 Mon Sep 17 00:00:00 2001
From: Sergey Zagoruyko <zagoruyko2@gmail.com>
Date: Wed, 13 Apr 2016 15:01:55 +0200
Subject: R5 rebase

---
 test/benchmark.lua | 84 +++++++++++++++++++++++++++++++++++-------------------
 1 file changed, 55 insertions(+), 29 deletions(-)

(limited to 'test')

diff --git a/test/benchmark.lua b/test/benchmark.lua
index 4372502..553e918 100644
--- a/test/benchmark.lua
+++ b/test/benchmark.lua
@@ -1,10 +1,11 @@
 require 'cudnn'
 require 'torch'
 
-function bench(title, nInputC, nOutputC, kH, kW, sH, sW, iH, iW, nBatch, ...)
+function benchSpatial(title, nInputC, nOutputC, kH, kW, sH, sW, iH, iW, nBatch, ...)
    local m1 = cudnn.SpatialConvolution(nInputC,nOutputC,kW,kH, sW, sH):setMode(...):fastest():cuda()
    local i1 = torch.zeros(nBatch, nInputC, iH, iW):cuda()
    local o1 = m1:forward(i1)
+   cutorch.synchronize()
 
    local t1 = torch.Timer()
    local o1 = m1:forward(i1)
@@ -27,47 +28,72 @@ iH = (outH-1)*sH+kH
 
 
 print('CUDNN Version: ', tonumber(cudnn.C.cudnnGetVersion()))
+print("cudnn.SpatialConvolution")
 
 -- just auto-tuned by cudnn with CUDNN_CONVOLUTION_FWD_PREFER_FASTEST mode
-bench('Forward AutoTuned            ', from, to, kH, kW, sH, sW, iH, iW, batchSize)
-
-bench('Forward implicit gemm        ', from, to, kH, kW, sH, sW, iH, iW, batchSize,
-      'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM',
-      'CUDNN_CONVOLUTION_BWD_DATA_ALGO_0',
-      'CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0')
-
-bench('Forward implicit precomp gemm', from, to, kH, kW, sH, sW, iH, iW, batchSize,
-      'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM',
-      'CUDNN_CONVOLUTION_BWD_DATA_ALGO_0',
-      'CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0')
-
-bench('Forward gemm                 ', from, to, kH, kW, sH, sW, iH, iW, batchSize,
-      'CUDNN_CONVOLUTION_FWD_ALGO_GEMM',
-      'CUDNN_CONVOLUTION_BWD_DATA_ALGO_0',
-      'CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0')
 
+for i, mode_desc in ipairs({
+	{'Forward AutoTuned            ', nil},
+	{'Forward implicit gemm        ', 'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM'},
+	{'Forward implicit precomp gemm', 'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM'},
+	{'Forward gemm                 ', 'CUDNN_CONVOLUTION_FWD_ALGO_GEMM'},
+	{'Forward FFT                  ', 'CUDNN_CONVOLUTION_FWD_ALGO_FFT'},
+	{'Forward FFT tiling           ', 'CUDNN_CONVOLUTION_FWD_ALGO_FFT_TILING'},
+--	{'Forward Winograd             ', 'CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD'} -- not supported for this size
+}) do
+   local title = mode_desc[1]
+   local mode = mode_desc[2]
+
+   benchSpatial(title, from, to, kH, kW, sH, sW, iH, iW, batchSize, mode)
+end
 
-bench('Forward FFT                  ', from, to, kH, kW, sH, sW, iH, iW, batchSize,
-      'CUDNN_CONVOLUTION_FWD_ALGO_FFT',
-      'CUDNN_CONVOLUTION_BWD_DATA_ALGO_0',
-      'CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0')
+function benchVolumetric(title, nInputPlane, nOutputPlane, kT, kW, kH, dT, dW, dH, padT, padW, padH, kT_input, kW_input, kH_input, nBatch, ...)
+   local gconv = cudnn.VolumetricConvolution(nInputPlane, nOutputPlane, kT, kW, kH, dT, dW, dH, padT, padW, padH):setMode(...):fastest():cuda()
+   local input = torch.zeros(nBatch, nInputPlane, kT_input, kW_input, kH_input):cuda()
+   local output = gconv:forward(input)
+   cutorch.synchronize()
 
+   local t1 = torch.Timer()
+   local output = gconv:forward(input)
+   cutorch.synchronize()
+   print(title .. ': ', nInputPlane, nOutputPlane, kT, kW, kH, dT, dW, dH, padT, padW, padH, kT_input, kW_input, kH_input, nBatch, t1:time().real)
+end
 
+print("cudnn.VolumetricConvolution")
+
+for i, mode_desc in ipairs({
+	{'Forward AutoTuned            ', nil},
+	{'Forward implicit gemm        ', 'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM'},
+	{'Forward implicit precomp gemm', 'CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM'},
+--	{'Forward gemm                 ', 'CUDNN_CONVOLUTION_FWD_ALGO_GEMM'}, -- not supported for this size
+--	{'Forward FFT                  ', 'CUDNN_CONVOLUTION_FWD_ALGO_FFT'}, -- not supported for this size
+	{'Forward FFT tiling           ', 'CUDNN_CONVOLUTION_FWD_ALGO_FFT_TILING'},
+--	{'Forward Winograd             ', 'CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD'} -- not supported for this size
+}) do
+   local title = mode_desc[1]
+   local mode = mode_desc[2]
+
+    benchVolumetric(title, 256, 256,  3,3,3,  1,1,1, 1,1,1,  8,  28,  28, 50, mode)
+end
 
 -- For reference, CuDNN Convolution modes
 --[[
     CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM         = 0,
     CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM = 1,
     CUDNN_CONVOLUTION_FWD_ALGO_GEMM                  = 2,
-    CUDNN_CONVOLUTION_FWD_ALGO_DIRECT                = 3, // Placeholder
-    CUDNN_CONVOLUTION_FWD_ALGO_FFT                   = 4
+    CUDNN_CONVOLUTION_FWD_ALGO_DIRECT                = 3,
+    CUDNN_CONVOLUTION_FWD_ALGO_FFT                   = 4,
+    CUDNN_CONVOLUTION_FWD_ALGO_FFT_TILING            = 5,
+    CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD              = 6
 
     CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0         = 0,  // non-deterministic
     CUDNN_CONVOLUTION_BWD_FILTER_ALGO_1         = 1,
-    CUDNN_CONVOLUTION_BWD_FILTER_ALGO_FFT       = 2
-
-    CUDNN_CONVOLUTION_BWD_DATA_ALGO_0         = 0, // non-deterministic
-    CUDNN_CONVOLUTION_BWD_DATA_ALGO_1         = 1,
-    CUDNN_CONVOLUTION_BWD_DATA_ALGO_FFT       = 2,
-
+    CUDNN_CONVOLUTION_BWD_FILTER_ALGO_FFT       = 2,
+    CUDNN_CONVOLUTION_BWD_FILTER_ALGO_3         = 3   // non-deterministic, algo0 with workspace
+
+    CUDNN_CONVOLUTION_BWD_DATA_ALGO_0          = 0, // non-deterministic
+    CUDNN_CONVOLUTION_BWD_DATA_ALGO_1          = 1,
+    CUDNN_CONVOLUTION_BWD_DATA_ALGO_FFT        = 2,
+    CUDNN_CONVOLUTION_BWD_DATA_ALGO_FFT_TILING = 3,
+    CUDNN_CONVOLUTION_BWD_DATA_ALGO_WINOGRAD   = 4
     ]]--
-- 
cgit v1.2.3