Creating Autotuner initializer for one-time initializations

1f56a693 · Hashim Sharif · 899bdc22 · 1f56a693 · 1f56a693 · 1f56a693
Commit 1f56a693 authored 5 years ago by Hashim Sharif
--- a/llvm/projects/hpvm-tensor-rt/tensor_runtime/include/approx_simulation.h
+++ b/llvm/projects/hpvm-tensor-rt/tensor_runtime/include/approx_simulation.h
+void initializeAutotuner();
--- a/llvm/projects/hpvm-tensor-rt/tensor_runtime/src/approx_simulation.cu
+++ b/llvm/projects/hpvm-tensor-rt/tensor_runtime/src/approx_simulation.cu
@@ -21,6 +21,15 @@
 #include "device_math.h"
 //N is new_data's size
 //n, c, h, w are the dimensions of new_data
 __global__
@@ -717,7 +726,6 @@ int getSwing(int swing){
 class PerfParams{
 public:
@@ -857,6 +865,7 @@ public:
 };
 class RedSampParams {
@@ -905,8 +914,18 @@ RedSampParams getRedSampParams(int swing) {
 bool FP16_tuning = false;
 /***** API for Autotuner Use - Not the ApproxHPVM Wrapper API */
+PerfParamSet* perfParamSet;  
+SampParamSet* sampParamSet;
+void initializeAutotuner(){
+  sampParamSet = new SampParamSet;
+  perfParamSet = new PerfParamSet;  
+}
 void* Autotuner_SampConv(void* input, float i_min, float i_max,
@@ -919,8 +938,7 @@ void* Autotuner_SampConv(void* input, float i_min, float i_max,
 			 float out_min, float out_max, int swing){
-  SampParamSet* paramSet = new SampParamSet;
+  SampParams params = sampParamSet->getSampParams(swing);
-  SampParams params = paramSet->getSampParams(swing);
  DEBUG("params.skip_rate = %d, params.skip_offset = %d \n",
 	params.skip_rate, params.skip_offset);
@@ -969,8 +987,7 @@ void* Autotuner_PerforatedConv(void* input, float i_min, float i_max,
 			       float out_min, float out_max, int swing){ 
-  PerfParamSet* paramSet = new PerfParamSet;  
+  PerfParams params = perfParamSet->getPerfParams(swing);
-  PerfParams params = paramSet->getPerfParams(swing);
  DEBUG("params.row = %d, params.col = %d, params.skip_offset = %d \n",
 	params.row, params.col, params.skip_offset);

--- a/llvm/projects/hpvm-tensor-rt/tensor_runtime/src/tensor_runtime.cu
+++ b/llvm/projects/hpvm-tensor-rt/tensor_runtime/src/tensor_runtime.cu
@@ -43,6 +43,7 @@
 #include "tensor.h"
 #include "op_overheads.h"
 #include "half_precision_api.h"
+#include "approx_simulation.h"
 //** Potential Improvements:
 //   1) Add support for dataypes beyond floats and half 
@@ -65,6 +66,8 @@ void llvm_hpvm_initTensorRt(int gpuid){
 #ifdef PROMISE_TUNER_ENABLED
    //    readOpenTunerFlags("opentuner_flags");
    readOpenTunerFlags("promise_flags");
+    initializeAutotuner();
 #endif
@@ -571,7 +574,7 @@ void* tensorConvolution(void* input_ptr, void* filter_ptr,
  op_counter++;
  #endif
  return output;
 }
@@ -608,7 +611,8 @@ void* tensorPooling(void* input_ptr,
  int w = (input->dims.dim_sizes[3] + (2 * horizontal_pad) - window_width) / horizontal_stride;
  w = w + 1;
-  DEBUG("n = %d, c = %d, h = %d, w = %d \n", n, c, h, w);
+  DEBUG("n = %d, c = %d, h = %d, w = %d , dim1 = %d , dim2 = %d \n",
+	n, c, h, w, input->dims.dim_sizes[2], input->dims.dim_sizes[3]);
  // FIXIT: Don't be specific to floats
  Tensor* output = (Tensor*) create4DTensor(CUDNN_DATA_FLOAT, CUDNN_TENSOR_NCHW, n, c, h, w);