refine codes

QiJune · QiJune · commit 7822c86ef4e4 · 2017-05-22T16:36:41.000+08:00
diff --git a/cmake/generic.cmake b/cmake/generic.cmake
@@ -45,10 +45,6 @@ function(cc_library TARGET_NAME)
   else()
     add_library(${TARGET_NAME} STATIC ${cc_library_SRCS})
   endif()
-  if(cc_library_DEPS)
-    target_link_libraries(${TARGET_NAME} ${cc_library_DEPS})
-    add_dependencies(${TARGET_NAME} ${cc_library_DEPS} ${external_project_dependencies})
-  endif()
 endfunction(cc_library)
 
 # cc_binary parses tensor.cc and figures out that target also depend on tensor.h.
diff --git a/paddle/majel/CMakeLists.txt b/paddle/majel/CMakeLists.txt
@@ -1,6 +1,7 @@
 cc_library(place SRCS place.cc)
 cc_library(ddim SRCS ddim.cc)
-cc_library(allocation SRCS allocation.cc malloc.cc default_allocator.cc DEPS place)
+cc_library(malloc SRCS malloc.cc)
+cc_library(allocation SRCS allocation.cc)
 
 if(WITH_TESTING)
     add_subdirectory(test)
diff --git a/paddle/majel/default_allocator.cc b/paddle/majel/default_allocator.cc
diff --git a/paddle/majel/default_allocator.h b/paddle/majel/default_allocator.h
diff --git a/paddle/majel/malloc.cc b/paddle/majel/malloc.cc
@@ -1,13 +1,120 @@
 #include "malloc.h"
-#include "default_allocator.h"
+#include <glog/logging.h>
 
 #ifndef PADDLE_ONLY_CPU
 #include <cuda.h>
 #endif
 
+#define CHECK_CUDA(cudaFunc)                               \
+  do {                                                     \
+    cudaError_t cudaStat = cudaFunc;                       \
+    CHECK_EQ(cudaSuccess, cudaStat)                        \
+        << "Cuda Error: " << cudaGetErrorString(cudaStat); \
+  } while (0)
+
 namespace majel {
 namespace malloc {
+namespace detail {
+class DefaultAllocator {
+public:
+  static void* malloc(majel::Place place, size_t size);
+
+  static void free(majel::Place, void* ptr);
+};
+
+class DefaultAllocatorMallocVisitor : public boost::static_visitor<void*> {
+public:
+  DefaultAllocatorMallocVisitor(size_t size) : size_(size) {}
+
+  void* operator()(majel::CpuPlace p) {
+    void* address;
+    CHECK_EQ(posix_memalign(&address, 32ul, size_), 0);
+    CHECK(address) << "Fail to allocate CPU memory: size=" << size_;
+    return address;
+  }
+
+#ifndef PADDLE_ONLY_CPU
+  void* operator()(majel::GpuPlace p) {
+    void* address = hl_malloc_device(size_);
+    CHECK(address) << "Fail to allocate GPU memory " << size_ << " bytes";
+    return address;
+  }
+#else
+  void* operator()(majel::GpuPlace p) {
+    CHECK(majel::is_cpu_place(p)) << "GPU Place not supported";
+    return nullptr;
+  }
+#endif
+
+private:
+  size_t size_;
+};
+
+class DefaultAllocatorFreeVisitor : public boost::static_visitor<void> {
+public:
+  DefaultAllocatorFreeVisitor(void* ptr) : ptr_(ptr) {}
+  void operator()(majel::CpuPlace p) {
+    if (ptr_) {
+      ::free(ptr_);
+    }
+  }
+
+#ifndef PADDLE_ONLY_CPU
+  void operator()(majel::GpuPlace p) {
+    if (ptr_) {
+      hl_free_mem_device(ptr_);
+    }
+  }
+
+#else
+  void operator()(majel::GpuPlace p) {
+    CHECK(majel::is_cpu_place(p)) << "GPU Place not supported";
+  }
+#endif
+
+private:
+  void* ptr_;
+};
+
+void* DefaultAllocator::malloc(majel::Place place, size_t size) {
+  DefaultAllocatorMallocVisitor visitor(size);
+  return boost::apply_visitor(visitor, place);
+}
 
+void DefaultAllocator::free(majel::Place place, void* ptr) {
+  DefaultAllocatorFreeVisitor visitor(ptr);
+  boost::apply_visitor(visitor, place);
+}
+
+}  // namespace detail
+
+#ifndef PADDLE_ONLY_CPU
+void* hl_malloc_device(size_t size) {
+  void* dest_d;
+
+  CHECK(size) << __func__ << ": the size for device memory is 0, please check.";
+  CHECK_CUDA(cudaMalloc((void**)&dest_d, size));
+
+  return dest_d;
+}
+
+void hl_free_mem_device(void* dest_d) {
+  CHECK_NOTNULL(dest_d);
+
+  cudaError_t err = cudaFree(dest_d);
+  CHECK(cudaSuccess == err || cudaErrorCudartUnloading == err)
+      << hl_get_device_error_string();
+}
+
+const char* hl_get_device_error_string() {
+  cudaError_t err = cudaGetLastError();
+  return cudaGetErrorString(err);
+}
+
+const char* hl_get_device_error_string(size_t err) {
+  return cudaGetErrorString((cudaError_t)err);
+}
+#endif
 void* malloc(majel::Place place, size_t size) {
   return detail::DefaultAllocator::malloc(place, size);
 }
diff --git a/paddle/majel/test/CMakeLists.txt b/paddle/majel/test/CMakeLists.txt
@@ -8,7 +8,7 @@ cc_test(ddim_test
 
 cc_test(allocation_test
     SRCS allocation_test.cc
-    DEPS allocation)
+    DEPS place malloc allocation)
 
 if(WITH_GPU)
     nv_test(cuda_test SRCS cuda_test.cu)