[GPU] clean oneDNN cache by release memory method (#27403)

### Details: - Partial fix for https://jira.devtools.intel.com/browse/CVS-156022 - explicit call for release memory is required ### Tickets: - *ticket-id*
openvinotoolkit · Nov 5, 2024 · 7cf2bbb · 7cf2bbb
1 parent 41b2093
commit 7cf2bbb
Show file tree

Hide file tree

Showing 2 changed files with 10 additions and 0 deletions.
diff --git a/src/plugins/intel_gpu/include/intel_gpu/plugin/compiled_model.hpp b/src/plugins/intel_gpu/include/intel_gpu/plugin/compiled_model.hpp
@@ -61,6 +61,8 @@ class CompiledModel : public ov::ICompiledModel {
     const std::vector<std::shared_ptr<Graph>>& get_graphs() const;
     std::shared_ptr<Graph> get_graph(size_t n) const;
 
+    void release_memory() override;
+
 private:
     RemoteContextImpl::Ptr m_context;
     ExecutionConfig m_config;

diff --git a/src/plugins/intel_gpu/src/plugin/compiled_model.cpp b/src/plugins/intel_gpu/src/plugin/compiled_model.cpp
@@ -293,5 +293,13 @@ std::shared_ptr<ov::ISyncInferRequest> CompiledModel::create_sync_infer_request(
     return std::make_shared<SyncInferRequest>(std::static_pointer_cast<const CompiledModel>(shared_from_this()));
 }
 
+
+void CompiledModel::release_memory() {
+#ifdef ENABLE_ONEDNN_FOR_GPU
+    auto capacity = dnnl::get_primitive_cache_capacity();
+    dnnl::set_primitive_cache_capacity(0);
+    dnnl::set_primitive_cache_capacity(capacity);
+#endif
+}
 }  // namespace intel_gpu
 }  // namespace ov