JuliaOptimalTransport · davibarreira · Jun 2, 2021 · Jun 2, 2021 · Jun 2, 2021 · Jun 2, 2021
diff --git a/Project.toml b/Project.toml
@@ -35,6 +35,7 @@ Random = "9a3f8284-a2c9-5f02-9a11-845980a1fd5c"
 SafeTestsets = "1bc83da4-3b8d-516f-aca4-4fe02f6d838f"
 Test = "8dfed614-e22c-5e08-85e1-65c5234f0b40"
 Tulip = "6dd1b50a-3aae-11e9-10b5-ef983d2400fa"
+PyCall = "438e738f-606a-5dbb-bf0a-cddfbfd45ab0"
 
 [targets]
 test = ["ForwardDiff", "Pkg", "PythonOT", "Random", "SafeTestsets", "Test", "Tulip", "HCubature"]
diff --git a/docs/src/index.md b/docs/src/index.md
@@ -24,6 +24,7 @@ sinkhorn2
 sinkhorn_stabilized_epsscaling
 sinkhorn_stabilized
 sinkhorn_barycenter
+sinkhorn_divergence
 ```
 
 ## Unbalanced optimal transport

diff --git a/src/OptimalTransport.jl b/src/OptimalTransport.jl
@@ -4,6 +4,7 @@
 
 module OptimalTransport
 
+using LinearAlgebra: AbstractMatrix
 using Distances
 using LinearAlgebra
 using IterativeSolvers, SparseArrays
@@ -14,7 +15,7 @@ using PDMats
 using QuadGK
 using StatsBase: StatsBase
 
-export sinkhorn, sinkhorn2
+export sinkhorn, sinkhorn2, sinkhorn_divergence
 export emd, emd2
 export sinkhorn_stabilized, sinkhorn_stabilized_epsscaling, sinkhorn_barycenter
 export sinkhorn_unbalanced, sinkhorn_unbalanced2

diff --git a/src/entropic/sinkhorn.jl b/src/entropic/sinkhorn.jl
@@ -504,3 +504,85 @@ function sinkhorn_barycenter(μ, C, ε, w; tol=1e-9, check_marginal_step=10, max
     end
     return u[:, 1] .* (K * v[:, 1])
 end
+
+"""
+    sinkhorn_divergence(
+        c,
+        μ::Union{FiniteDiscreteMeasure, DiscreteNonParametric},
+        ν::Union{FiniteDiscreteMeasure, DiscreteNonParametric},
+        ε; regularization=false, plan=nothing, kwargs...
+    )
+
+Compute the Sinkhorn Divergence between finite discrete
+measures `μ` and `ν` with respect to a cost function `c`
+and entropic regularization parameter `ε`.
+
+A pre-computed optimal transport `plan` between `μ` and `ν` may be provided.
+
+The Sinkhorn Divergence is computed as:
+```math
+\\operatorname{S}_{c,ε}(μ,ν) := \\operatorname{OT}_{c,ε}(μ,ν)
+- \\frac{1}{2}(\\operatorname{OT}_{c,ε}(μ,μ) + \\operatorname{OT}_{c,ε}(ν,ν)),
+```
+where ``\\operatorname{OT}_{c,ε}(μ,ν)``, ``\\operatorname{OT}_{c,ε}(μ,μ)`` and
+``\\operatorname{OT}_{c,ε}(ν,ν)`` are the entropically regularized optimal transport cost
+between `(μ,ν)`, `(μ,μ)` and `(ν,ν)`, respectively.
+
+The formulation for the Sinkhorn Divergence may have slight variations depending on the paper consulted.
+The Sinkhorn Divergence was initially proposed by [^GPC18], although, this package uses the formulation given by
+[^FeydyP19], which is also the one used on the Python Optimal Transport package.
+
+[^GPC18]: Aude Genevay, Gabriel Peyré, Marco Cuturi, Learning Generative Models with Sinkhorn Divergences,
+Proceedings of the Twenty-First International Conference on Artficial Intelligence and Statistics, (AISTATS) 21, 2018
+
+[^FeydyP19]: Jean Feydy, Thibault Séjourné, François-Xavier Vialard, Shun-ichi
+Amari, Alain Trouvé, and Gabriel Peyré. Interpolating between op-
+timal transport and mmd using sinkhorn divergences. In The 22nd In-
+ternational Conference on Artificial Intelligence and Statistics, pages
+2681–2690. PMLR, 2019.
+
+See also: [`sinkhorn2`](@ref)
+"""
+function sinkhorn_divergence(
+    c, μ::T, ν::T, ε; regularization=nothing, plan=nothing, kwargs...
+) where {T<:Union{FiniteDiscreteMeasure,DiscreteNonParametric}}
+    return sinkhorn_divergence(
+        pairwise(c, μ.support, ν.support),
+        pairwise(c, μ.support),
+        pairwise(c, ν.support),
+        μ,
+        ν,
+        ε;
+        regularization=regularization,
+        kwargs...,
+    )
+end
+
+"""
+    sinkhorn_divergence(
+        Cμν, Cμμ, Cνν,
+        μ::Union{FiniteDiscreteMeasure, DiscreteNonParametric},
+        ν::Union{FiniteDiscreteMeasure, DiscreteNonParametric},
+        ε; regularization=false, plan=nothing, kwargs...
+    )
+
+Compute the Sinkhorn Divergence between finite discrete
+measures `μ` and `ν` with respect to the precomputed cost matrices `Cμν`,
+`Cμμ` and `Cνν`, and entropic regularization parameter `ε`.
+
+A pre-computed optimal transport `plan` between `μ` and `ν` may be provided.
+
+See also: [`sinkhorn2`](@ref)
+"""
+function sinkhorn_divergence(
+    Cμν, Cμ, Cν, μ::T, ν::T, ε; regularization=nothing, plan=nothing, kwargs...
+) where {T<:Union{FiniteDiscreteMeasure,DiscreteNonParametric}}
+    if regularization !== nothing
+        @warn "`sinkhorn_divergence` does not support the `regularization` keyword argument"
+    end
+
+    OTμν = sinkhorn2(μ.p, ν.p, Cμν, ε; plan=plan, regularization=false, kwargs...)
+    OTμ = sinkhorn2(μ.p, μ.p, Cμ, ε; plan=nothing, regularization=false, kwargs...)
+    OTν = sinkhorn2(ν.p, ν.p, Cν, ε; plan=nothing, regularization=false, kwargs...)
+    return max(0, OTμν - (OTμ + OTν) / 2)
+end
diff --git a/test/entropic/sinkhorn.jl b/test/entropic/sinkhorn.jl
@@ -4,6 +4,7 @@ using Distances
 using ForwardDiff
 using LogExpFunctions
 using PythonOT: PythonOT
+using Distributions
 
 using LinearAlgebra
 using Random
@@ -195,4 +196,93 @@ Random.seed!(100)
             @test μ_interp ≈ μ_interp_pot rtol = 1e-6
         end
     end
+
+    @testset "sinkhorn divergence" begin
+        @testset "univariate exmaples" begin
+            # create distributions 
+            n = 20
+            m = 10
+            μsupp = [rand(1) for i in 1:n]
+            νsupp = [rand(1) for i in 1:m]
+            μprobs = normalize!(rand(n), 1)
+            μ = OptimalTransport.discretemeasure(μsupp, μprobs)
+            ν = OptimalTransport.discretemeasure(νsupp)
+
+            for (ε, metrics) in Iterators.product(
+                [0.1, 1.0, 10.0],
+                [
+                    (sqeuclidean, SqEuclidean()),
+                    (euclidean, Euclidean()),
+                    (totalvariation, TotalVariation()),
+                ],
+            )
+                for metric in metrics
+                    @test sinkhorn_divergence(metric, μ, μ, ε) ≈ 0.0
+                    @test sinkhorn_divergence(metric, ν, ν, ε) ≈ 0.0
+
+                    sd_c = sinkhorn_divergence(metric, μ, ν, ε)
+
+                    # calculating cost matrices to use in POT.sinkhorn2
+                    Cμν = pairwise(metric, μ.support, ν.support)
+                    Cμ = pairwise(metric, μ.support)
+                    Cν = pairwise(metric, ν.support)
+
+                    sd_C = sinkhorn_divergence(Cμν, Cμ, Cν, μ, ν, ε)
+
+                    # the empirical_sinkhorn_divergence returns an error if the weights are not all equal
+                    # so instead, it's more realiable to calculate using sinkhorn2
+                    sd_pot =
+                        POT.sinkhorn2(μ.p, ν.p, Cμν, ε) -
+                        (POT.sinkhorn2(μ.p, μ.p, Cμ, ε) + POT.sinkhorn2(ν.p, ν.p, Cν, ε)) /
+                        2
+
+                    @test sd_c ≈ sd_pot[1]
+                    @test sd_C ≈ sd_pot[1]
+                end
+            end
+        end
+        @testset "multivariate exmaples" begin
+            # create distributions 
+            n = 20
+            m = 10
+            μsupp = [rand(3) for i in 1:n]
+            νsupp = [rand(3) for i in 1:m]
+            μprobs = normalize!(rand(n), 1)
+            μ = OptimalTransport.discretemeasure(μsupp, μprobs)
+            ν = OptimalTransport.discretemeasure(νsupp)
+
+            for (ε, metrics) in Iterators.product(
+                [0.1, 1.0, 10.0],
+                [
+                    (sqeuclidean, SqEuclidean()),
+                    (euclidean, Euclidean()),
+                    (totalvariation, TotalVariation()),
+                ],
+            )
+                for metric in metrics
+                    @test sinkhorn_divergence(metric, μ, μ, ε) ≈ 0.0
+                    @test sinkhorn_divergence(metric, ν, ν, ε) ≈ 0.0
+
+                    sd_c = sinkhorn_divergence(metric, μ, ν, ε)
+
+                    # calculating cost matrices to use in POT.sinkhorn2
+                    Cμν = pairwise(metric, μ.support, ν.support)
+                    Cμ = pairwise(metric, μ.support)
+                    Cν = pairwise(metric, ν.support)
+
+                    sd_C = sinkhorn_divergence(Cμν, Cμ, Cν, μ, ν, ε)
+
+                    # the empirical_sinkhorn_divergence returns an error if the weights are not all equal
+                    # so instead, it's more realiable to calculate using sinkhorn2
+                    sd_pot =
+                        POT.sinkhorn2(μ.p, ν.p, Cμν, ε) -
+                        (POT.sinkhorn2(μ.p, μ.p, Cμ, ε) + POT.sinkhorn2(ν.p, ν.p, Cν, ε)) /
+                        2
+
+                    @test sd_c ≈ sd_pot[1]
+                    @test sd_C ≈ sd_pot[1]
+                end
+            end
+        end
+    end
 end
diff --git a/test/finitediscretemeasure.jl b/test/finitediscretemeasure.jl
@@ -0,0 +1,55 @@
+using Distributions: DiscreteNonParametric
+using OptimalTransport
+using Distributions
+using Random
+
+Random.seed!(100)
+
+@testset "finitediscretemeasure.jl" begin
+    @testset "Univariate Finite Discrete Measure" begin
+        n = 100
+        μsupp = rand(n)
+        νsupp = rand(n, 1)
+        μ = FiniteDiscreteMeasure(μsupp)
+        ν = FiniteDiscreteMeasure(νsupp, rand(n))
+        # check if it assigns equal probabilities to all entries
+        @test μ.p ≈ ones(n) ./ n
+        @test probs(μ) ≈ ones(n) ./ n
+        # check if it probabilities sum to 1
+        @test sum(ν.p) ≈ 1
+        @test sum(probs(ν)) ≈ 1
+        # check if probabilities are all positive (non-negative)
+        @test all(ν.p .>= 0)
+        @test all(probs(ν) .>= 0)
+        # check if it assigns to DiscreteNonParametric when Vector/Matrix is 1D
+        @test typeof(μ) <: DiscreteNonParametric
+        @test typeof(ν) <: DiscreteNonParametric
+        # check if support is correctly assinged
+        @test sort(μsupp) == μ.support
+        @test sort(μsupp) == support(μ)
+        @test sort(vec(νsupp)) == ν.support
+        @test sort(vec(νsupp)) == support(ν)
+    end
+    @testset "Multivariate Finite Discrete Measure" begin
+        n = 10
+        m = 3
+        μsupp = rand(n, m)
+        νsupp = rand(n, m)
+        μ = FiniteDiscreteMeasure(μsupp)
+        ν = FiniteDiscreteMeasure(νsupp, rand(n))
+        # check if it assigns equal probabilities to all entries
+        @test μ.p ≈ ones(n) ./ n
+        @test probs(μ) ≈ ones(n) ./ n
+        # check if it probabilities sum to 1
+        @test sum(ν.p) ≈ 1
+        @test sum(probs(ν)) ≈ 1
+        # check if probabilities are all positive (non-negative)
+        @test all(ν.p .>= 0)
+        @test all(probs(ν) .>= 0)
+        # check if support is correctly assinged
+        @test μsupp == μ.support
+        @test μsupp == support(μ)
+        @test νsupp == ν.support
+        @test νsupp == support(ν)
+    end
+end
diff --git a/test/runtests.jl b/test/runtests.jl
@@ -1,3 +1,4 @@
+using LinearAlgebra: symmetric
 using OptimalTransport
 using Pkg: Pkg
 using SafeTestsets