【最优传输二十九】Wasserstein Barycenterand Its Application to Texture Mixing

motivation

本文提出了离散概率分布的平均作为Monge-Kantorovich最优传输空间重心的新定义。为了克服数值求解这类问题所涉及的时间复杂性,原始的Wasserstein度量被一维分布上的切片近似所取代。这使我们能够引入一种新的快速梯度下降算法来计算点云的Wasserstein质心。

这个概率重心的新概念可能会在计算机视觉中找到应用,在那里人们想要平均定义为分布的特征。我们展示了纹理合成和混合的应用,其中纹理的特征是对多尺度定向滤波器组的响应分布。这就提供了一种简单的方法来导航颜色纹理的凸域。

1.introduce

本文考虑了Monge-Kantorovich最优输运理论[1]在图像合成中的应用。自Rubner等人[2]的开创性工作以来,最优运输成本已被广泛用作比较直方图特征的度量,通常被称为“地球移动者的距离”。这里研究的另一个有趣的方面是运输映射本身。事实上,它允许各种图像修改,例如颜色转移[3],纹理映射[4],或视频的对比度均衡[5](如其他应用[6])。

这项工作的主要理论贡献是引入了Monge-Kantorovich空间中统计分布重心的新定义。我们还提出了一个近似的定义,更适合于依赖于一维投影的数值计算。然后引入牛顿梯度下降算法来计算相应的Wasserstein质心。本文的最后一个贡献是颜色纹理统计合成的一般框架,它包含了几个现有的纹理模型作为特殊情况。这个通用框架,连同Wasserstein质心计算,允许执行颜色纹理混合。

2. Wasserstein距离及其近似

本文考虑在\mathbb{R}^{d}中离散密度分布,用点云X=\left \{ X_{i} \right \}_{i\in I}, I=\left \{ 1,...,N \right \}是点索引的列表。由于X的任何排列都对应于相同的分布,因此需要考虑度量:

其中\Sigma _{N}为N个元素的所有排列的集合。本文提出的方法可以推广到加权点云和密度在\mathbb{R}^{d}上连续定义。

2.1 Wasserstein Distance

定义两个相同大小\left | I \right |=N的点云之间的二次Wasserstein距离W_{2}(X,Y),为:

本方法可以推广到任意严格凸距离,如对于p > 1, \left \| X_{i}-Y_{\sigma (i)} \right \|^{p}。可以证明W_{p}在离散分布集合上定义了一个度量[X]。

线性规划公式。计算这个距离需要计算最小化W_{\sigma }(X,Y) in(2)的最优分配i \mapsto \sigma ^{\star }(i)。可以将这个问题重新定义为一个线性规划问题:

其中P_{N}为双随机矩阵的集合,即行和列之和为1的非负矩阵。问题(3)可以用标准线性规划算法和更专用的方法在O(N^{2.5}\log (N))次操作中解决(参见[28])。

一维的情况。d = 1有一些特殊的结构,允许更快的解决方案。事实上,如果用\sigma _{X}\sigma _{Y}表示点的排列顺序

最优排列\sigma ^{\star }使公式(2)最小化

使得点X_{\sigma _{X}(i)}分配给点X_{\sigma _{Y}(i)}。因此,使用快速排序算法,可以在O(N\log (N))次操作中计算出Wasserstein距离和最优分配。

2.2 Sliced Wasserstein Distance

然而,Wasserstein距离W2的计算对于我们所想到的图像处理应用程序来说计算要求太高,其中N可能相当大。此外,在涉及Wasserstein距离函数的点云优化问题中,W2太难处理。

由于这些原因,我们现在考虑一种分布之间的替代度量,它基于一维投影之间的运输成本。我们用SW_{2}表示切片Wasserstein距离,它定义为投影点云之间的一维二次瓦瑟斯坦距离之和

其中\Omega =\left \{ \theta \in \mathbb{R}^{d}\setminus \left \| \theta \right \| =1\right \}是单位球。切片Wasserstein距离允许我们使用一维分配的特殊情况,这种情况可以使用(5)以封闭形式轻松解决。

3 Barycenter in Wasserstein Space

3.1 Wasserstein Barycenter

给定一个点云族Y=\left \{ Y^{j} \right \}_{j\in J},我们感兴趣的是计算一个加权平均点云X^{\star },即通过类比欧几里得设置来定义为问题(B)的最小值。

\left \{ \rho _{j}\geqslant 0 \right \}_{j\in J}是一个权值的集合,它被约束满足\sum _{j}\rho _{j}=1

除了正态分布的特殊情况[30]外,这个问题没有已知的封闭形式解(7)。与我们的工作不同,Agueh和Carlier对这个问题进行了数学分析[31]。它们证明了连续分布的解和对偶公式的存在性。

一维的情况。在一维情况下,Wasserstein重心可以用O(N\log (N))次运算来计算,使用排列\sigma _{Y^{j}},将值Y^{j}\subset \mathbb{R}的集合排序,如(4)所示。然后重心读取

切片Wasserstein重心。如果考虑任意密度(不一定是固定数目N个点的云,甚至不一定是离散的云)上的问题(B), Agueh和Carlier在[31]中证明,可以通过求解线性问题来找到质心。可以证明,如果N个离散点支持Y的密度,则质心最多支持N^{\left | J \right |}个点。这种方法的困难在于计算时间是N^{\left | J \right |}的多项式,这对于成像应用来说是禁止的,并且存在重心解的基数的组合爆炸。

此外,问题(B)对点云(式(7))的限制可以归结为一个多任务问题,不幸的是,这个问题是NP-hard。

为了同时解决这两个问题,我们定义一个近似于原质心的“切片Wasserstein质心”

注意到,SEY的最小化很容易,并且与度量集Y=\left \{ Y^{j} \right \}_{j\in J}具有相同维度的点云的期望属性。在实践中,如第3.2节所述,通过执行该能量的梯度下降,可以快速计算出近似质心,从而得到局部最小值。

3.2 Gradient Descent Algorithm

通过最小化(8)找到重心对应于非凸泛函的最小化。该能量用有限的ω方向集进行离散,其中|ω| > d。在数值实验中,我们使用从\mathbb{R}^{d}的单位球上的均匀分布中得到的随机方向。

用梯度下降算法可以找到该泛函的一个平稳点。

牛顿梯度下降法。该算法从某个初始点云X^{\left ( 0 \right )}\subset \mathbb{R}^{d}开始,该点云可以选择为任意云Y^{j},  k = 0。在每次迭代k时,点云X^{(k)}以以下牛顿下降步长更新:

其中\triangledown SE_{Y_{\theta }}(X^{(k)})SE_{Y_{\theta }}在点X^{(k)}处的梯度,H∈Rd×d为Hessian矩阵,η > 0为固定步长。H^{-1}是Hessian矩阵的逆,它是可逆的,因为我们选择了ω s.t。|ω| > d。

梯度计算。对于每个θ∈ω,计算梯度\triangledown SE_{Y_{\theta }}(X^{(k)})要求对于每个j∈J,计算最优的1-D分配\sigma_{\theta }^{j}

通过对X_{\theta }^{(k)}Y_{\theta }^{j}的值进行排序,需要O(N\log (N))次操作来详细计算(5)。

梯度的每个元素i可以表示为

Hessian矩阵

观察到Hessian矩阵与点X无关,因此可以预先计算。

3.3 计算分布上的投影

在许多应用中,人们不仅对计算Wasserstein距离W_{2 }(X,Y)感兴趣,而且对最优排列\sigma ^{\star }使W_{\sigma }(X,Y) in(2)最小化。这种最优排列允许计算正交投影

其中,与Y表示相同统计分布的所有点云的集合[Y]定义于(1)。

切片投影。还可以观察到,在初始化X^{(0)}:=Y^{1},权值为{ρ1 = 0, ρ2 = 1}的两个分布(|J| = 2)的特殊情况下,我们的算法类似于[29]中提出的计算点云Y^{1}Y^{2}上的近似投影(即近似最优分配)的原始算法。唯一不同的是,如[29]所述,我们使用了随机梯度下降(即在每次迭代k时使用随机的方向集\omega _{k}\in \Omega)。需要指出的是,当考虑到我们的质心能量时,这种梯度下降策略并不稳定。

因此,我们将的切片投影定义为X^{\left ( k \right )}收敛的点云X^{\left (\propto \right )}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/606444.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Cesium 问题:billboard 加载未出来

文章目录 问题分析问题 接上篇 Cesium 展示——图标的依比例和不依比例缩放,使用加载 billboard 时,怀疑是路径的原因导致未加载成功 分析 原先

初步了解Kubernetes

目录 1. K8S概述 1.1 K8S是什么 1.2 作用 1.3 由来 1.4 含义 1.5 相关网站 2. 为什么要用K8S 3. K8S解决的问题 4. K8S的特性 5. Kubernetes集群架构与组件 6. 核心组件 6.1 Master组件 6.1.1 Kube-apiserver 6.1.2 Kube-controller-manager 6.1.3 kube-schedul…

算法学习008-登山爬石梯 c++动态规划/递归算法实现 中小学算法思维学习 信奥算法解析

目录 C登山爬石梯 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 七、推荐资料 C登山爬石梯 一、题目要求 1、编程实现 小明周末和朋友约好了一起去爬山,来到山下,发现登山道是…

【问题实操】银河高级服务器操作系统实例分享,开机之后反复重启

1.服务器环境以及配置 物理机/虚拟机/云/容器 物理机 外网/私有网络/无网络 私有网络 处理器: PHYTIUM FT2000PLUS 2200 MHz 内存: 128 GiB 整机类型/架构: HIKVISION DS-V BIOS版本: HK 601FBE02HK 网卡&#xff1…

VTK数据的读写--Vtk学习记录1--《VTK图形图像开发进阶》

读和写操作是VTK可视化管线两端相关的类--Reader和Writer类 Reader:将外部数据读入可视化管线,主要步骤如下 s1:实例化Reader对象 s2:指定所要读取的文件名 s3:调用Update()促使管线执行 对应的Writer: s1:实例化Writer对象 s2输入要写的数据以及指定写入的文…

实习报告怎么写?笔灵AI实习体验报告模版分享:AI产品前端实习生

实习报告怎么写?笔灵AI实习体验报告模版可以帮你 点击即可使用:https://ibiling.cn/scene/inex?fromcsdnsx 下面分享AI产品前端实习生的实习报告 尊敬的导师和领导们:首先,我想对你们表达我的诚挚感谢,感谢你们给我…

暗区突围国际服pc端海外版如何快速致富 暗区突围pc端怎么赚钱

暗区突围是一款由腾讯魔方工作室研发的高拟真硬核射击手游,以现代战争为游戏题材,采用了全新的u3d引擎打造,整体游戏画风逼真写实,搭配上优秀的射击玩法,辅以史诗级的背景配乐,致力于带给玩家无与伦比的枪战…

“漫画之家”|基于Springboot+vue的“漫画之家”系统(源码+数据库+文档)

“漫画之家”系统 目录 基于Springbootvue的“漫画之家”系统 一、前言 二、系统设计 三、系统功能设计 1系统功能模块 2后台模块 5.2.1管理员功能模块 5.2.2用户功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&a…

linux代码实操——信号的使用

信号的基本概念 信号是系统响应某个条件而产生的事件,进程接收到信号会执行相应的操作。 与信号有关的系统调用在“signal.h”头文件中有声明 常见信号的值,及对应的功能说明: 修改信号的响应方式 – signal() 我们来做个小实验: 在键盘上…

容联云孔淼:大模型落地与全域营销中台建设

近日,由金科创新社主办的2024区域性商业银行数智化转型研讨会顺利召开, 容联云产业数字云事业群副总经理、诸葛智能创始人孔淼受邀出席,并分享数智化转型实践经验。 他分享了容联云两大核心产品,“大模型应用容犀Copilot”在金融营…

OpenCV Radon变换探测直线(拉东变换)

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 Radon变换可以将原始图像中直线特征的处理问题转化为变换域图像中对应点特征的处理问题,其中对应特征点的横坐标表示原始图像的旋转角度,一般来讲原始图像中的噪声不会分布在直线的特征上。因此,Radon变换在探测…

互联网洗鞋工厂实现新时代下的家庭洗护服务;

互联网洗鞋工厂实现新时代下的家庭洗护服务; 拽牛科技洗护系统以智慧城市系统为依托,洗鞋工厂为中心,利用互联网+社区服务商模式,实现了新时代下的家庭洗护服务, 将客户﹣﹣社区服务商&#xfe63…

笔灵AI实习体验报告模版:新媒体运营实习生

笔灵AI实习体验报告模版,可以自己输入岗位,有需要的可以试试https://ibiling.cn/scene/inex?fromcsdnsx 免费分享【新媒体运营实习生】的实习体验报告 尊敬的导师和领导们:首先,我想对给予我这次宝贵实习机会的公司表示衷心的感…

5月数学进度应该到哪里?听说24更难了,进度要加快吗?

刷一本习题册够吗?刷哪本?什么时候刷? 确实,24考完,大家都发现,没有一本习题册,覆盖了考试的所有知识点。 主流的模拟卷,都没有达到24卷的难度。 如何才能在最短的时间内&#xff…

SpringCloud Config 分布式配置中心

SpringCloud Config 分布式配置中心 概述分布式系统面临的——配置问题ConfigServer的作用 Config服务端配置Config客户端配置 可以有一个非常轻量级的集中式管理来协调这些服务 概述 分布式系统面临的——配置问题 微服务意味着要将单体应用中的业务拆分成一个个字服务&…

极市平台 | 一文详解视觉Transformer模型压缩和加速策略(量化/低秩近似/蒸馏/剪枝)

本文来源公众号“极市平台”,仅用于学术分享,侵权删,干货满满。 原文链接:一文详解视觉Transformer模型压缩和加速策略(量化/低秩近似/蒸馏/剪枝) 作者丨Feiyang Chen等 来源丨AI生成未来 编辑丨极市平台 0 极市导读 本研究…

C/C++ 初级球球大作战练手

效果演示&#xff1a; https://live.csdn.net/v/385490 游戏初始化 #include <stdbool.h> #include<stdio.h> #include<stdlib.h> #include<time.h> #include<graphics.h> #include <algorithm> #include<math.h> #include<mmsy…

【全开源】Java俱乐部系统社区论坛商城系统源码-奔驰奥迪保时捷大众宝马等汽车俱乐部

特色功能&#xff1a; 会员管理与服务&#xff1a;系统支持多种会员身份以及优惠政策的制定&#xff0c;如普通会员、VIP会员、黄金会员等&#xff0c;且可以根据会员等级不同&#xff0c;进行不同的营销策略。此外&#xff0c;还提供了会员信息录入、会员积分管理、消费记录管…

算法学习:递归

&#x1f525; 个人主页&#xff1a;空白诗 文章目录 一、引言二、什么是递归&#xff1f;三、两大基本要素&#x1f3c1; 基线条件&#xff08;Base Case&#xff09;&#x1f501; 递归条件&#xff08;Recursive Case&#xff09;&#x1f4c3; 代码示例&#xff1a;计算斐波…

【PyTorch实战演练】使用CelebA数据集训练DCGAN(深度卷积生成对抗网络)并生成人脸(附完整代码)

文章目录 0. 前言1. CelebA数据集1.1 核心特性与规模1.2 应用与用途1.3 获取方式1.4 数据预处理 2. DCGAN的模型构建2.1 生成器模型2.2 判别器模型 3. DCGAN的模型训练&#xff08;重点&#xff09;3.1 训练参数3.2 模型参数初始化3.3 训练过程 4. 结果展示4.1 loss值变化过程4…
最新文章