图像处理中的旋转、平移、缩放——仿射变换的原理和优化_拓展窗口平移图片变倾斜,给定仿射矩阵进行仿射变换,给定新的仿射矩阵,矫正仿射变-程序员宅基地

仿射变换的原理

在条形码识别软件中有图像预览的功能。有时预览的图像需要进行转置（旋转180度或者90度）、缩放、镜像（左右反转）等操作。OpenCV提供了相应的函数进行以上操作。例如：
转置：cv::WarpAffine()
缩放：cv::resize()
镜像：cv::remap()
如果同时要转置，缩放和镜像，就需要进行三次图像运算。其实以上三个操作都是同一类型的变化，称作放射变化。可以把这3次图像运算合并成一次，从而优化运算时间。如何合并这三次运算，需要从仿射变换的原理说起。

举个例子，我们需要对以下图像（蓝色）顺时针旋转90度（橙色），可以这么做：假设原来的图像宽w高h
顺时针90度旋转图像
(1) 创建宽h高w内存区域存放新图像；
(2) 逐一把原图像中的像素(x0,y0)搬到新图像的对应像素(x1,y1)
例如原图像的左上角点①(0,0)被搬到新图像的右上角(h,0)；
右上角点②(w,0)被搬到新图像的右下角(h,w)；
右下角③(w, h)被搬到新图像的左下角(0,w)
以此类推，可以发现(x0, y0)和(x1, y1)之间存在以下规律：
$x_1=y_0; y_1=-x_0+w$
对于其他各种几何变换，平移、缩放、镜像等，我们都可以用类似的方法进行运算。因此可以把上式写成通用的形式：

x 1 = a x x 0 + b x y 0 + c x

$x_1=a_xx_0+b_xy_0+c_x$

y 1 = a y x 0 + b y y 0 + c y

$y_1=a_yx_0+b_yy_0+c_y$
在顺时针旋转90度的例子中，

ax=0,bx=1,cx=0;ay=−1,by=0,cy=w $a_x=0, b_x=1, c_x=0; a_y=-1, b_y=0, c_y=w$
更一般的，我们可以把上面写成矩阵形式：

(x 1 y 1) = (a x a y b x b y c x c y) \times ⎛ ⎝ ⎜ x 0 y 0 1 ⎞ ⎠ ⎟

$\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=\begin{pmatrix} a_x&b_x&c_x \\ a_y&b_y&c_y\end{pmatrix}\times\begin{pmatrix} x_0\\y_0\\1\end{pmatrix}$
或者齐次形式。齐次矩阵的作用后面介绍。

⎛ ⎝ ⎜ x 1 y 1 1 ⎞ ⎠ ⎟ = ⎛ ⎝ ⎜ a x a y 0 b x b y 0 c x c y 1 ⎞ ⎠ ⎟ \times ⎛ ⎝ ⎜ x 0 y 0 1 ⎞ ⎠ ⎟

$\begin{pmatrix} x_1\\y_1\\1 \end{pmatrix}=\begin{pmatrix} a_x&b_x&c_x \\ a_y&b_y&c_y\\0&0&1\end{pmatrix}\times\begin{pmatrix} x_0\\y_0\\1\end{pmatrix}$

我们把矩阵 $M_T=\begin{pmatrix} a_x&b_x&c_x \\ a_y&b_y&c_y\\0&0&1\end{pmatrix}$ 称作放射矩阵。

各种典型变换的仿射矩阵

w为原图像的宽度，h为原图像的高度。
顺时针旋转90度
$M_T=\begin{pmatrix}0&1&0 \\ -1&0&w\\0&0&1\end{pmatrix}$
旋转180度
$M_T=\begin{pmatrix}-1&0&w \\ 0&-1&h\\0&0&1\end{pmatrix}$
逆时针旋转270度
$M_T=\begin{pmatrix}0&-1&h \\ 1&0&0\\0&0&1\end{pmatrix}$
严格讲以上的转置操作是以(0,0)为中心的旋转和平移的合成。因为以(0,0)为中心旋转的结果在负的区域（2，3或者4象限）。不能显示在目标图像中。

平移（x方向平移p, y方向平移q)
$M_T=\begin{pmatrix}1&0&p \\ 0&1&q\\0&0&1\end{pmatrix}$
水平镜像
$M_T=\begin{pmatrix}-1&0&w \\ 0&1&0\\0&0&1\end{pmatrix}$
缩放s倍
$M_T=\begin{pmatrix}s&0&0 \\ 0&s&0\\0&0&s\end{pmatrix}$

OpenCV中仿射变换的实现

OpenCV中提供了一个函数对图像进行仿射变换。

void warpAffine(InputArray src, OutputArray dst, InputArray M, Size dsize, int
flags=INTER_LINEAR, int borderMode=BORDER_CONSTANT, const Scalar&
borderValue=Scalar())

其中src为原始图像，dst为变换后的图像，M就是上面提到的仿射矩阵（2x3，非齐次）。dsize是新图像的大小。其他参数后面介绍。

函数是如何工作的

（1）为dst申请一个内存空间，大小为dsize。(宽度x高度的二维矩阵）
（2）计算仿射矩阵 $M$ 的逆矩阵 $M^{-1}$
（3）扫描目标图像dst中的每个点 $(x_1,y_1), x_1=0...w_1, y_1=0...h_1$ . $w_1, h_1$ 为新图像的宽度和高度。
（4）通过以下式子计算目标图像的点 $(x_1,y_1)$ 对应源图像点 $(x_0,y_0)$ .

(x 0 y 0) = M - 1 \times ⎛ ⎝ ⎜ x 1 y 1 1 ⎞ ⎠ ⎟

$\begin{pmatrix} x_0\\y_0 \end{pmatrix}=M^{-1}\times\begin{pmatrix} x_1\\y_1\\1\end{pmatrix}$
（5）填充目标图像

dst(x1,y1)=src(x0,y0) $dst(x_1,y_1) = src(x_0,y_0)$

但是这个计算过程可能遇到一些问题
（1）通过 $(x_1,y_1)$ 计算得到的 $(x_0,y_0)$ 可能是小数，而原图像中的像素只存在于与整数。
这时就要通过差值的方法求得两个像素中间点的亮度。差值算法可以在warpAffine()函数的参数flag中指定。
（2）计算得到的 $(x_0,y_0)$ 可能超出原图像范围。
这时用什么值来填充可以通过参数boarderMode和boarderValue来指定。比如填充一个固定的颜色，或者使用源图像边缘的颜色等。具体参考OpenCv手册。
（3）如果warpAffine()函数被用于视频处理中，每帧画面用的都是相同的仿射矩阵M。每次调用warpAffine()函数都会计算一次M的逆矩阵。可以在flag参数中指定WARP_INVERSE_MAP，并且直接传递 $M^{-1}$ 给函数。可以避免重复计算逆矩阵。

仿射变换优化

仿射变换的合成（级联）

如果需要对图像同时进行旋转，平移，缩放等多重仿射变换。可以把各个变换的仿射矩阵相乘得到总的仿射矩阵，做一次调仿射变换运算即可。仿射矩阵大小为3x3，对仿射矩阵的运算量远少于一次仿射变换运算。
证明：
假设原图像为 $src(x_0,y_0)$ , 第一次变换（例如旋转）后的图像为 $dst_1(x_1,y_1)$ ，第二次变化（平移）后的图像为 $dst_2(x_2,y_2)$ ，则有
$\begin{pmatrix} x_1\\y_1\\1 \end{pmatrix}=M_1\times\begin{pmatrix} x_0\\y_0\\1\end{pmatrix}$ , $\begin{pmatrix} x_2\\y_2\\1 \end{pmatrix}=M_2\times\begin{pmatrix} x_1\\y_1\\1\end{pmatrix}$
因此
$\begin{pmatrix} x_2\\y_2\\1 \end{pmatrix}=M_2\times M_1\times\begin{pmatrix} x_0\\y_0\\1\end{pmatrix}$
$M_T=M_2 \times M_1$
其中 $M_1$ 为第一次变换（旋转）的仿射矩阵， $M_2$ 为第二次变换（平移）的仿射矩阵， $M_T$ 为合成的仿射矩阵。所有的仿射矩阵都为3x3，这也是使用齐次矩阵的作用。

计算的优化

可以将 $M_T$ 的逆矩阵 $M^{-1}$ 传给warpAffine()，可以节省每次计算逆矩阵的时间。（有待测试）

本文链接：https://blog.csdn.net/bytekiller/article/details/47803753

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

5个超厉害的资源搜索网站，每一款都可以让你的资源满满！_最全资源搜索引擎-程序员宅基地

文章浏览阅读1.6w次，点赞8次，收藏41次。生活中我们无时不刻不都要在网站搜索资源，但就是缺少一个趁手的资源搜索网站，如果有一个比较好的资源搜索网站可以帮助我们节省一大半时间！今天小编在这里为大家分享5款超厉害的资源搜索网站，每一款都可以让你的资源丰富精彩！网盘传奇一款最有效的网盘资源搜索网站你还在为找网站里面的资源而烦恼找不到什么合适的工具而烦恼吗？这款网站传奇网站汇聚了4853w个资源，并且它每一天都会持续更新资源；..._最全资源搜索引擎

Book类的设计(Java)_6-1 book类的设计java-程序员宅基地

文章浏览阅读4.5k次，点赞5次，收藏18次。阅读测试程序，设计一个Book类。函数接口定义：class Book{}该类有四个私有属性分别是书籍名称、价格、作者、出版年份，以及相应的set 与get方法；该类有一个含有四个参数的构造方法，这四个参数依次是书籍名称、价格、作者、出版年份。裁判测试程序样例：import java.util.*;public class Main { public static void main(String[] args) { List <Book>_6-1 book类的设计java

基于微信小程序的校园导航小程序设计与实现_校园导航微信小程序系统的设计与实现-程序员宅基地

文章浏览阅读613次，点赞28次，收藏27次。相比于以前的传统手工管理方式，智能化的管理方式可以大幅降低学校的运营人员成本，实现了校园导航的标准化、制度化、程序化的管理，有效地防止了校园导航的随意管理，提高了信息的处理速度和精确度，能够及时、准确地查询和修正建筑速看等信息。课题主要采用微信小程序、SpringBoot架构技术，前端以小程序页面呈现给学生，结合后台java语言使页面更加完善，后台使用MySQL数据库进行数据存储。微信小程序主要包括学生信息、校园简介、建筑速看、系统信息等功能，从而实现智能化的管理方式，提高工作效率。

有状态和无状态登录

传统上用户登陆状态会以 Session 的形式保存在服务器上，而 Session ID 则保存在前端的 Cookie 中；而使用 JWT 以后，用户的认证信息将会以 Token 的形式保存在前端，服务器不需要保存任何的用户状态，这也就是为什么 JWT 被称为无状态登陆的原因，无状态登陆最大的优势就是完美支持分布式部署，可以使用一个 Token 发送给不同的服务器，而所有的服务器都会返回同样的结果。有状态和无状态最大的区别就是服务端会不会保存客户端的信息。

九大角度全方位对比Android、iOS开发_ios 开发角度-程序员宅基地

文章浏览阅读784次。发表于10小时前| 2674次阅读| 来源TechCrunch| 19 条评论| 作者Jon EvansiOSAndroid应用开发产品编程语言JavaObjective-C摘要：即便Android市场份额已经超过80%，对于开发者来说，使用哪一个平台做开发仍然很难选择。本文从开发环境、配置、UX设计、语言、API、网络、分享、碎片化、发布等九个方面把Android和iOS_ios 开发角度

搜索引擎的发展历史

搜索引擎的发展历史可以追溯到20世纪90年代初，随着互联网的快速发展和信息量的急剧增加，人们开始感受到了获取和管理信息的挑战。这些阶段展示了搜索引擎在技术和商业模式上的不断演进，以满足用户对信息获取的不断增长的需求。

随便推点

控制对象的特性_控制对象特性-程序员宅基地

文章浏览阅读990次。对象特性是指控制对象的输出参数和输入参数之间的相互作用规律。放大系数K描述控制对象特性的静态特性参数。它的意义是：输出量的变化量和输入量的变化量之比。时间常数T当输入量发生变化后，所引起输出量变化的快慢。（动态参数） ..._控制对象特性

FRP搭建内网穿透(亲测有效)_locyanfrp-程序员宅基地

文章浏览阅读5.7w次，点赞50次，收藏276次。FRP搭建内网穿透1.概述：frp可以通过有公网IP的的服务器将内网的主机暴露给互联网，从而实现通过外网能直接访问到内网主机；frp有服务端和客户端，服务端需要装在有公网ip的服务器上，客户端装在内网主机上。2.简单的图解：3.准备工作：1.一个域名（www.test.xyz）2.一台有公网IP的服务器(阿里云、腾讯云等都行)3.一台内网主机4.下载frp，选择适合的版本下载解压如下：我这里服务器端和客户端都放在了/usr/local/frp/目录下4.执行命令# 服务器端给执_locyanfrp