OpenCV离散傅里叶变换

发布 : 2019-01-29 分类 : 计算机视觉 浏览 :

离散傅里叶变换

  • 作用:得到图像中几何结构信息
  • 结论:傅里叶变换后的白色部分(即幅度较大的低频部分),表示的是图像中慢变化的特性,或者说是灰度变化缓慢的特性(低频部分)。
    傅里叶变换后的黑色部分(即幅度低的高频部分),表示图像中快变化的特性,或者说是灰度变化快的特性(高频部分)。
  • dft()函数

    函数原型

    1
    void dft(InputArray src, OutputArray dst, int flage=0, int nonzeroRow=0)

    • InputArray 类型的src。输入矩阵,可以为实数或者虚数。
    • OutputArray 类型的dst。函数调用后的运算结果存在这里,其尺寸取决于标识符,也就是第三个参数。
    • int 类型的falgs。转换的标识符,有默认值0,取值可以为表中的结合。
    标识符名称 意义
    DFT_INVERSE 用一维或二维逆变换代替默认的正向变换。
    DFT_SCALE 缩放比例标识符,输出的结果都会以1/N进行放缩,通常擦很难过会结合DFT_INVERSE一起使用。
    DFT_ROWS 对输入矩阵的每行进行正向或反向的变换,此标识符可以在处理多种矢量的时候用于减小资源的开销,这些处理常常是三维或高位变换等复杂操作
    DFT_COMPLEX_OUTPUT 进行一维或二维复数苏胡祖反变换。这样的结果通常是一个大小相同的复矩阵。如果输入的矩阵有复数的共轭对称性(比如是一个带有DEF_COMPLEX_OUTPUT标识符的正变换结果),便会输出实矩阵。
    • int 类型的nonzeroRows,有默认值0.当此参数设为非零时(最好是取值为想要处理的那一行的值,比如C。rows),函数会假设只有输入矩阵的第一个非零行包含非零元素(没有设置DFT_INVERSE标识符),或只有输出矩阵的一个非零行包含非零元素(设置了DFT_INVERSE标识符)。这样的话,函数就可对其他行进行更高效的处理,以节省时间开销。

    返回DFT最优尺寸大小:getOptimalDFTSize()函数

    函数原型

    1
    int getOptimalDFTSize(int vecsize)

    • int 类型的vecsize,向量尺寸,即图片的rows、cols。

    扩充图像边界:copyMakeBorder()函数

    函数原型

    1
    void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar())

    • InputArray 类型的src,输入图像,即源图像,填Mat类型的对象即可。
    • OutputArray 类型的dst,函数调用后的运算结果存在这里,即这个参数用于存放函数调用后的输出结果,需和源图片有一样的尺寸和类型,且size 应该为Size(src.cols+left+right , src.rows+top+bottom)。
    • 接下来的4个参数分别是为int 类型的top、bottom、left、right,分别表示在源图像的四个方向上填充多少像素。
    • 第七个参数,int 类型的 borderType,边界类型,常见取值为BORDER_CONSTANT,可参考borderInterpolate()得到更多细节。
    • 第八个参数,const Scalar& 类型的value,有默认值Scalar(),可以理解为默认值为0。当borderType取值为BORDER_CONSTANT时,这个参数表示边界值。

    计算二维矢量的幅值:magnitude()函数

    函数原型

    1
    void magnitude(InputArray x, InputArray y, OutputArray magnitude)

    • InputArray 类型的x,表示矢量的浮点型X坐标值,也就是实部。
    • InputArray 类型的y,表示矢量的浮点型Y坐标值,也就是虚部。
    • OutputArray 类型的magnitude,输出的幅值,它和第一个参数x有着同样的尺寸和类型。

    计算自然对数:log()函数

    计算数组元素绝对值的自然对数
    函数原型

    1
    void log(InputArray src, OutputArray dst)

    • 输入图像
    • 得到的对数值

    矩阵归一化:normalize()函数

    函数原型

    1
    void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray())

    • InputArray 类型的src。输入图像,即源图像,填Mat类的对象即可。
    • OutputArray 类型的dst。函数调用后的运算结果。和源图片有一样的尺寸和类型。
    • double 类型的alpha。归一化后的最大值,默认值1。
    • double 类型的beta。归一化后的最小值,默认值0。
    • int类型的norm_type。归一化类型,有NORM_INF、NORM_L1、NORM_L2和NORM_MINMAX等参数可选,有默认值NORM_12。
    • int 类型的dtype,有默认值-1。当参数去负值时,输出矩阵和src有同样的类型,否则,它和src有同样的通道数,且此时图像深度为CV_MAT_DEPTH (dtype)。
    • InputArray 类型的mask,可选的操作掩膜,有默认值noArray()。

    综合示例

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    #include<core.hpp>
    #include<imgproc.hpp>
    #include<highgui.hpp>
    #include<iostream>
    using namespace cv;
    using namespace std;


    int main()
    {
    // 1.以灰度模式读取
    Mat srcImage = imread("..//..//0.jpg",0);
    if (!srcImage.data)
    {
    printf("读入错误");
    return false;
    }
    imshow("原始图像", srcImage);

    // 2.将输入图像延扩到最佳尺寸,边界用0补充
    int m = getOptimalDFTSize(srcImage.rows);
    int n = getOptimalDFTSize(srcImage.cols);
    // 将添加的像素初始化为0。
    Mat padded;
    copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

    // 3.为傅里叶变换的结果(实部和虚部)分配空间。
    // 将planes数组组合合并成一个多通道的数组complexI
    Mat planes[] = { Mat_<float>(padded), Mat::zeros(padded.size(),CV_32F) };
    Mat complexI;
    merge(planes, 2, complexI);

    // 4.进行离散傅里叶变换
    dft(complexI, complexI);

    // 5.将复数转换为幅值,即 log(1+sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)
    split(complexI, planes); //将多通道数组complexI分离成几个单通道数组,[0]=Re,[1]=Im
    magnitude(planes[0], planes[1], planes[0]); //planes[0] = magnitude
    Mat magnitudeImage = planes[0];

    // 6.进行对数尺度(logarithmic scale)缩放
    magnitudeImage += Scalar::all(1);
    log(magnitudeImage, magnitudeImage); //求自然对数

    // 7.剪切和重分布幅度图象限
    //若有奇数行或奇数列,进行频谱裁剪
    magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));

    // 重新排列傅里叶图像中的象限,使得原点位于图像中心
    int cx = magnitudeImage.cols / 2;
    int cy = magnitudeImage.rows / 2;
    Mat q0(magnitudeImage, Rect(0, 0, cx, cy)); //ROI区域的左上
    Mat q1(magnitudeImage, Rect(cx, 0, cx, cy)); //ROI区域的右上
    Mat q2(magnitudeImage, Rect(0, cy, cx, cy)); //ROI区域的左下
    Mat q3(magnitudeImage, Rect(cx, cy, cx, cy)); //ROI区域的右下
    //交换象限(左上与右下进行交换)
    Mat tmp;
    q0.copyTo(tmp);
    q3.copyTo(q0);
    tmp.copyTo(q3);
    //交换象限(右上与左下进行交换)
    q1.copyTo(tmp);
    q2.copyTo(q1);
    tmp.copyTo(q2);

    // 8.归一化,用0到1之间的浮点值将矩阵变换为可视化的图像格式
    normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);

    // 9.显示效果图
    imshow("频谱幅值", magnitudeImage);
    waitKey();

    return 0;
    }

    本文作者 : HeoLis
    原文链接 : http://ishero.net/OpenCV离散傅里叶变换.html
    版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

    学习、记录、分享、获得

    微信扫一扫, 向我投食

    微信扫一扫, 向我投食