使用 OpenCV 实现图像的透视变换

时间:2024-11-06 08:29:11
概述

在计算机视觉领域,经常需要对图像进行各种几何变换,如旋转、缩放和平移等。其中,透视变换(Perspective Transformation)是一种非常重要的变换方式,它能够模拟三维空间中的视角变化,例如从不同角度观察同一个物体时所看到的不同效果。本文将详细介绍如何使用 OpenCV 库在 Python 中实现图像的透视变换。

环境准备

在开始之前,请确保已经安装了 OpenCV 库。如果没有安装,可以通过以下命令进行安装:

pip install opencv-python
运行效果

在这里插入图片描述

示例代码详解
import cv2
import numpy as np

def func():
    """
    读取图像并进行透视变换。
    :return:
    """
    # 读取图像
    img = cv2.imread('./resources/card.jpeg')
    print(type(img))  # 输出图像数据类型
    print(img.shape)  # 输出图像尺寸信息
    
    # 定义目标宽度和高度
    width, height = 300, 200

    # 原始图像上的四个点坐标
    pts1 = np.float32([
        [94, 302],
        [205, 243],
        [152, 369],
        [265, 300]
    ])

    # 目标图像上的四个点坐标
    pts2 = np.float32([
        [0, 0],
        [width, 0],
        [0, height],
        [width, height]
    ])

    # 计算透视变换矩阵
    matrix = cv2.getPerspectiveTransform(pts1, pts2)

    # 应用透视变换
    img_output = cv2.warpPerspective(img, matrix, (width, height))

    # 展示原始图像和变换后的图像
    cv2.imshow('Original Image', img)
    cv2.imshow('Transformed Image', img_output)

    # 等待用户按键后退出
    cv2.waitKey(0)

if __name__ == '__main__':
    func()
代码解析
  1. 导入必要的库

    import cv2
    import numpy as np
    
    • cv2:OpenCV 的 Python 接口。
    • numpy:用于处理图像数据的数组。
  2. 定义函数 func

    def func():
        """
        读取图像并进行透视变换。
        :return:
        """
    
  3. 读取图像

    img = cv2.imread('./resources/card.jpeg')
    print(type(img))  # 输出图像数据类型
    print(img.shape)  # 输出图像尺寸信息
    
    • 使用 cv2.imread() 读取图像文件。
    • print(type(img))print(img.shape) 分别用于检查图像数据类型和图像尺寸。
  4. 定义目标宽度和高度

    width, height = 300, 200
    
  5. 定义图像上的四个点坐标

    pts1 = np.float32([
        [94, 302],
        [205, 243],
        [152, 369],
        [265, 300]
    ])
    
    • pts1 表示在原始图像上的四个点坐标,这些坐标通常代表图像中的某个矩形区域。
  6. 定义目标图像上的四个点坐标

    pts2 = np.float32([
        [0, 0],
        [width, 0],
        [0, height],
        [width, height]
    ])
    
    • pts2 表示变换后目标图像上的四个点坐标,这里我们把原来的矩形区域拉伸成了一个矩形。
  7. 计算透视变换矩阵

    matrix = cv2.getPerspectiveTransform(pts1, pts2)
    
    • 使用 cv2.getPerspectiveTransform() 获取从原始图像到目标图像的变换矩阵。
  8. 应用透视变换

    img_output = cv2.warpPerspective(img, matrix, (width, height))
    
    • 使用 cv2.warpPerspective() 应用透视变换,得到变换后的图像。
  9. 展示图像

    cv2.imshow('Original Image', img)
    cv2.imshow('Transformed Image', img_output)
    
    • 使用 cv2.imshow() 分别展示原始图像和变换后的图像。
  10. 等待用户按键后退出

    cv2.waitKey(0)
    
    • cv2.waitKey(0) 使得程序等待用户按键后退出。

获取pts1数据的方式:
手动选取:可以使用图像查看工具(例如Photoshop,GIMP等)打开图像,然后手动测量并记录感兴趣区域的四个角的像素坐标。选取坐标时,确保它们形成一个闭合四边形。

编程自动识别:如果目标区域的边缘特征明显,也可以使用图像处理技术(如边缘检测、角点检测等)自动识别这些角点,以便复用或动态生成pts1的值。

实验和调整:在实际使用中,可能需要经过几次实验和调整,以获取最佳的透视变换效果。

 在这段代码中,pts1的具体值:
pts1 = np.float32([
    [94, 302],
    [205, 243],
    [152, 369],
    [265, 300]
])

这些坐标值为示例数据,意味着选择了原图中具体的一块区域的四个点,具体点的位置需要基于图像的内容而定。在实际应用中,你会根据你希望进行变换的区域选择具体的坐标。

总结

本文通过一个具体的代码示例,详细介绍了如何使用 OpenCV 在 Python 中实现图像的透视变换。透视变换是一种强大的工具,可以帮助我们处理图像中的非平行投影,从而在不同的视角下获取一致的图像。希望本文能帮助你在实际项目中更好地应用这一技术。


以上就是关于使用 OpenCV 实现图像的透视变换的技术讲解,希望对你的学习和实践有所帮助!如果有任何疑问或需要进一步的帮助,请随时提问!