Opencv-project-training

According to the project made by learning murtaza Hassan's videos every day, thank the up Master of station B: a graduate student who knows a little about everything. It is mainly used to learn opencv by myself. On my CSDN blog, I have a detailed picture and text introduction of each project. I will continue to study hard. Welcome to my CSDN blog, where I store my code and some information. CSDN link。 You can check it in my column - opencv project practice.

`00 专栏内容介绍`

地址：Opencv项目实战：00 专栏内容介绍

`01 文字检测OCR`

地址1：Opencv项目实战：01 文字检测OCR（1）地址2：Opencv项目实战：01 文字检测OCR（2）

介绍：使用了第三方库pytesseract，以及Tesseract进行字母和数字的OCR识别，文章分为了1和2篇，第2篇相较于第1篇有所改进。个人感觉是对于文字和数字的识别方面还是有相当进步的空间。好像目前不会使用这个方面来进行OCR识别。

应用：OCR的应用非常广泛。它可以用于文件扫描软件，将纸质文档转换为可编辑的电子文本。此外，OCR还可以用于搜题软件，帮助学生快速识别和搜索问题答案。在QQ或微信等聊天软件中，文字识别可以将图片中的文字提取出来，方便快捷地转发和共享信息。此外，OCR还可以应用于自动化数据录入、身份证识别、银行卡识别等场景，极大地提高了工作效率和准确性。

`02 角度探测器`

地址：Opencv项目实战：02 角度探测器

介绍：通过鼠标进行点击即可进行平面的角度检测，存在人为的点击误差。

应用：通过鼠标进行角度检测具有多种应用，包括三维建模、游戏和虚拟现实以及机器人控制和自动化系统。鼠标可以用于改变物体的角度、控制视角、编辑图像，或者手动控制机器人的姿态。这种技术需要借助算法和传感器来进行姿态估计和转换，以实现特定应用领域的需求。

`03 扫描二维码&条形码`

地址：Opencv项目实战：03 扫描二维码&条形码

介绍：这里可以实现二维码和条形码的识别，扫描出来的结果可能会有数字，网址链接，英文等。除此之外，还进行了公司的员工使用工作牌扫描二维码开门的想法实现。

应用：二维码和条形码的应用广泛，如员工使用工作牌扫描二维码开门、移动支付等。这种扫描方式方便快捷，提高了门禁和支付的安全性和效率。在疫情期间更是少不了要扫场所码。

`04 全景图片拼接`

地址：Opencv项目实战：04 全景图片拼接

介绍：通过特征检测可将图片进行拼接，如何实现的也可以参考这里。

应用：全景图片拼接应用广泛，包括旅游、房地产、虚拟现实等领域。它将多张相邻照片合成一张全景图，提供宽广视野和沉浸式体验。在旅游中展示风景名胜，房地产展示房屋环境，VR创建虚拟场景等。手机的全景模式也采用这种方法，让用户轻松拍摄全景照片，享受更丰富的视觉体验。

`05 物体检测`

地址：Opencv项目实战：05 物体检测

介绍：gif图像中检测了水瓶（截图时间不够了），鼠标，剪刀，书，手机，牙刷，键盘，电脑等。可以检测到coco,names文件中的物品。

应用：物体检测广泛应用于多个领域。其中包括自动驾驶、视频监控、物体识别与分类、增强现实和虚拟现实、医学影像分析等。物体检测技术的应用领域在不断扩展，未来还将涵盖更多的领域和场景。

`06 文档扫描仪`

地址：Opencv项目实战：06 文档扫描仪介绍：修正文档，可以视频检测也可以使用图片检测，实现的话，要么有VIP，兑换积分，要么就是看广告等。如果你发现扫描的文档不清晰，请修改合适的分辨率。以我个人来看，它的实用性很高。

应用：文档扫描仪可以用于扫描身份证、护照等个人身份证件。有些还具有自动文档处理功能，如自动裁剪、校正图像、去除背景噪声等。这可以提高扫描效果的质量和一致性。

`07 人脸识别和考勤系统`

地址：Opencv项目实战：07 人脸识别和考勤系统

介绍：高精度执行面部识别，首先简要介绍理论并学习基本实现。然后将创建一个考勤项目，该项目将使用网络摄像头检测人脸并在 Excel 表中实时记录考勤情况。

应用：人脸识别和考勤系统可以用于企业、学校等场所的考勤管理。员工或学生只需在系统中注册自己的人脸信息，然后在每天上班或上课时，系统通过摄像头检测和识别人脸，自动记录考勤时间，提高考勤的准确性和效率。考勤数据可以实时记录在Excel表或数据库中，方便后续统计和分析。

`08 Yolov3更高精度的检测物体`

地址：Opencv项目实战：08 Yolov3更高精度的检测物体

介绍：本次物体检测，将采用新的方法，相比于上一次，它的检测效果更好，具体在下面的项目介绍当中，本次检测的物品有手机、牙刷、剪刀、杯子、运动球、书等。检测的这些物品是方便展示的，还可以使用水果的，大家做好后，不妨自己去试试。

应用：更高的检测精度，YOLOv3相对于前代模型，引入了更多的卷积层和更小的检测尺度，从而提高了物体检测的精度。YOLOv3在不同尺度下进行多次检测，从而能够更准确地捕捉不同大小的目标。

`09 物体尺寸测量`

地址：Opencv项目实战：09 物体尺寸测量

介绍：主要是运用了之前扫描文档的**，以A4纸为背景，检测其中区域的物体长和宽。我的摄像头无法固定，所以是手持的，且由于我在寝室里面是真的没有找到合适的测量物体以及背景色（全是米色或原木色的）。所以效果有所欠缺，但经过ps修改的图片，检测的效果还是很不错的。

应用：在工业制造过程中，使用计算机视觉进行物体尺寸测量，可以自动进行物体尺寸测量，减少了人工操作的需求，并提高了测量的效率。相比传统的手动测量方法，计算机视觉可以在更短的时间内处理大量的数据，并实现高速、连续的测量。

`10 面部特征提取及添加滤镜`

地址：Opencv项目实战：10 面部特征提取及添加滤镜

介绍：采取dlib和shape_predictor_68_face_landmarks.dat文件，为图像添加蒙版，更改嘴唇的色号，如果你想修改其他的部位，它的方法是同理的，除此之外，让图片显示出脸部的68个地表.

应用：在美妆领域，可以利用计算机视觉和机器学习技术实现自动化的化妆效果。结合了图像分析、人脸识别和美妆技术，可以实时调整人脸上的妆容，不仅为用户提供了个性化的美妆体验，还可以帮助品牌和商家更好地推广和销售化妆品。

`11 使用Opencv高亮显示文本检测`

地址：Opencv项目实战：11 使用Opencv高亮显示文本检测

介绍：基于文字高亮的图片中，需要追求一种能够快速提取重点内容的方法。通过opencv的方法通过分析图片中的文字信息，并将其准确提取出来，使我们能够方便地获取关键信息并将其整理存储。为此，将文字高亮图片转换为可编辑的文本，并将提取的内容保存到一个CSV（逗号分隔值）文件中。

应用：在教育、学术、市场、法律法规以及新闻等领域，文字高亮图片的信息提取，可以帮助用户从大量的文字信息中迅速捕捉关键内容，并加速信息处理和决策过程。随着人工智能和图像识别技术的不断发展，这一方法在各个行业中的应用前景更加广阔。

`12 你这背景太假啦！`

地址：Opencv项目实战：12 你这背景太假啦！

介绍：平常我们在各个平台，比如某音、B站、小红薯等，有这么一群创作者——虚拟人物、带有各种背景板的创作者，前段时间还玩出了一个“我的背景板假吗？”这样的梗，那么我们今天要制作的是更改我们的背景板，将原有的去除，添加上新的背景板，并可以通过敲击键盘对背景板进行切换（本项目中，‘q’表示-1，‘w’表示+1）。

应用：在影视娱乐产业，背景替换技术，可将演员拍摄的前景图像与虚拟的背景场景进行合成，制作令人惊叹的特效，平时的工作中，线上会议中也可以替换虚拟的背景场景，可以显得更加的专业等等。

`13 手部追踪`

地址：Opencv项目实战：13 手部追踪

介绍：基于Mediapipe开发的简单手势识别，是后面很多有手势识别开发项目的基础。

应用：手势识别技术可以用于人机交互界面的设计，例如触摸屏、智能手机和平板电脑等设备。用户可以通过手势动作来控制和操作设备，实现更直观、自然的交互方式，提高用户体验。

`14 手势控制音量`

地址：Opencv项目实战：14 手势控制音量

介绍：本篇与上一篇有很多联系，大家可以看看这篇Opencv项目实战：13 手部追踪，我们将根据上一节的内容，进行一个拓展。本篇你可以学到如何通过手势来控制电脑的音量大小。这个就是一个主要的效果，通过大拇指与食指来控制音量，并在侧边具有一个音量条，更加美观和简洁。

应用：手势控制音量是手势识别技术在音频领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作，并将其识别为特定的音量控制命令，实现对音频设备的音量进行调节。

`15 手势缩放图片`

地址：Opencv项目实战：15 手势缩放图片

介绍：本篇将会以HandTrackingModule为模块，这里的模块与之前的有所不同，请按照本篇为准，前面的HandTrackingModule不足以完成本项目，本篇将会通过手势对本人的博客海报进行缩放，具体效果可以看下面的效果展示。

应用：手势缩放图片是手势识别技术在图像处理领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作，并将其识别为缩放命令，实现对图片的放大和缩小操作。

`16 虚拟拖拽系统`

地址：Opencv项目实战：16 虚拟拖拽系统

介绍：这次使用cvzone模块，制作一个虚拟拖拽系统，我们根据索引可以知道食指与中指的索引为8和12，当两指间合并时可以对虚拟方块进行拖拽，张开时解除拖拽，方块停在此处。虽然目前仍然存在一定的bug，即当两个虚拟方块重合较多时，会使其中的一个方块消失，但我们又能利用这一点可以制作计算机视觉方面的游戏，比如贪吃蛇等。

应用：虚拟拖拽系统在虚拟培训和模拟应用中发挥重要作用。例如，在医学培训中，学生可以使用虚拟拖拽系统来模拟手术操作，提高技能和手眼协调能力。在虚拟游戏和娱乐中也得到广泛应用。玩家可以使用手势或控制器来拖拽游戏中的角色、道具或物体，与虚拟环境进行互动，增加游戏的沉浸感和交互性。

`17 贪吃蛇游戏`

地址：Opencv项目实战：17 贪吃蛇游戏

介绍：这次是一个有意思的计算机视觉游戏——贪吃蛇，我们以食指为蛇头，不断的移动我们的手指，当吃到甜甜圈的时候，蛇身增长，当食指停止或触碰蛇身时，游戏结束。点击'r'将重新开始游戏。

应用：计算机视觉游戏贪吃蛇的应用是基于虚拟现实（VR）或增强现实（AR）技术的交互式游戏体验。通过计算机视觉技术和手势识别，将玩家的手指作为贪吃蛇的控制器，创造了一种全新的游戏体验。

`18 人体姿态检测`

地址：Opencv项目实战：18 人体姿态检测

介绍：mediapipe中有人体姿态检测的功能，今天我们就将实现最最基础的人体姿态估计项目，它的应用还是有很多的，比如：AI锻炼检测标准、老人跌倒检测等，这些方面其实已经有了很多的参考资料了，当然在我知道的当中用yolo的倒是挺多的。那么今天我们将会通过人物跳舞的视频进行一个姿态的检测。

应用：人体姿态检测可用于虚拟现实（VR）和增强现实（AR）应用。通过识别用户的姿势和动作，可以在虚拟或增强的环境中实时渲染用户的虚拟身体，实现身临其境的交互体验，增强虚拟现实的沉浸感和真实感。

`19 手势控制鼠标`

地址：Opencv项目实战：19 手势控制鼠标

介绍：在Opencv项目实战：15 手势缩放图片中，我们搭建了HandTrackingModule模块，但在这里你还得用本节的HandTrackingModule，因为有些功能并不需要，且也是分散了一些函数的功能。在这一节中，我的想法是通过点单个食指控制move，双指合并控制click，这样就能够实现手势控制鼠标。

应用：手势控制鼠标可以提供无触摸的交互方式，减少对鼠标和键盘的依赖。用户可以使用手势来控制鼠标的移动、点击和滚动等操作，从而实现更加直观和自然的交互体验。

`20 单手识别数字0到5`

地址：Opencv项目实战：20 单手识别数字0到5

介绍：今天要做的是单手识别数字0到5，通过在窗口展示，实时的展示相应的图片以及文字。

应用：这种应用可以用于儿童教育和数字学习。通过展示数字图片和文字，配合单手手势识别，孩子们可以学习和记忆数字0到5，并与相应的图像和文字进行关联，提高数字认知能力和学习兴趣。

`21 美国ASL手势识别`

地址：Opencv项目实战：21 美国ASL手势识别

介绍：你并不需要多么了解深的机器学习算法，我的初衷是通过本项目，激发大家学习机器学习的动力。选择这种手势原因是因为只有24个字母，你的电脑足以带的动，虽然我只训练A、B、C、D等字母的手势识别，但只要掌握了方法，你可以全部弄完24个字母的手势（我觉得没这必要）。

应用：ASL是美国聋人社区的主要交流方式。手势识别技术可以将ASL手势转化为文字或语音，实现聋人与听觉人群之间的无障碍沟通。通过识别ASL手势并转化为文字或语音，聋人可以与非手语使用者进行实时对话、视频通话或传递信息。

`22 物体颜色识别并框选`

地址：Opencv项目实战：22 物体颜色识别并框选

介绍：准确的颜色框选功能，统一使用绿色边界框显示；对物体内部的颜色边缘轮廓进行识别，以白色为边缘，实现更加精细的框选；用户可以选择感兴趣的颜色进行识别，不想要的颜色将被排除；在窗口中的边框旁打印相应的颜色英文字母；对于效果不理想的情况，可通过调试Color_trackbar.py文件进行优化。

应用：在物流和仓储方面，通过物体颜色识别，可以实现对货物的自动识别和分类，提高物流和仓储的效率。例如，将不同颜色的包裹或商品按照目的地进行自动分拣和打包。

`23 物体计数与表单信息`

地址：Opencv项目实战：23 物体计数和表单信息

介绍：本次项目是我的软件课设，自主命题。智能计数指的是对特定物体进行计数（对于比较规整的物体效果很好，例如硬币、钥匙、方块等），表单信息指的是对图片进行计数并写入excel表格当中。从投入到应用角度来看，使用深度学习的方法是更加的准确，而使用opencv的方法有局限性，仍然有改进的空间。

应用：物体体计数能够对场景中的物体进行准确的计数，为决策和统计提供重要依据；而表单信息则能够自动化地将检测到的信息整理并存储，方便后续的分析和查询。在零售、安防、交通监控等领域发挥着重要作用。

`24 石头剪刀布`

地址：Opencv项目实战：24 石头剪刀布

介绍：简单的自娱自乐的计算机视觉互动游戏，石头剪刀布，使用random生成随机数，用于模拟AI窗口随机出拳，玩家窗口手势识别检测石头、剪刀、布三种手势，根据游戏规则，两方玩家进行比较，按下空格键即为游戏开始，玩家在游戏开始后，有三秒的时间思考出拳策略。计时器会显示在屏幕上。在时间结束后，玩家出拳并与AI进行比较，根据游戏规则判断胜负并累计分数。

应用：简单互动式的计算机视觉游戏。

Auorui / Opencv-project-training