Eagle104fred / DatasetDe-duplication

aHash数据集图片去重

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

介绍

本项目使用aHash,目的是去除重复的数据集图片,Hash部分来自于Github项目:https://github.com/7WebPages/comparer

目录结构

  • Root
    • DeleteSameImage.py
    • HashUtils.py
    • datasets
      • images1
      • images2

快速开始

  • 按照目录结构构件项目目录,然后直接运行DeleteSameImage.py。

依赖

  • opencv
  • PIL

About

aHash数据集图片去重


Languages

Language:Python 100.0%