Fileman permet d'indexer, explorer et manipuler des répertoires contenant de nombreux fichiers.
- Scanner un répertoire
- Indexer les fichiers en BDD
- par taille
- par date
- par path
- par extension
- Scanner le contenu binaire des fichiers pour trouver les duplicates.
- React TS front setup
- Rapport sommaire (nb de fichiers, total size...)
- Tree map par size
Il faut pouvoir ignorer des sous répertoires au moment du scan. Ex :
- fichiers systèmes
- fichiers binaires compilés
Il faut mettre en place des filtres. Au niveau fichier:
- Par extension de fichier
- Par path/name regex de fichier Au niveau subdir crawling
- Ne pas explorer le dir s'il contient un fichier xxx (pour filter les BDD de code)
Prévoir un rapport json pour savoir ce qui a été ignoré.
S'inspirer de .gitignore
- Chercher par :
- extension
- name
- Rapport json de tous les fichiers dupliqués
Features
- supprimer les doublons
- basés sur lastModified + size
- ou sur un full hash (type md5)
- utiliser des hardlink pour l'importation du fichier et pour supprimer les doublons dans leur répertoire d'origine)
- dedupliquer les doublons
- merger les informations des doublons (les tags)
- se souvenir des origines (multiples en cas de doublons) des fichiers
- repertoire racine
- chemin racine
- zéro overwrite ou perte d'information
- export d'un jeu de fichiers selon un pattern lié à la priorité des tags
- du moins discriminant au plus discriminant
- sauvegarde cryptée (fichiers + db) dans AWS Glacier (ou equivalent)
- aucune limitation de volume ou de nombre de fichiers
Options
- accès aux fichiers et aux recherches depuis nextcloud
- manipulation des tags par batch de fichier, supprimer/ajouter un tag pour N fichiers obtenus à partir d'une recherche
- recherche par tag, extension, size et date
- renommage et merge des tags