EtiennePasteur / Lettrine

Image Extraction from Digitised Books

Home Page:https://etiennepasteur.github.io/Lettrine/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Lettrine

Build Status GitHub license

Description du projet

Le Bodmer Lab de l'Université de Genève vient d'achever la numérisation d'une importante collection de livres de voyage de la Renaissance, publiés aux XVIe-XVIIe siècles et richement illustrés par des gravures et de cartes. A cet ensemble s'ajoutent plus de 200 éditions du Faust de Goethe, souvent illustrées. Ces deux sets de données sont mis à disposition des participants de Geneva Open Libraries (#GEOPENGLAM) pendant le #OGH17, et en anticipant leur publication sur le site du Bodmer Lab, attendue au printemps 2018.

Ce projet #GEOPENGLAM se propose d'identifier et d'extraire automatiquement les illustrations des ces quelque 50'000 pages. Un processus d'indexation et de “tagging” est par la suite envisagé. Au-delà de ce processus d'analyse quantitative des données, notre ambition est de créer une interface pouvant répertorier les illustrations et permettre aux chercheurs, par la suite de faire des classements et des analyses qualitatives (quelles gravures sont répétées dans plusieurs volumes, quelles similitudes peut-on déceler à travers la collection, etc).

Comment tester le projet sur Debian 8 ?

  1. Cloner le projet
git clone https://github.com/EtiennePasteur/Lettrine
  1. Installer les dépendances
sudo apt-get install libboost-all-dev
sudo apt-get install libopencv-dev
git submodule update --init
  1. Build
mkdir build
cd build
cmake .. && make
  1. Tester
build/Lettrine -d ImagesTests/1072056536/img/

About

Image Extraction from Digitised Books

https://etiennepasteur.github.io/Lettrine/

License:MIT License


Languages

Language:C++ 98.3%Language:CMake 1.0%Language:Makefile 0.4%Language:C 0.4%