DL network for classifying gender in Brandberg rock art
Das Convolutional Deep Neural Network zur Klassifizierung ist in den Python-Scripten unter /script/ definiert. Basis bietet TensorFLow mit dem TFLearn-Wrapper.
network_standalone.py
Speichert das trainierte Netzwerk zur späteren Inferenz/ Klassifikaiton im webinterface ab,
network.py
bietet nach dem Training in der Python-Konsole die möglichkeit der direkten Klassifikation eines Eingabebildes mittels EIngabe eines Bild-Pfades
Ein Web-Interface zur einfacherern Inferenz von Eingabebildern liegt in /webinterface/. Die Oberfläche bietet ein Crop-Tool für das Zuschneiden des Eingabebildes und eine Vorschau des ausgeschnitten Bildes. Das Ergebnis der Inferenz wird nach einigen Sekunden in einem Kuchendiagramm dargestellt.
- Die enthaltenden Dateien müssen auf einem PHP-Fähigen Webserver (z.B. Apache) liegen
- Ein vorher trainiertes und abgespeichertes Netzwerk (siehe
script/network.py
) muss im Root-Ordner des Webservers im Verzeichnis/models/master/
liegen - Auf dem Host-Rechner müssen Tensorflow und TFLearn installiert sein
- DNN verbessert:
- Entfernen von zwei Convolution-Layern, um das Netzwerk auf die einfacheren Formen der Bandberg-Malereien (im Vergleich zu der MINST-Datenbasis aus dem Beispiel-Netzwerk, dass wir als Basis genutzt haben) anzupassen
- Overfitting durch weniger Trainingsschritte verringert
- Web-Interface:
-
DNN weiter optimieren:
- Performance bei größer werdender Datenbasis prüfen (Bessere Ergebnisse bei größerer Varianz der Trainingsdaten?)
- Entfernen von Farbe/ Konventierung in Graustufen zum schnelleren trainieren und bestmöglichen Abstraktion von Merkmalen zur Erkennung von Geschlecht
-
Zusammenarbeit mit anderen Gruppen:
- Datenbais automatisiert füllen
- Automatsiert ausgeschnittene Figuren mit Verweis auf Tabellendaten, damit Figuren mit zugewiesenem Geschlecht als Trainingsdaten genutzt werden können
-
Web-Interface:
-
kleine Datenbasis vorbereitet:
- insgesamt 50 Figuren ausgeschnitten und in Geschlechter aufgeteilt
- Hintergrund entfernt (transparent)
- Seitenverhältnis 4:5
-
Daten in verarbeitbare Form gebracht via TFLearn "Image PreLoader"-Funktion
-
Erstes Convolutional Neural Network aus einem Beispiel zur Klassifizierung vom CIFAR-10 dataset mit den Figuren-Daten erfolgreich trainert (Python-Script)