hermesj / JobAd_IE

Classification (Zone Analysis) and Information Extraction From Job Ads

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Job Ad Classification

Multi-Label Classification for Job Ads

Code for Multi-Label Classification Job Ads into focuses as part of my Bachelor's Thesis


Das vorliegende Framework dient dazu, Stellenausschreibungen mithilfe von Trainingsdaten in Schwerpunkte zu klassifizieren oder die Klassifikation zu evaluieren. Desweiteren ist es möglich, die Trainingsdaten im Hinblick auf die Verteilung ihrer Schwerpunkte zu analysieren. Alle ausführbaren Klassen befinden sich im package src/main/java/de/uni_koeln/spinfo/ml_classification/applications

Um die Klasse SingleExperimentExecution auszuführen, werden folgende Dateien benötigt:

  • Trainingsdaten (.xlsx)
  • Liste mit möglichen Schwerpunkten (.xlsx)
  • Konfigurationsdatei (ml_classification/configurations.txt)

In der Datei ml_classification/configurations_manual.pdf wird beschrieben, welche Werte als Konfigurationen zulässig sind. In der Konfigurationsdatei lassen sich zudem die Pfade zu den anderen drei Dateien angeben.


Die Klasse JobAdClassificationApp benötigt zu den genannten Dateien noch eine .xlsx-Datei mit den zu klassifizierenden Daten.

About

Classification (Zone Analysis) and Information Extraction From Job Ads


Languages

Language:Java 100.0%