Eleftheria1 / Creation-of-Synthetic-Data

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Creation-of-Synthetic-Data

Das Sammeln und Veröffentlichen von Daten war noch nie so einfach wie jetzt. Damit einhergehend werden jedoch zunehmend Verletzungen der Privatsphäreregelungen gefördert. Ein Weg dies zu umgehen bietet die Datensynthetisierung. Hierbei werden statistische Modelle gebaut, die sensible Werte in den Daten mithilfe der anderen Werte schätzen sollen. Ein Beispiel für ein solches statistisches Modell bilden Entscheidungsbäume. Dieses und weitere Verfahren können an drei verschiedenen Datenbeispielen, die sich hauptsächlich an der Anzahl ihrer Variablen unterscheiden, hinsichtlich ihres Nutzens, ihres Reidentifikationsrisikos und ihrer Güte bei der logistischen Regressionsmodellierung getestet werden.

(Data: https://archive.ics.uci.edu/ml/index.php)

About


Languages

Language:R 100.0%