GePart ist ein deutsches Parteiklassifizierungsmodell, das in der Lage ist, die wahrscheinlichste Partei für einen gegebenen Text vorherzusagen. Dieses Repository ist Teil eines Studentenprojekts an der Dualen Hochschule Baden-Württemberg während des 5. und 6. Semesters meines Bachelorstudiums in Informatik.
Für das Training des Klassifikationsmodells wurden verschiedene Quellen verwendet (z. B. Reden, Tweets und Parteiprogramme) mit Worteinbettungen wie FastText und Transformer-Modellen wie BERT.
Gehostetes Modell
Das Modell basiert auf einer deutschen Version des DistilBERT-Modells. Das Modell kann auf Hugging Face gefunden und getestet werden.
Wichtig: Bei dem Modell handelt es sich um ein Proof-of-Concept. Es ist nicht für den produktiven Einsatz geeignet. Auf dem Testdatensatz erreicht das Modell eine Genauigkeit (F_1
) von 0,58
.
Lizenz
Dieses Projekt steht unter der GNU GPL V3 Lizenz.