Lernumgebung für natürliche Sprachverarbeitung bei Domain

Über uns

Sprache verstehen —
nicht nur verarbeiten

Domain ist eine deutschsprachige Bildungsplattform für natürliche Sprachverarbeitung. Unsere Kurse richten sich an Entwickler, Linguisten und alle, die NLP von Grund auf verstehen wollen — ohne unnötigen Umweg.

Seit 2015 bauen wir Lernmaterial auf, das technische Tiefe mit verständlicher Sprache verbindet. Kein Marketingsprech, keine Vereinfachung auf Kosten der Genauigkeit.

Zum Lernprogramm

Wie dieses Projekt entstanden ist

Ein kurzer Blick auf die Entwicklung von Domain — von der ersten Vorlesungsreihe bis zur heutigen Plattform.

2015

Gründung in Winnenden

Erste Vorlesungsreihe zu tokenization und morphologischer Analyse, ursprünglich für 18 Teilnehmer konzipiert.

2017

Erweiterung um Sequenzmodelle

Neue Module zu RNN, LSTM und CRF ergänzten das Programm. Erstmals wurden 4 vollständige Kurspfade angeboten.

2020

Transformer-Kurse

Mit dem Aufkommen von BERT und GPT-2 kamen 3 dedizierte Module zu Attention-Mechanismen und Pretraining hinzu.

2024

Plattformneustart

Überarbeitete Kursstruktur mit sequentiellem Aufbau. Heute umfasst das Programm über 60 Lektionseinheiten.

Das Team

Wer hinter den Kursinhalten steht

Unsere Lehrenden arbeiten mit realen Datensätzen und aktuellen Forschungsarbeiten — keine konstruierten Beispiele.

Tobias Wengler

Kursleiter – Computerlinguistik

Tobias hat über 9 Jahre in der Sprachverarbeitung gearbeitet, davon 5 Jahre an Named-Entity-Erkennung für deutschsprachige Medientexte. Er entwickelt Lektionen, die konzeptuelle Klarheit über technische Abkürzungen stellen.

Katarzyna Broel-Plater

Leiterin der Lehrplanentwicklung

Katarzyna strukturiert, welche Themen in welcher Reihenfolge präsentiert werden. Ihr Ansatz basiert auf kognitivem Lastmanagement — jede Lektion setzt auf genau dem auf, was die vorherige etabliert hat.

Wo wir inhaltlich stehen

Das Kursmaterial deckt derzeit 4 inhaltliche Schwerpunkte ab: klassische Sprachmodelle, neuronale Sequenzverarbeitung, Transformer-Architekturen und praktische Evaluierungsverfahren. Jeder Bereich enthält zwischen 12 und 20 Lektionen.

Wir aktualisieren Inhalte im Schnitt alle 8 Wochen, wenn neue Forschungsergebnisse die Darstellung wesentlich verändern. Der folgende Überblick zeigt, wie weit die einzelnen Bereiche inhaltlich ausgebaut sind.

Klassische Sprachmodelle (n-Gramm, HMM) 88 %

Neuronale Sequenzmodelle (RNN, LSTM) 76 %

Transformer und Attention 91 %

Evaluierung und Benchmarks 64 %

Der Bereich Evaluierung ist bewusst noch im Aufbau — wir erweitern ihn derzeit um sprachspezifische Benchmarks für das Deutsche, was mehr Aufwand erfordert als generische Metriken.