Experimente, Evaluierung und Tools
Wintersemester 2025/26
Dozent: Helmut Schmid



  Termine

    VorlesungDienstag10:00 - 12:00 Uhr c.t. in Raum 067
    ÜbungenMittwoch14:00 - 16:00 Uhr c.t. im Rechnerpool Gobi


  Inhalt der Vorlesung
    Es werden verschiedene Methoden der maschinellen Sprachverarbeitung vorgestellt, darunter Finite-State-Transducer, log-lineare Modelle, Conditional-Random-Fields und neuronale Netzwerke. Die Studierenden lernen, die beschriebenen Methoden zu implementieren und auf Probleme der maschinellen Sprachverarbeitung anzuwenden.

    In den Vorlesungen wird Grundlagenwissen vermittelt und die nächste Aufgabe besprochen und genauer spezifiziert. Daher ist eine Teilnahme an der Vorlesung für die Bearbeitung der Aufgaben erforderlich. In den Übungen im Rechnerpool werden Sie die Aufgaben selbständig am Rechner lösen. Dabei können Sie sich bei Schwierigkeiten jeglicher Art direkt oder per Email an mich wenden.


  Aufgaben

    Achtung: Die Aufgaben können noch bis kurz vor der Vorlesung geändert werden. Laden Sie daher immer die neueste Version herunter, bevor Sie mit der Bearbeitung beginnen.

    AufgabeBeschreibungTermin Abgabe bisHinweise
    Aufgabe 1Längste gemeinsame Teilfolge14. 10. 2025 20. 10. 2025
    Aufgabe 2Morphologie mit Finite-State-Transducern21. 10. 2025 27. 10. 2025
    Aufgabe 3Spamerkennung mit log-linearen Modellen28. 10. 2025 3. 11. 2025
    Aufgabe 4CRF-Wortart-Tagger 14. 11. 202510. 11. 2025
    Aufgabe 5CRF-Wortart-Tagger 211. 11. 2025 17. 11. 2025
    Aufgabe 6Sentimentanalyse mit LSTMs18. 11. 202524. 11. 2025
    Aufgabe 7Lemmatisierer 125. 11. 2025 1. 12. 2025
    Aufgabe 8Lemmatisierer 22. 12. 2025 8. 12. 2025
    Aufgabe 9Lemmatisierer 39. 12. 2025 15. 12. 2025
    Aufgabe 10Parser (Vorverarbeitung)16. 12. 2025 22. 12. 2025
    Aufgabe 11Parser (Netzwerk)23. 12. 2025 12. 1. 2026
    Aufgabe 12Parser (Training)13. 1. 2026 19. 1. 2026
    Aufgabe 13Parser (Anwendung)20. 1. 2026 26. 1. 2026

    Hinweise zur Benotung:

    Nicht jeder Kommentar in den Bewertungen führt zu einem Punkteabzug. Manche Kommentare sind nur Hinweise, wie Sie Ihren Code noch verbessern könnten.

    Pro Aufgabe gibt es maximal 10 Punkte. Ihre drei schlechtesten Übungen werden nicht gewertet. Bitte vergessen Sie nicht, sich rechtzeitig zu der Prüfung anzumelden!

    Sie können die Aufgaben in Gruppen von bis zu 3 Personen bearbeiten und gemeinsam abgeben. Gruppenarbeit ist sogar ausdrücklich erwünscht.

    Ihre Programme sollten auf den CIP-Pool-Rechnern lauffähig sein, damit ich sie testen kann. Andere Programmiersprachen als Python sind nicht erlaubt. Es dürfen nur die Standard-Bibliotheken von Python verwendet werden, außer die Aufgabe erlaubt explizit mehr.

    Ihre Lösungen der Aufgaben sollten sich an dem Lösungsansatz orientieren, der in der Vorlesung besprochen wurde. Wenn Sie eine andere Lösung wählen, müssen Sie genau begründen, warum Sie diese bevorzugen.


  Begleitmaterial zur Vorlesung   Benotung
    Ihre Lösungen zu den Aufgaben werden nach diesen Kriterien bewertet:
    • Erfüllt das Programm die gestellte Aufgabe?
    • Ist das Programm gut lesbar/verständlich?
    • Ist das Programm komplizierter als nötig?
    • Gibt es redundante Programmteile?
    • Ist das Programm überall dort kommentiert, wo es für das Verständnis wichtig ist?
    • Ist das Programm effizient (also schnell)?
Centrum für Informations- und Sprachverarbeitung (CIS)