Episodes

  • AI & Data Podcast: Data-to-Text mit KI – Wie aus Daten echte Texte werden
    Apr 29 2025

    In der ersten Folge unseres neuen AI & Data Podcasts dreht sich alles um ein hochaktuelles Thema aus dem Bereich generative KI: Wie lassen sich strukturierte Daten automatisch in flüssige, verständliche Texte verwandeln – ganz ohne manuelles Schreiben? Genau das hat unser Gast Jakob Schuster in seiner Masterarbeit untersucht. Gemeinsam mit Host Larissa Haas spricht er über Herausforderungen, Methoden und die erstaunliche Fähigkeit von Sprachmodellen, scheinbar „intelligente“ Texte zu generieren.

    Was mich wirklich überrascht hat: Das Modell konnte oft sinnvoll verbalisieren, obwohl es die Daten eigentlich nicht vollständig verstanden hat – es klang trotzdem erstaunlich plausibel. (Jakob Schuster, PhD Uni Heidelberg)

    Dieses Mal im Fokus: Data-to-Text, Sprachmodelle und Halluzinationen

    In dieser Episode werfen wir einen Blick auf einen konkreten Use Case: automatisierte Fußballspielberichte, die aus strukturierten Spieldaten generiert werden. Jakob erklärt, wie er dafür mit verschiedenen Sprachmodellen gearbeitet hat – und welche typischen Fehler dabei immer wieder auftreten. Besonders im Fokus: sogenannte Halluzinationen, also Textelemente, die sich das Modell frei ausdenkt, obwohl sie in den Ausgangsdaten gar nicht enthalten sind.

    Hier ein Überblick über die wichtigsten Themen:

    • Data-to-Text: Wie sich aus strukturierten Daten automatisiert Texte generieren lassen – und wo dabei die Grenzen aktueller Modelle liegen.
    • Halluzinationen: Warum Sprachmodelle manchmal Informationen erfinden – und welche Arten von Halluzinationen unterschieden werden müssen (intrinsisch vs. extrinsisch).
    • Modularität: Wie sich Ansätze zur Textgenerierung flexibel an neue Domänen oder Datenformate anpassen lassen – z. B. für andere Sportarten oder Fachbereiche.
    • In-Text Learning: Welche Rolle Beispiele im Prompt spielen – und wie man Modelle auch ohne aufwändiges Fine-Tuning besser auf neue Inhalte vorbereitet.
    • Übertragbarkeit: Was nötig ist, um Data-to-Text-Ansätze aus dem Prototypenstadium in die Praxis zu bringen – und welche Rolle Trainingsdaten dabei spielen.
    Der Ausblick: Von Spielberichten zur Text-Automatisierung im Unternehmen

    Auch wenn das Projekt auf Fußballspielberichten basiert, zeigt es beispielhaft, welches Potenzial in Data-to-Text steckt – etwa für automatische Reportings, Content-Erstellung oder Assistenzsysteme. Besonders spannend wird es, wenn Unternehmen anfangen, eigene domänenspezifische Modelle zu trainieren oder bestehende Ansätze modular weiterzuentwickeln. Genau darum wird es auch in den kommenden Episoden gehen: Wie können wir KI wirklich produktiv einsetzen – sicher, skalierbar und nachvollziehbar? Jetzt reinhören – und entdecken, wie moderne KI aus Daten verständliche Texte macht.

    Jetzt reinhören – und entdecken, wie moderne KI aus Daten verständliche Texte macht.

    Show more Show less
    33 mins
adbl_web_global_use_to_activate_webcro805_stickypopup