Posts

Posts mit dem Label "Masakhane" werden angezeigt.

Maschinelle Intelligenz & Audio-Daten für afrikanische Sprachen

Maschinelle Intelligenz & Audio-Daten für afrikanische Sprachen Afrikanische Sprachen sind unglaublich vielfältig – und genau das macht sie spannend, aber auch herausfordernd für maschinelle Intelligenz. Während Englisch oder Mandarin in der KI-Forschung mit Datensätzen im Überfluss glänzen, sieht es in vielen afrikanischen Regionen ganz anders aus. Sprachmodelle stolpern dort schnell, weil schlichtweg das Material fehlt: zu wenige Transkriptionen, zu wenig Audio, zu wenig Vielfalt im Sprechstil. Dabei sprechen wir hier nicht von ein paar Dialekten, sondern von über 2.000 Sprachen. Einige mit eigenen Schriftsystemen, andere rein mündlich überliefert. Und genau da wird’s interessant – und kompliziert. Warum Audio-Daten so wichtig sind Audio ist der Schlüssel. KI-Systeme können nur so gut sprechen oder verstehen, wie sie es gelernt haben. Ohne genügend Audio-Daten – also echte Sprachaufnahmen von Muttersprachler*innen – bleibt jede KI stumm oder fehlerhaft. Ein Beispiel: Ein S...

Lokale und indigene Sprachen Afrikas – Zwischen Verschwinden und digitaler Wiedergeburt

Bild
Lokale und indigene Sprachen Afrikas – Zwischen Verschwinden und digitaler Wiedergeburt Afrika spricht. Und wie. Über 2.000 Sprachen klingen auf dem Kontinent – von Hausa über Xhosa bis zu Wolof. Manche sind weit verbreitet, andere existieren nur noch in kleinen Gemeinschaften, oft mündlich überliefert. Und genau da liegt das Problem: Was nicht digital existiert, verschwindet leise. Wenn Sprachen keine Tastatur haben Viele afrikanische Sprachen wurden jahrhundertelang ohne Schriftform weitergegeben. Wörter lebten in Erzählungen, Liedern, Ritualen. Erst in den letzten Jahrzehnten entstanden Schriftsysteme oder standardisierte Schreibweisen. Zum Beispiel für Yoruba , das heute Unicode-Unterstützung hat – wichtig für den digitalen Raum. Denn ohne Schriftzeichen in Apps, Tastaturen oder Suchmaschinen bleibt eine Sprache unsichtbar. Digitale Unsichtbarkeit ist gefährlich. Wer sie spricht, steht sprachlich plötzlich „offline“. Und genau hier setzt eine neue Bewegung an: junge Linguist:i...