Dieser Blog beschreibt, wie Künstliche Intelligenz Barrieren verringern und einen positiven Einfluss auf das Leben von Menschen mit Behinderung haben kann. Zunächst wird erklärt, was Barrierefreiheit bedeutet und wie sie Menschen mit Beeinträchtigungen betrifft. Anschließend werden verschiedene KI-Anwendungen vorgestellt und klassifiziert, die Menschen mit Behinderungen unterstützen – von Text-zu-Sprache-Technologien über Screenreader bis hin zu Bild- und Objekterkennung. Der Blog beleuchtet auch die Herausforderungen und Probleme, die bei der Nutzung von KI im Kontext der Barrierefreiheit auftreten können.
Einleitung
Themen rund um Künstliche Intelligenz sind aktuell sehr im Trend. Ein großes Versprechen von KI ist es, einen positiven Einfluss auf das Leben von Menschen zu haben. Besonders für Menschen mit Behinderungen und Beeinträchtigungen können KI-Technologien und Anwendungen den Alltag enorm erleichtern und deren Teilhabe am gesellschaftlichen Leben verbessern.

In Deutschland leben etwa 10,4 Millionen Menschen mit einer anerkannten Behinderung, das entspricht etwa 12,6 Prozent der Bevölkerung. Die Form, in der sich die Behinderungen bemerkbar machen, können sehr unterschiedlich sein.
Man unterscheidet zwischen sichtbare und unsichtbare Behinderung. Während manche Menschen auf Rollstühle oder Gehhilfen angewiesen sind, haben andere Einschränkungen, die von außen nicht sofort erkennbar sind, wie chronische Schmerzen, psychische Erkrankungen oder kognitive Beeinträchtigungen.
Viele Menschen haben ein falsches Bild davon, wie Menschen mit Beeinträchtigungen ihren Alltag bewältigen. Häufig wird angenommen, dass sie weitgehend isoliert leben und nicht am gesellschaftlichen Leben teilnehmen. In der Realität leben viele Menschen mit Behinderung komplett selbständig. Unterschiedliche Tools ermöglichen, dass es zum Beispiel eine Vielzahl von blinden Softwareentwickler*innen gibt. Allerdings gibt es für Menschen mit Beeinträchtigungen enorm vielen Barrieren, die ihre Teilnahme am gesellschaftlichen Leben erschweren und sie teilweise sogar ausschließt.

Bedeutung von Barrierefreiheit
Barrierefreiheit bedeutet, dass Menschen mit unterschiedlichen Fähigkeiten gleichberechtigten Zugang zu allen Bereichen des Lebens haben. Dies umfasst nicht nur physische Umgebungen, wie Gebäude und öffentliche Verkehrsmittel, sondern auch digitale Inhalte und Dienstleistungen. Gemäß der Charta der Grundrechte der Europäischen Union stellt Barrierefreiheit für Menschen mit Behinderungen ein fundamentales Recht dar (Artikel 21 und 26).

Ziel von Barrierefreiheit ist es also, Hindernisse zu beseitigen, die Menschen daran hindern, vollständig und selbständig am gesellschaftlichen Leben teilzunehmen.
Dabei ist es wichtig zu beachten, dass Barrierefreiheit nicht nur Menschen hilft, die eine Behinderung haben. Barrierefreiheit nutzt allen Menschen leichter den Alltag zu navigieren.
- Automatische Türen erleichtern das Betreten von Gebäuden für alle, nicht nur Rollstuhlfahrer*innen.
- Texte von Behörden in „Einfacher Sprache“ sind für alle angenehmer zu lesen.
- Untertitel in Videos sind nicht nur für Gehörlose nützlich, sondern auch für Menschen, die in lauten Umgebungen oder in der Stille Videos schauen möchten.
KI-Tools und Systeme
KI-Tools und Systeme lassen sich in verschiedene Kategorien einteilen, die jeweils spezifische Bedürfnisse adressieren.
Text-zu-Sprache und Sprache-zu-Text
Diese KI-Tools sind besonders hilfreich für Menschen mit Sehbehinderungen, Schwerhörigkeit oder motorischen Einschränkungen. Sie ermöglichen es, Texte in gesprochene Sprache umzuwandeln und umgekehrt.
Google Text-to-Speech
Ermöglicht es, digitale Texte in gesprochene Sprache umzuwandeln, was sehbehinderten Menschen das Lesen erleichtert.
Whisper von OpenAI
Ein System zur Generierung von Untertiteln und Transkriptionen, das besonders für Menschen hilfreich ist, die nicht hören können.

Dragon NaturallySpeaking
Eine Sprach-zu-Text-Software, die Menschen mit motorischen Einschränkungen hilft, Texte durch Sprachbefehle zu erstellen.
Screenreader
Ein Screenreader ist unerlässlich, für blinde und sehbehinderte Personen, um digitale Inhalte zu nutzen. Benutzer navigieren durch spezielle Tastenkombinationen, oder Gesten, während der Screenreader den Inhalt vorliest und Anpassungen wie Stimmauswahl und Sprechgeschwindigkeit ermöglicht.
JAWS (Job Access With Speech)
Einer der bekanntesten Screenreader für Computer, welcher insbesondere auch für den Arbeitskontext geeignet ist.
NVDA (NonVisual Desktop Access)
Ein kostenloser Screenreader, der ebenfalls weit verbreitet ist und viele Funktionen bietet.
VoiceOver & TalkBack
Sind jeweils die integrierten Screenreader in den Geräten von Apple und Android

Bild- und Objekterkennung
Dank des Fortschritts in der Bild- und Objekterkennungstechnologie gibt es enorm hilfreiche Apps, um visuelle Informationen für sehbehinderte Menschen zugänglich zu machen. Diese Systeme können per Kamera Objekte, Texte und Bilder im realen Leben erkennen und beschreiben, was sehbehinderten Personen eine verbesserte Orientierung und Interaktion in ihrer Umgebung ermöglicht.
Seeing AI von Microsoft
Mittels Kamera kann auf Objekte/Personen gezeigt werden. SeeingAI erkennt automatisch Objekte, identifiziert Gesichter, gibt Informationen was sich in der Nähe von dem User befindet, liest diese vor und kann weitere Informationen und Kontext liefern..

iOS Lupe-App
Mit der Apple Lupe-App lassen, sich einfach Texte vorlesen, indem mit der Kamera auf analoge Texte gezeigt wird.
Chatbots und virtuelle Assistenten
Virtuelle Assistenten und Chatbots vereinfachen die Interaktion mit digitalen Systemen und ermöglichen einen sehr einfachen Zugang zu Informationen. Statt langen Suchanfragen und Recherchen auf nicht barrierefreien Webseiten kann man Virtuelle Assistenten einfach fragen wie das Wetter wird oder man kann Large Language Models wie ChatGPT um ein Kochrezept bitten.

Alexa von Amazon
Kann mit Sprachbefehlen gesteuert werden und bietet eine Vielzahl von Funktionen, von der Steuerung von Smart-Home-Geräten bis hin zur Beantwortung von Fragen.

ChatGPT
Neben Suchanfragen, können KI-Chatbots Texte zusammenfassen, Informationen bereitstellen oder Texte generieren. Mit multimodalen System wie GPT4o können zudem Texte und Bilder zusammen verarbeiten werden. Damit lassen sich auch direkt Fragen zu Bildern stellen.

AutoVoice
Mit dem Sprachassistenz-System von Google lassen sich einfach Makros erstellen und damit regelmäßig auftauchende Abläufe leicht automatisieren. Zum Beispiel kann ein Makro erstellt werden, um per Sprachbefehl den Navigationsmodus auf dem Smartphone zu starten, die gewünschte Zieladresse einzugeben und dann automatisiert die Route zu starten.
Assistive Technologien für den Bildungsbereich
Im Bildungsbereich können Systeme, die eine Vielzahl von unterschiedlichen Features beinhalten, Schüler und Studenten mit Lernschwierigkeiten oder Behinderungen, beim Lernen unterstützen.
Kurzweil 3000
Eine Software, die Text-zu-Sprache, Sprach-zu-Text, Wortvorhersage, Farbmarkierungen beim Vorlesen und andere Funktionen anbietet, um das Lernen zu erleichtern.
Grammarly
Ein KI-gestütztes Tool, das Rechtschreibung und Grammatik überprüft und Verbesserungsvorschläge macht, was besonders hilfreich für Menschen mit Legasthenie ist.

Sprachvereinfachung
Tools zur Sprachvereinfachung helfen, komplexe Texte in leichter verständliche Sprache umzuwandeln, was besonders hilfreich für Menschen mit kognitiven Beeinträchtigungen oder Sprachbarrieren.
ChatGPT
Mit ChatGPT lassen sich komplizierte Texte in verständliche Sprache zusammenfassen
Redaktionstool für Einfache/Leichte Sprache
Unser Redaktionstool ist dafür ausgelegt auch lange Texte in Einfache und Leichte Sprache zu übersetzten. Das Tool dient Behörden und Übersetzungsbüros zur Unterstützung Dokumente und Websiten barrierefrei in Leichter Sprache zur Verfügung zu stellen. Dabei nutzt der Übersetzer die Regeln, welche es für Leichte Sprache gibt.

Interaktionshilfen
Interaktionshilfen unterstützen Menschen, die aufgrund von motorischen Einschränkungen Schwierigkeiten haben, herkömmliche Eingabemethoden wie Maus, Tastatur oder Touchscreens zu nutzen.
Jouse3
Mit Hilfe sogenannter Sip-and-Puff-Systemen können Benutzer*innen Computer und digitale Geräte mit dem Mund steuern. Die Maus wird per Joystick mit dem Mund bewegt und Links/Rechtsklicks werden über Ein- und Ausatmen durch einen angebrachten Schlauch durchgeführt.
EyeOn Elite
Der Eyetracker von eyetech ermöglicht freihändig mit dem Computer zu interagieren. Es erfasst die Bewegungen der Augen und übersetzt diese in Mausbewegungen und Klicks.
Probleme und Risiken
Halluzinationen bei KI-Systemen
Im KI-Kontext versteht man unter Halluzinationen, wenn eine Künstliche Intelligenz falsche Informationen generiert. Ein Beispiel für eine Halluzination in KI-Systemen ist, wenn eine Anwendung zur Bilderkennung das gesamte Bild oder einzelne Objekte in dem Bild falsch erkennt. Gerade für blinde Personen können diese Fehler sehr problematisch sein. Ein weiteres Beispiel ist die Veränderung von wichtigen Daten oder Zahlen durch die KI.

Fehlerhafte Sprachausgabe
Traditionell wurde bei der Sprachausgabe Sprachschnipsel erstellt und dann zu einem kohärenten Audio zusammen gefügt. Zunehmend wird das Vorgehen jedoch durch einen generativen Ansatz ersetzt. Hier wird Sprache von Grund auf erzeugt, was jedoch zu Problemen führen kann. Beispielsweise können Zahlen falsch wiedergegeben oder ganze Wörter verschluckt werden. Solche Verfälschungen können schwerwiegende Missverständnisse verursachen, insbesondere für Menschen, die auf genaue Informationen angewiesen sind.
Erstellung von Alt-Texten
Alt-Texte sind kurze Beschreibungen von Bildern, welche auf der Website hinterlegt und von Screenreadern vorgelesen werden.
Alt-Texte können auch von KI-System erstellt werden. Da den Systemen bei der Erstellung der Kontext fehlt, liefern KI-generierte Alt-Texte daher häufig nur grobe Beschreibungen und ignorieren wichtige Details, die für den Gesamtkontext entscheidend sind.
Die automatische Erstellung von Alt-Texten kann für den User hilfreich sein, wenn auf der Website keine Alt-Texte vorliegen, sollten vom Webseitenbetreiber jedoch nicht für die massenhafte Erstellung von Alt-Texten genutzt werden.
Vorurteile in Trainingsdaten
Künstliche Intelligenzen sind ein Abbild der Daten auf welchen sie trainiert worden sind. Aus dem Grund können können KI-Systeme Vorurteile (Bias) aus den Trainingsdaten übernehmen. Gerade Minderheiten wie zum Beispiel Menschen mit Behinderungen sind davon betroffen. So ein Bias kann also dazu führen, dass Minderheiten nicht richtig repräsentiert und von der KI benachteiligt werden.

Kritik an Accessibility Overlays
Accessibility Overlays versprechen, mit einem Klick eine Website barrierefrei zu machen, was jedoch meistens nicht funktioniert. Screenreader geraten oft in Konflikt mit den Overlays, und bestehende Barrieren werden nur überdeckt, anstatt langfristig und nachhaltig behoben zu werden. Overlays können die Struktur von Seiten nicht ändern, sondern nur Kontrast, Schriftgrößen und kleine Fehler anpassen. Wichtige Punkte wie zum Beispiel: fehlende Überschriften, Alt-Texte oder Labels bei Formularen werden nicht angepasst.
Das sind jedoch wesentliche Punkte, die auf Webseiten sichergestellt sein müssen, um Menschen eine barrierefreie Experience zu liefern
Ausblick
Den Sprung, den die Entwicklung von Künstliche Intelligenz in den letzten 2 Jahren, insbesondere im Bereich Text und Sprache, gemacht hat, ist enorm!
Systeme wie Siri, Alexa & Co. welche die versprochenen Erwartungen in den letzten Jahren enttäuscht haben, könnten durch die Verbesserung von Voice to Text und den Fähigkeiten von Large Language Models eine Renaissance erfahren. Das zeigt zum Beispiel die angekündigte Integration von ChatGPT in Siri.
Auch die Entwicklung von multimodalen KIs lässt viel versprechen. Was schon möglich ist, zeigt die Microsoft App VisionAI und das neue GPT4o Modell von OpenAI.
multimodal [von latein. multus = viel, modalis = die Art und Weise bezeichnend] Zahlreiche Sinnesorgane unterschiedlicher Modalität betreffend, z.B. die integrative Verarbeitung von Informationen aus verschiedenen Sinnesorganen im Zentralnervensystem.

Multimodale KIs erweitern also die Art und Weise, wie mit KI-Systemen kommuniziert werden kann. Sowohl welcher Eingaben erlaubt sind (Text, Bilder, Videos, Ton), also auch welche Ausgaben generiert werden können. Diese Erweiterung ist, was die Barrierefreiheit angeht, absolut entscheidend. Sie ermöglicht Menschen, deren Sinne oder motorische Fähigkeiten beeinträchtigt sind, alternative Möglichkeiten, mit der Umwelt zu interagieren, sich Informationen oder Unterstützung zu beschaffen.
Allein die Kombination dieser unterschiedlichen Technologien birgt enormes Potenzial. Zudem werden immer mehr Anwendungen, welche KI-Modelle nutzen, für unterschiedlichste Use-Cases zum Abbau von Barrieren entwickelt. Systeme werden personalisierter und damit fähiger, sich auf die individuellen Bedürfnisse des Users einzustellen und dazuzulernen.
Alle diese Tools sind hilfreich, um Menschen ein selbstbestimmteres Leben zu ermöglichen und ihre Autonomie zu fördern und für viele Menschen ein fester und nicht wegzudenkender Bestandteil im Alltag und auf der Arbeit. Jedoch darf diese Entwicklung keine Ausrede, seine grundlegende Arbeit an Barrierefreiheit zu vernachlässigen und Barrieren strukturell abzubauen.
Assistenz ist keine Alternative für Barrierefreiheit
- Assistenzsysteme können ausfallen
- KI-Systeme sind nicht rechenschaftspflichtig
- Tools & Anwendungen können Fehler aufweisen.
Insbesondere der Staat und Behörden tragen eine große Verantwortung Richtlinien aufzusetzen und sicherzustellen, dass ihre (digitalen) Angebote für alle Bürger zugänglich sind. Aber auch alle anderen Betreiber*innen von Webseiten und Anwendungen müssen sicherstellen, dass ihre Inhalte barrierefrei gestaltet. Nur so kann gewährleistet werden, dass alle Menschen, unabhängig von ihren individuellen Fähigkeiten, gleichberechtigten Zugang zu Informationen und Dienstleistungen haben und aktiv am gesellschaftlichen Leben teilnehmen können.