Neues KI-System übersetzt Hirnaktivität in Wörter und Sätze
Ein Leben ohne Sprache – das ist kaum vorstellbar. Wir nutzen Sprache, um zu diskutieren, zu streiten, unsere Gefühle auszudrücken und unsere Bedürfnisse mitzuteilen. Und doch: Rund 5000 Menschen verlieren in der Schweiz jedes Jahr infolge eines Schlaganfalls, eines Hirntumors oder einer anderen Hirnschädigung vorübergehend oder für immer ihre Sprache. Das zeigen Zahlen der Betroffenenorganisation Aphasie Suisse.
Seit langem wird erforscht, wie Betroffene ihre Fähigkeit zur Kommunikation wiedererlangen können. Gelingen soll dies mit sogenannten Hirn-Computer-Schnittstellen, oder kurz BCIs (Englisch für «Brain Computer Interface»). Die Systeme erfassen mittels Elektroden die Hirnaktivität, die quasi ein Abbild der Gedanken ist. Die erfassten Signale werden dann weitergeleitet an einen Computer, welcher sie wiederum entschlüsselt und in Sprache übersetzt. Solche Sprachdekodierer werden zumindest im Forschungsumfeld immer besser.
System nutzt KI-Vorläufermodell von ChatGPT
Allerdings: Gute Ergebnisse wurden nur mit Elektroden erzielt, die chirurgisch direkt ins Gehirn implantiert werden. Nicht-invasive BCIs, die keine OP benötigen, erzeugten hingegen nur schwache Resultate. Bis jetzt. Denn soeben haben Forscher um den Neurowissenschafter und Informatiker Alexander Huth von der Universität Texas im Fachblatt «Nature Neuroscience»eine vielversprechende Arbeit vorgelegt.
Sie erfassten und entschlüsselten die Hirnaktivität von drei gesunden Studienteilnehmenden, während diese in einer Magnetresonanztomografen-Röhre (MRT) lagen. Wie bei allen Hirn-Computer-Schnittstellen bestand das Ziel zunächst darin, jede Silbe, jedes Wort und jeden Satz mit einem bestimmten Hirnwellen-Muster zu verknüpfen. Dafür lauschten sie während 16 Stunden verschiedenen Podcasts und vergegenwärtigten sich in Gedanken das Gehörte. Die entsprechenden Hirnscans verknüpften die Forscher daraufhin mit einem KI-Sprachmodell, genauer: GPT-1, einem Vorläufer des Modells von ChatGPT.
Anschliessend wurden die zwei Probandinnen und Probanden aufgefordert, an etwas zu denken. Und das System musste dann den Inhalt der Gedanken erraten. Zwar generierte der Computer keine Wort-für-Wort-Abschrift der Gedanken, aber er spuckte eine ungefähre Idee dessen aus, was den Studienteilnehmenden gerade durch den Kopf ging, wie die Forscher berichten. Eine Teilnehmerin dachte demnach beispielsweise: «Ich habe noch keinen Führerschein». Der Computer übersetzte: «Sie hat noch nicht einmal angefangen, Autofahren zu lernen.»
«Die Studie ist aus Sicht der Forschung wirklich sehr interessant», sagt Jonas Zimmermann, Neurowissenschafter vom Wyss Center für Neurotechnologie in Genf und selbst stark involviert in die Forschung rund um Sprachentschlüsselung. Aber, betont er, klinisch habe die Methode noch keinerlei praktische Relevanz.
Zwar bestätigt er, dass das System laut Studienergebnissen in der Tat abschätzen könne, worum sich der gedachte Inhalt in ungefähr drehe. Doch die Feinheiten erfasse es nicht – und genau die seien entscheidend dafür, ob wir einander verstehen oder nicht. Er sagt es so: «Es ist, als würde man die Geschichte ‹Mord im Orientexpress lesen›. Aber es wäre nie klar, wer denn nun Opfer und wer Täter ist.»
Zudem ist ein MRT nicht wirklich alltagstauglich. Dass es einmal kleine, MRT-ähnliche Geräte gibt, die man wie einen Helm im Alltag tragen könnte, davon geht Zimmermann nicht aus. «Das ist physikalisch ein Ding der Unmöglichkeit, weil es für die Signalerfassung sehr starke Magnetfelder braucht.»
Sprache in Echtzeit entschlüsseln
Zimmermann und sein Team in Genf legen den Fokus deshalb seit längerer Zeit auf invasive Hirn-Computer-Schnittstellen. Gerade eben haben sie ein vierjähriges Projekt mit europäischen Partnern gestartet. Mit kleinen Elektroden-Implantaten und verbesserten KI-Algorithmen sollen Menschen, die ihr Sprache verloren haben, wieder kommunizieren können.
Dies soll zunächst gelingen, indem die Patienten allein mit der Kraft ihrer Gedanken einen Cursor auf einem Bildschirm steuern. Etwa, um SMS-Nachrichten zu verschicken. «Langfristig arbeiten wir darauf hin, Gedanken in Echtzeit zu dekodieren und in gesprochene Sprache umzuwandeln», sagt Zimmermann.
Bereits in einer früheren Studie gelang es dem Genfer Team, einem Patienten, der sich nicht mehr mitteilen konnte, die Kommunikationsfähigkeit teilweise zurückzugeben. Mit dem Elektroden-Implantat konnte der 37-jährige Mann mit «ja» und «nein» auf Fragen seiner Familie und des Pflegepersonals antworten.