So. 13.07.2025— Redaktion
Künstliche Intelligenz hat nun bald in alle Bereiche unseres Lebens Eingang gefunden, noch ist aber unklar welche Auswirkungen die Abhängigkeit von KI auf unser Denken hat. Eine neue Studie zeigt nun, dass die Verwendung des Sprachmodells ChatGPT für das Schreiben von kurzen Aufsätzen die Gehirnaktivität reduzieren und das Gedächtnis beeinträchtigen kann.
Computermodelle, die mithilfe von Methoden der künstlichen Intelligenz (KI) auf die Verarbeitung sprachlicher Daten trainiert wurden - sogenannte Große Sprachmodelle (LLM) -, haben in rasantem Tempo weltweite Verbreitung gefunden. So hat beispielsweise ChatGPT (von OPenAI) 2,5 Jahre nach der Einführung einer kostenlosen Version im November 2022 rund 10 % der Weltbevölkerung - 8oo Millionen User - erreicht und wird von diesen z.T. täglich im privaten und/oder beruflichen Umfeld genutzt. Die breiten Anwendungsmöglichkeiten reichen vom Recherchieren, Erstellen von Zusammenfassungen und Generieren von Inhalten über Lernen und Ausbilden zu Datenverarbeitung und Unterstützung beim Erstellen von Programmen. (Aktuelle ChatGPT-Statistiken: https://doit.software/de/blog/chatgpt-statistiken#screen1). Dass solche KI-Tools grundlegend zur Veränderung von Wirtschaft, Politik und Gesellschaft beitragen, ist offensichtlich, versprechen sie doch den Nutzern ihre Leistung zu steigern und diese schneller erbringen zu können. Insbesondere bedeuten sie auch eine Revolution für die Art und Weise wie und was wir lernen, das heißt für Erziehung und Bildung.
Die nahezu unermesslichen Möglichkeiten, die uns LLMs bieten, werfen aber auch Bedenken auf, da sich Nutzer mehr und mehr auf die allgegenwärtige Verfügbarkeit von sofort erzeugten, auf ihre individuellen Erfordernisse zugeschnittenen (personalisierten), sprachlich einwandfrei verfassten Informationen und Lösungen verlassen. Wie weit aber hält eine derartige Abhängigkeit von solchen KI-Tools davon ab selbst zu analysieren, zu bewerten und Entscheidungen zu treffen, in anderen Worten kritisch zu denken? Wie weit führen Bequemlichkeit und Gewöhnung an diese KI-Tools dazu, dass es immer schwieriger wird ohne diese noch arbeiten zu können?
Wie weit sind die für Erziehung und Bildung wichtigen Eigenschaften wie Gedächtnis, Engagement und Kreativität davon betroffen?
Speziell mit der letzten Frage befasst sich ein von Nataliya Kosmyna geleitetes Forschungsprojekt „Your Brain on ChatGPT” am Massachusetts Institute of Technology (MIT, Cambridge, US), dessen erste Ergebnisse im Juni d.J. unter dem Titel "Ihr Gehirn und ChatGPT: Anhäufung kognitiver Defizite, wenn ein KI-Assistent für das Verfassen von Aufsätzen angewandt wird" auf Arxiv erschienen sind [N. Kosmyna et al., 2025]. Die Forscher hatten darin in überzeugender Weise dargelegt, dass die Nutzung von ChatGPT für den genannten Zweck zu messbaren Veränderungen der Gehirnaktivität führt. Auch, wenn es sich dabei um eine vorläufige Version handelt, die noch nicht den Prozess der Begutachtung (Peer-Review) durchlaufen hat, so fand die über 200 Seiten starke Arbeit ein enormes Echo in Medien und sozialen Netzwerken, deren z.T. reißerische Schlagzeilen von erschreckenden, verheerenden Folgen des KI-Gebrauchs (führt zur Atrophie des Gehirns, Verdummung, Erosion des kritischen Denkvermögens, etc.) sprachen.
Studie: Nutzung von ChatGPT für das Verfassen von kurzen Aufsätzen
Wie die Studie ablief
An der 4 Monate dauernden Studie nahmen insgesamt 54 nach dem Zufallsprinzip ausgewählte Studenten und Absolventen der Hochschulen im Großraum Boston im Alter zwischen 18 und 39 Jahren und beiderlei Geschlechts teil. Diese Testpersonen sollten an drei im Abstand von 1 Monat abgehaltenen Sitzungen innerhalb von 20 Minuten einen kurzen Aufsatz schreiben; eingeteilt in drei vergleichbar zusammengesetzte Gruppen sollte eine Gruppe durch ChatGPT unterstützt arbeiten ("LLM"), die zweite Gruppe unter Nutzung des Google-Browsers aber ohne Zugriff auf LLM ("Search-Engine") und die dritte Gruppe ohne jegliche Hilfsmittel nur mit dem eigenen Wissen ("Brain only"). Bei jeder der 3 Sitzungen standen jeweils drei Themen zur Auswahl, die alle aus SAT-Tests (Zulassung-Tests zu Bachelor-Studiengängen; Anm. Redn.) stammten und recht allgemein gehaltene Problemstellungen umfassten. Beispielsweise waren die zur Auswahl stehenden Themen in Sitzung 1: Loyalität (Erfordert echte Loyalität bedingungslose Unterstützung?), Glück (Müssen unsere Errungenschaften anderen zugutekommen, damit wir wirklich glücklich sind?) und Auswahlmöglichkeiten (Ist es ein Problem, zu viele Auswahlmöglichkeiten zu haben?).
An einer optionalen 4. Sitzung nahmen nur 18 Personen teil, wobei nun die Aufgaben vertauscht wurden. Zu einem Thema, das sie bei einer der vorigen Sitzungen schon gewählt hatten, schrieben Personen, die zuvor mit Hilfe von ChatGPT ("LLM") gearbeitet hatten, nun ohne zusätzliche Hilfsmittel ("LLM zu Brain") und diejenigen, die ohne Hilfsmittel ("Brain-only") gearbeitet hatten, durften nun ChatGPT verwenden ("Brain zu ChatGPT"). Die Gruppe "Search Engine" fehlte.
Während des Schreibens wurde die Gehirnaktivität der Probanden mittels Elektroenzephalografie (EEG) über 32 an verschiedenen Hirnregionen positionierten Elektroden gemessen (Abbildung 1). Auf Grund der hohen zeitlichen Auflösung der EEG lassen sich die räumlich verteilten zeitlich dynamischen Muster der neuronalen Aktivität und Vernetzung (Konnektivität - siehe unten) gut beschreiben. Die Analyse erfolgte mittels der Dynamischen Direct Transfer Function (dDTF) ; für Details dazu wird auf die Originalarbeit hingewiesen [N. Kosmyna et al., 2025].
Abbildung 1. Während des Verfassens der Texte trugen die Studienteilnehmer ein EEG-Enobio headset mit 32 Elektroden zur Erfassung der Gehirnaktivitäten und eine AttentivU-Brille, die Augenbewegungen aufzeichnet. (Quelle: Figure 4. aus N. Kosmyna et al., 2025, Lizenz: cc-by-nc-sa) |
Anschließend an den schriftlichen Test wurden den Autoren eine Reihe von Fragen dazu gestellt: Warum sie das Thema gewählt hatten, ob und wie sie den Text strukturierten, wie sie die LLM/Search-Engine nutzten, ob Sie einen Satz aus dem Text auswendig zitieren könnten, ob sie die wesentlichen Punkte zusammenfassen könnten und wieweit sie ihre Arbeit als eigenständig ansähen und damit zufrieden wären.
In der 4. Sitzung hatten die Teilnehmer noch zusätzliche Fragen zum Thema des Aufsatzes zu beantworten, wieweit sie sich an das, was sie darüber früher geschrieben hatten, noch erinnern könnten, und welche Version ihnen leichter gefallen wäre.
Die Aufsätze wurden von einem KI-Programm analysiert und von diesem und auch von realen Lehrkräften bewertet.
Die wesentlichen Ergebnisse
Die Analyse der Elektroenzephalogramme zeigt deutlich, dass die verschiedenartigen Herangehensweisen an die Aufgabenstellungen zu signifikant unterschiedlichen Mustern der sogenannten Konnektivität geführt haben, das heißt zu Unterschieden wie sich verschiedene Regionen des Gehirns im komplexen Netzwerk von Milliarden Neuronen über deren Synapsen miteinander vernetzten und kommunizierten. Diese unterschiedlichen Muster deuten auf unterschiedliche kognitive Strategien hin, wobei die Gehirnkonnektivität mit dem Ausmaß der externen Hilfestellung systematisch abgenommen hat. Das Schreiben eines Aufsatzes ohne Unterstützung (Gruppe Brain-only) hat zu einer stärkeren neuronalen Konnektivität über alle gemessenen Frequenzbänder hinweg geführt, mit den stärksten und weitestreichenden Vernetzungen insbesondere im Frequenzbereich der Alpha- und Theta-Wellen, aber auch der Delta-Wellen. Alpha-Wellen werden mit Aufmerksamkeit und semantischer Verarbeitung während des kreativen Denkprozesses in Verbindung gebracht, Theta-Wellen mit Gedächtniskonsolidierung und Delta-Wellen mit tiefer Verarbeitung.
Im Gegensatz dazu wiesen die LLM-Benutzer die schwächsten neuronalen Vernetzungen auf, niedrige Gehirnaktivitäten wurden in Bereichen gemessen, die für Gedächtnisbildung und komplexe Denkprozesse wichtig sind. Anfangs verwendeten die Teilnehmer dieser Gruppe ChatGPT noch zur Unterstützung, später - in Sitzung 2 und 3 übernahmen einige mit Copy-Paste den KI-Output fast unverändert.
Verglichen mit LLM-Usern aktivierten die Nutzer der Search-Engine unterschiedliche Konnektivitätsmuster, die auf die höhere externe Informationslast hinwiesen und den Abruf von Erinnerungen und die visuelle-exekutive Integration aktivierten. In Hinblick auf neuronale und kognitive Muster lag diese Gruppe zwischen den beiden anderen Gruppen.
Abbildung 2 gibt einen Eindruck der unterschiedlich starken Vernetzungen der 3 Gruppen für Alpha-Wellen und wie sich diese über welche Hirnareale erstrecken.
Abbildung 2. EEG-Analyse des Alpha-Frequenzbandes für die Gruppen:"LLM", "Search-Engine" und "Brain-only" in Sitzung 1. Die Buchstaben/Zahlen bezeichnen die am Schädel positionierten Elektroden. Analyse mittels der Dynamischen Direct Transfer Function (dDTF). Die Farbskala links unten zeigt die Stärke der Vernetzung von höher (dDTF rot) zu niedriger (dDTF blau) an. (Bild: Ausschnitt aus Figure 1 in N. Kosmyna et al., 2025, Lizenz cc-by-nc-sa.) |
Erinnerungsvermögen. Ein wesentlicher Unterschied zwischen den Gruppen bestand darin einen Satz aus dem unmittelbar zuvor verfassten eigenen Aufsatz zu zitieren. 15 von 18 LLM-Nutzern hatten in Sitzung 1 Schwierigkeit mit dem Zitieren, keiner von den 18 konnte das Zitat genau wiedergeben. Im Vergleich dazu scheiterten nur 3/18 in der Search-Engine- und 2/18 der Brain-only-Gruppe an der korrekten Wiedergabe eines Satzes. Obwohl die Testteilnehmer nach der 1. Sitzung die an sie gestellten Fragen kannten, bestand der Mangel an Erinnerungsvermögen auch noch In der dritten Sitzung, wenn auch in abgeschwächter Form: 6 von 18 Teilnehmern konnten immer noch nicht korrekt zitieren.
Wesentliche Beobachtungen aus Sitzung 4. Wenn die Teilnehmer der Brain-only-Gruppe einen vormals verfassten Aufsatz mit Hilfe von ChatGPT umschrieben, zeigten sie einen signifikanten Anstieg der neuronalen Konnektivität über alle Frequenzbänder. Dies deutet darauf hin, dass das Umschreiben umfangreichere Interaktionen im Gehirnnetzwerk erforderte. Dagegen wiesen die vormaligen LLM-User, die nun erstmals ohne KI-Unterstützung schrieben, eine wesentlich schwächere Gehirnaktivität auf als ursprünglich die Brain-only-Gruppe. Viele dieser Teilnehmer dürften sich mit dem Thema wohl nur oberflächlich auseinandergesetzt haben und haben den Inhalt nicht internalisiert.
Ob und wie sich die recht kurzen Aufsätze (319 bis 373 Worte) der drei verschiedenen Gruppen unterschieden haben, hat - nach Ansicht der Redaktion - kaum zu wesentlichen Erkenntnissen geführt. Unwissenschaftlich erscheint zudem, wenn Lehrkräfte die Aufsätze der LLM-Gruppe als "seelenlos" beurteilen.
Fazit
Die Anwendung von LLMs unterstützt zwar die Bequemlichkeit und verschiebt kurzfristig die mentale Anstrengung, langfristig führt aber - laut den Autoren der Studie - die Auslagerung einer kognitiven Bearbeitung zur Ansammlung "kognitiver Schulden" (cognitive debts), zu Defiziten wie verminderter kritischer Nachfrage, erhöhter Anfälligkeit für Manipulation und geringerer Kreativität.
Macht uns die Nutzung von ChatGPT also denkfaul?
Ein Reproduzieren von LLM-Vorschlägen, ohne deren Genauigkeit oder Relevanz zu bewerten, lässt die User oberflächliche oder voreingenommene Perspektiven einnehmen. Die Autoren der Studie folgern, dass es sinnvoll sein könnte zunächst eigenständig ohne Hilfsmittel zu arbeiten, um belastbare neuronale Netzwerke und ein tieferes Verständnis zu entwickeln und erst dann KI-Tools als unterstützendes Werkzeug zur Steigerung der Effizienz einzusetzen. Dies sollte insbesondere im Bereich des Lernens und der Bildung gelten, da die Gehirne von Kindern sich noch in der Entwicklung befinden.
Nataliya Kosmyna e al., Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task.(10. Juni 2025). https://doi.org/10.48550/arXiv.2506.08872.
Die Studie in den Medien
Media Lab Brain Study on ChatGPT Sparks Global Media Coverage. https://www.media.mit.edu/posts/your-brain-on-chatgpt-in-the-news/
TIME: Is Using ChatGPT to Write Your Essay Bad for Your Brain? New MIT Study Explained.Video 8:13 min. https://www.dailymotion.com/video/x9lwfn2
The Brief with Jim Sciutto Friday, June 20, 2025 6pm ET. Video 5:53 min. https://www.youtube.com/watch?v=eET6eP3GGAg&t=4s
Künstliche Intelligenz im ScienceBlog
Mehr als 30 Artikel über Erfordernisse und Anwendungen der künstliche Intelligenz sind bis jetzt erschienen. Links: Themenschwerpunkt Künstliche Intelligenz.
- Printer-friendly version
- Log in to post comments