
von Jasmin Schmitz, PUBLISSO Publikationsberatung
Im Bibliothekskontext schlägt das Thema „KI-generierte Referenzen“ häufig auf, wenn Volltexte nicht beschafft werden können. Hintergrund: Das generative KI-Tool sucht als „Schreib-Assistent“ beim Erstellen von wissenschaftlichen Texten als Beleg nicht nach real-existierenden Volltexten, sondern halluziniert sich thematisch passende Referenzen zusammen [1]. Bei den Autor:innenbestandteilen sind das häufig Personen, die tatsächlich im Feld arbeiten und bereits ähnlich lautende Publikationen verfasst haben. Die bibliografischen Angaben sehen auf den ersten Blick also durchaus plausibel aus. Man spricht deshalb auch von „Frankenstein citations“ [2], „Frankencitations“, „phantom references“, „ghost references“ [3] oder „fake references“ [1].
Für Schmunzeln sorgte ein Artikel ausgerechnet in der Zeitschrift „Journal of Academic Ethics“, der mindestens 19 Referenzen aufwies, die keinem Volltext zugeordnet werden konnten[4].
KI-generierte Referenzen sind keine gewöhnlichen Zitierfehler
Fehler beim Referenzieren hat es immer gegeben, oftmals werden dabei Seitenzahlen, Jahrgänge oder Ausgaben falsch angegeben, so dass mit etwas Recherchegeschick die Artikel schnell aufgespürt werden können. „Fake references“ gehen aber darüber hinaus und lassen sich nicht mit Tippfehlern, Zahlendrehern, falschen Übernahmen etc. erklären. Die Texte existieren schlichtweg nicht. Diese Referenzen sind mittlerweile bei nahezu allen Verlagen zu finden, weil generative KI-Tools beim Abfassen von wissenschaftlichen Texten mittlerweile breitflächig eine große Rolle spielen [2].
Warum „Frankenstein citations“ die wissenschaftliche Kommunikation gefährden
Während die Beschaffungsversuche des nicht-existierenden Volltextes in Bibliotheken „nur“ Ressourcen binden, erzeugen diese wohl ungeprüften Referenzen in der wissenschaftlichen Kommunikation größere Probleme:
Zitieren in wissenschaftlichen Texten ist kein Selbstzweck, sondern erfüllt eine Funktion: Beispielsweise als Beleg für eine Aussage oder als Hinweis, auf welchen Arbeiten man aufbaut und welche Forschungswege man weiterverfolgt. Sind Referenzen erfunden oder fabriziert, dann kann man Thesen etc. auch nicht überprüfen. Folglich können die Texte insgesamt auch nicht als redlicher Beitrag zur wissenschaftlichen Kommunikation verstanden werden [5].
Immer mehr Publikationen enthalten KI-generierte Fake Referencies
Seit Mitte 2024 ist ein rasanter Anstieg von Artikeln erkennbar, die mindestens eine Referenz enthalten, die erfunden ist. Das hat sich in den letzten zwei Jahren verzwölffacht. Betroffen sind auch die Lebenswissenschaften. Aktuelle Untersuchungen gehen davon aus, dass jeder 277te Artikel, der in den ersten sieben Wochen im Jahr 2026 in PubMed indexiert wurde, mindestens eine entsprechende Referenz enthält. Im Zeitraum 01/01/2023-18/02/2026 sind mehr 2.800 Artikel betroffen, von denen 98% bislang (Stand Februar 2026) nicht zurückgezogen wurden [5,6].
Ob Artikel, die erfundene Referenzen enthalten, tatsächlich zurückgezogen oder abgelehnt werden sollen, ist Gegenstand von Diskussionen. Es gibt Stimmen, die für ein rigoroses Zurückziehen oder Ablehnen von entsprechenden Artikeln sind, weil es sich dabei auch um erfundene Daten und einen Akt der Täuschung handelt. Andere plädieren dafür, nur solche Artikel zurückzuziehen oder abzulehnen, bei denen sich die Referenzen auf zentrale Aussagen in den Manuskripten beziehen [7,8,9].
Wie Zeitschriften reagieren
Angesichts der Zahlen besteht Handlungsbedarf für nahezu alle Zeitschriften. Vorgeschlagene Maßnahmen für Herausgebende sind zum Beispiel [6]:
- Automatisierte Überprüfung der Referenzen noch vor der Begutachtung,
- Anreicherung der Metadaten mit Informationen darüber, dass es sich um geprüfte Referenzen handelt,
- nachträgliche Prüfung aller Publikationen und anstoßen von Korrekturen oder Retractions im Bedarfsfall,
- einheitliche Behandlung des Phänomens mit Festlegung, ab wann es als Verstoß gegen die gute wissenschaftliche Praxis gilt – einschließlich der Veröffentlichung von entsprechenden Policies.
Herausgebende setzen vermehrt auch selbst KI-Tools ein, um verdächtige Referenzen zu identifizieren und sie anschließend nochmal manuell zu überprüfen. Allerdings können diese Tools auch nicht alle halluzinierten Referenzen finden, da sie wiederum mit ausgewählten Zitierstilen trainiert wurden [2].
KI-generierte Referenzen möglichst vor der Veröffentlichung erkennen
Wichtig wäre, dass fabrizierte Referenzen in Manuskripten erst gar nicht publiziert werden [6]. Denn mit der Publikation werden sie früher oder später in Datenbanken aufgenommen, die zu Recherchezwecken auch Referenzen durchsuchbar machen. Auch sind Fälle bekannt, in denen Google Scholar entsprechende Referenzen den Profilen der vermeintlichen Autor:innen zugeordnet hat [2].
Konsequenzen für Preprints und Konferenzeinreichungen
Erfundene Referenzen lassen sich auch bei Konferenzeinreichungen und -ausarbeitungen beobachten [10]. Ebenso betroffen sind Preprint-Server[11]. Hier gibt es bereits eine erste deutliche Reaktion: Der Preprint-Server arXiv sperrt Autor:innen für ein Jahr aus, wenn sie Manuskripte eingereicht haben, die halluzinierte Referenzen enthalten oder andere Anzeichen aufweisen, dass eine Nutzung von KI-Tools stattgefunden hat und deren Erzeugnisse ungeprüft Eingang in das Manuskript gefunden haben. Nach der einjährigen Sperre dürfen Autor:innen nur noch solche Manuskripte einreichen, die bereits von Zeitschriften begutachtet und angenommen wurden.
Wenngleich diese Vorgehensweise harsch klingt, gehen die Verantwortlichen davon aus, dass den Ergebnissen in den Manuskripten grundsätzlich nicht zu trauen ist, wenn den Autor:innen derartige Fehler unterlaufen [12].
Warum entstehen KI-generierte Referenzen?
Im Gegensatz zu anderen Manipulationen der Referenzenliste, wie „cash for citations“[13], profitieren weder die zitierten Zeitschriften noch die Autor:innen, die oftmals ja existieren, aber nichts mit dem in der Referenz benannten Text zu tun haben. Die alleinige Motivation scheint also zu sein, Belege zur Unterstützung der Aussagen im Text zu finden bzw. das Paper mit einer überzeugenden Referenzliste aufzublähen [14] oder Nachlässigkeit bei der Prüfung von KI-Erzeugnissen.
Wohlwollend könnte man auch von blindem Vertrauen in die Fähigkeiten von generativer KI sprechen. In einer Output-orientierten Publish-or-Perish-Welt ist es allerdings besonders bitter, wenn man durch den Einsatz von generativen KI-Tools zwar Zeit eingespart hat, die Publikation aber durch fehlende Überprüfung der generierten Inhalte abgelehnt oder zurückgezogen wird und damit nicht dem Fortkommen im Wissenschaftsbetrieb dient [15].
KI-generierte Referenzen vermeiden: Verantwortung von Autor:innen und KI-Anbietern
Neben einem stärkeren Bewusstsein bei Autor:innen für Fehler etc. in KI-Erzeugnissen bleibt auch zu hoffen, dass die den Tools zugrundeliegenden Large Language Models so verbessert werden, dass sie nur noch auf Literatur verweisen, die auch tatsächlich existiert [10].
Insgesamt halten halluzinierte Referenzen die Wissenschaft auf, da sie zu falschen Schlussfolgerungen führen können. So tragen sie auch dazu bei, das Vertrauen in Wissenschaft zu erschüttern. Ein Zitat von M. Hosseini beschreibt das Problem treffend: „Every fake citation is a problem in the literature that someone would have to deal with“ [2]. „Someone“ sind in diesem Fall alle Akteur:innen im wissenschaftlichen Publikationswesen.
Quellen:
[2] https://doi.org/10.1038/d41586-026-00969-z
[5] https://www.laborjournal.de/editorials/3491.php
[6] https://doi.org/10.1016/S0140-6736(26)00603-3
[8] https://doi.org/10.1016/S0140-6736(26)00798-1
[9] https://doi.org/10.1080/08989621.2026.2645390
[10] https://doi.org/10.48550/arXiv.2602.05867
[11] https://doi.org/10.48550/arXiv.2605.07723
[12] https://doi.org/10.1038/d41586-026-01595-5
[13] https://retractionwatch.com/2021/08/31/publisher-offers-cash-for-citations/



