Clear Sky Science · de

RAGMail: ein cloudbasiertes Retrieval-Augmented-Framework zur Reduzierung von Halluzinationen bei der Textgenerierung durch große Sprachmodelle

· Zurück zur Übersicht

Intelligentere Ansprache in einem überfüllten Arbeitsmarkt

Eine Kaltakquise-E-Mail an einen Recruiter zu senden, kann sich anfühlen wie ein Schrei ins Leere. Viele Stellensuchende nutzen inzwischen KI-Tools, um solche Nachrichten zu formulieren, doch allgemein gehaltene oder fehlerhafte E-Mails können mehr schaden als nützen. Dieses Papier stellt RAGMail vor, ein cloudbasiertes System, das darauf ausgelegt ist, maßgeschneiderte, faktisch überprüfte Kaltakquise-E-Mails zu verfassen, indem es große Sprachmodelle mit aktuellen Informationen zu einer Stellenausschreibung und dem Lebenslauf einer Kandidatin oder eines Kandidaten kombiniert. Das Ziel ist einfach: Zeit für Bewerbende sparen und gleichzeitig Nachrichten produzieren, die persönlich und vertrauenswürdig sind.

Figure 1
Figure 1.

Warum gewöhnliche KI-E-Mails schiefgehen

Moderne Sprachmodelle sind bemerkenswert gut darin, flüssig zu klingen, doch sie „halluzinieren“ oft — sie erfinden mit hoher Sicherheit Fähigkeiten, Erfahrungen oder Details zur Stelle, die nicht der Wahrheit entsprechen. Für eine Bewerbende kann das bedeuten, dass eine E-Mail behauptet, mit einem Tool gearbeitet zu haben, das nie genutzt wurde, oder Verantwortlichkeiten erwähnt, die in der Stellenanzeige nicht vorkommen. Solche Fehler können die Glaubwürdigkeit schnell untergraben. Die Autoren erläutern, dass diese Fehler selbst in fortgeschrittenen Systemen auftreten und dass größere Modelle allein das Problem nicht zuverlässig lösen. Notwendig ist eine Methode, die die Texte des Modells in realen, überprüfbaren Informationen verankert.

Dem System realen Kontext zuführen

RAGMail geht dieses Problem an, indem es die Stellenausschreibung und den Lebenslauf als alleinige Quelle der Wahrheit behandelt. Das System extrahiert automatisch Stellenbeschreibungen von Karriereseiten und analysiert hochgeladene Lebensläufe, wobei beides in strukturierte Daten umgewandelt wird: Listen von Fähigkeiten, Projekten, Berufserfahrung und Anforderungen. Ein Retrieval-Modul durchsucht diese Quellen dann nach den relevantesten Überschneidungen zwischen den Wünschen des Arbeitgebers und dem Angebot der Kandidatin oder des Kandidaten. Dieser abgeglichene Kontext wird direkt in das Sprachmodell eingespeist, bevor es mit dem Schreiben beginnt, sodass die E-Mail von aktuellen, stellenspezifischen Informationen geleitet wird statt von vagen Erinnerungen aus früherem Training.

Fakten prüfen, bevor auf Senden gedrückt wird

Über das einfache Abrufen von Kontext hinaus führt RAGMail eine Bewertungsmethode namens Factualness Evaluation via Weighting LLMs, kurz FEWL, ein. Nachdem ein E-Mail-Entwurf generiert wurde, vergleicht das System jede wichtige Behauptung in der Nachricht mit den strukturierten Fakten, die aus dem Lebenslauf und der Stellenanzeige extrahiert wurden. Angaben zu Fähigkeiten und Berufserfahrung werden stärker gewichtet als höfliche Formulierungen oder Schlusszeilen. Segmente, die nicht mit den zugrundeliegenden Daten übereinstimmen, werden markiert und durch iterative Verfeinerung angepasst, sodass sich die E-Mail der verifizierten „Ground Truth“ annähert. Die Autoren prüfen ihren Ansatz außerdem gegen andere Faktprüfungswerkzeuge und menschliche Gutachter und stellen fest, dass FEWL menschliche Beurteilungen darüber, ob eine E-Mail genau und relevant ist, gut widerspiegelt.

Figure 2
Figure 2.

Für den praktischen Einsatz in Cloud-Maßstab gebaut

Um dies praktisch für viele Nutzer gleichzeitig zu machen, ist RAGMail als cloudnativer Dienst bereitgestellt. Eine Weboberfläche ermöglicht es Jobsuchenden, Lebensläufe hochzuladen und Stellenlinks von jedem Gerät einzufügen, während das Backend auf verwalteten Servern mit elastischer Skalierung läuft. Das System speichert Vektorrepräsentationen von Lebensläufen und Stellenanzeigen in einer Cloud-Datenbank, überwacht Leistung und Fehlerraten und passt automatisch an, wie viel Information abgerufen wird, wenn die Auslastung hoch ist — und verschlüsselt dabei sensible persönliche Daten und setzt strenge Zugriffskontrollen durch. Dieses Design hält die Reaktionszeiten niedrig und schützt die Privatsphäre der Nutzer, selbst wenn die Nutzung zunimmt.

Was die Ergebnisse für Stellensuchende bedeuten

In Tests, die mehrere Konfigurationen verglichen, erzeugte die vollständige RAGMail-Pipeline — die Lebenslaufdaten, Retrieval und faktische Gewichtung kombiniert — deutlich genauere und persönlichere E-Mails als ein einfaches Sprachmodell. Gemessene Halluzinationen gingen zurück, die Faktenwerte stiegen um nahezu die Hälfte und die Bewertungen zur Personalisierung verbesserten sich ebenfalls. Für den Alltagsnutzer bedeutet das Anschreiben, das seine tatsächliche Vorgeschichte und die konkrete Rolle besser widerspiegelt. RAGMail ersetzt nicht das menschliche Urteilsvermögen, sondern fungiert als sorgfältiger Assistent: Es entwirft Nachrichten, die in der Realität verankert, auf jede Gelegenheit zugeschnitten und über eine sichere, skalierbare Cloud-Plattform zugestellt sind.

Zitation: Sanyal, P., Rathore, K. & Arjunan, R.V. RAGMail: a cloud-based retrieval-augmented framework for reducing hallucinations in LLM text generation. Sci Rep 16, 7925 (2026). https://doi.org/10.1038/s41598-026-38913-w

Schlüsselwörter: Kaltakquise-E-Mail-Automatisierung, retrieval-augmented generation, Halluzinationen bei LLMs, Cloud-AI-Plattformen, personalisierte Bewerbungsansprache