Vom Dokument zum Dialog: Automatisiertes KI-Wissen auf Knopfdruck

Ein Showcase-Projekt, das zeigt, wie ein n8n-Workflow vollautomatisch Dokumente aus Google Cloud in eine durchsuchbare Wissensdatenbank für RAG-Anwendungen verwandelt.

Mein Werdegang im Dialog: Eine KI-gestützte Karriereübersicht.

Marco La Rosa

Der folgende Chatbot lädt dich ein, meinen beruflichen Werdegang interaktiv zu erkunden. Stelle unkompliziert Fragen zu Stationen, Projekten, Kompetenzen oder persönlichen Learnings – das System durchsucht in Echtzeit die hinterlegten Dokumente und liefert dir präzise, kontextbezogene Antworten.

Auch bei einer sorgfältig aufbereiteten Wissensbasis können Large-Language-Modelle gelegentlich Inhalte „halluzinieren“. Die Fehlerquote liegt erfahrungsgemäß unter 2 %, dennoch übernehme ich keine Gewähr für Richtigkeit, Vollständigkeit oder Aktualität der generierten Antworten.

Wie es funktioniert

1. Initialer Wissensaufbau

Im ersten Schritt liest der n8n-Workflow alle vorhandenen Dokumente aus einem Google Drive-Ordner – wie Lebenslauf, Projekte und Zeugnisse – und baut daraus die anfängliche Wissensbasis auf.

2. Live-Verarbeitung neuer Daten

Der Workflow überwacht den Ordner aktiv. Sobald eine neue Datei (z.B. ein neues Projekt) hinzugefügt wird, wird diese automatisch erkannt, verarbeitet und in die Wissensdatenbank integriert – ohne Verzögerung.

3. KI-Kern mit Gedächtnis 🧠

Der angebundene Chatbot nutzt das RAG-Prinzip (Retrieval-Augmented Generation) für präzise Antworten und verfügt über ein "Memory", um den Kontext des Gesprächs zu behalten und Folgefragen zu verstehen.

4. Flexible Anwendbarkeit

Dieses System ist nicht auf Lebensläufe beschränkt. Es kann für jegliche textbasierte Wissensdatenbank adaptiert werden, z.B. für Meeting-Protokolle, Produkt-FAQs oder interne Unternehmens-Wikis.

Potenzial zur Qualitätssteigerung

Die Datenqualität ist entscheidend für die Genauigkeit der KI. Folgende drei Punkte bieten Potenzial für eine noch präzisere Performance:

Bessere Metadaten im RAG-Prozess

Durch das Hinzufügen von Metadaten zu jedem Daten-Chunk (z.B. Dateiname, Erstellungsdatum, Kapitel) kann die KI die Informationsquelle genauer identifizieren und relevantere Antworten liefern.

Experimentieren mit Chunk Size & Overlap

Die Anpassung der Textstück-Größe ("Chunk Size") und der Überlappung ("Overlap") ist entscheidend. Kleinere Chunks liefern präzisere, aber weniger kontextreiche Antworten, während größere das Gegenteil bewirken. Das optimale Verhältnis muss experimentell gefunden werden.

Ausführlichere & strukturiertere Daten

Die Qualität des Inputs bestimmt die Qualität des Outputs. Je detaillierter die Dokumente verfasst und je klarer sie strukturiert sind (z.B. durch einheitliche Überschriften), desto besser kann die KI die Zusammenhänge verstehen und nutzen.

Über Mich

Ich bin Marco La Rosa, begeistere mich für neue Technologien, Automatisierungen und KI. Wenn du dich mit mir vernetzten willst findest du mich hier: LinkedIn.