Intelligent Automation – Wenn RPA und KI zusammenfinden

In den ersten beiden Teilen unserer Blogreihe haben wir die Grundlagen von Robotic Process Automation (RPA) beleuchtet und konkrete Praxisbeispiele für klassische RPA-Bots vorgestellt. Nun wenden wir uns einem spannenden Entwicklungsfeld zu: der Kombination von RPA mit künstlicher Intelligenz (KI) – kurz: Intelligent Automation.

Während klassische RPA-Bots bei klar definierten, regelbasierten Prozessen glänzen, stoßen sie bei unstrukturierten Daten und komplexen Entscheidungssituationen an ihre Grenzen. Genau hier setzt Intelligent Automation an: Die Integration von KI-Komponenten erweitert die Fähigkeiten von RPA-Bots dramatisch und erschließt völlig neue Automatisierungspotenziale. 

Von RPA zu Intelligent Automation – Ein evolutionärer Sprung

Klassisches RPA arbeitet nach dem Prinzip "Wenn-Dann" – es folgt fest programmierten Regeln und kann nur Entscheidungen treffen, die zuvor explizit definiert wurden. Intelligent Automation hingegen geht einen Schritt weiter und fügt eine kognitive Ebene hinzu: Diese Systeme können auch unstrukturierte Daten wie Bilder oder Dokumente verstehen, daraus lernen und interpretieren. Und diese gewonnenen Informationen können wiederum in den RPA-Prozess integriert werden. 

Die Erweiterung umfasst typischerweise folgende KI-Technologien:

Optical Character Recognition (OCR) und Dokumentenverständnis

Während einfache OCR-Systeme lediglich Text erkennen, geht modernes Dokumentenverständnis weit darüber hinaus: Es erfasst Zusammenhänge, erkennt Dokumenttypen und extrahiert relevante Informationen – selbst aus unstrukturierten Formaten wie Freitexten oder handschriftlichen Notizen. 

Natural Language Processing (NLP) und Generative AI (Gen AI)

NLP- und Gen AI-Komponenten ermöglichen das Verstehen und Verarbeiten natürlicher Sprache. Bots können E-Mails interpretieren, Kundenanfragen kategorisieren, relevante Informationen aus Textdokumenten extrahieren oder Texte und Informationen in natürlicher Sprache generieren. 

Machine Learning (ML)

ML-Algorithmen lernen aus Daten und verbessern ihre Leistung über Zeit. Sie können Muster erkennen, Anomalien identifizieren und Vorhersagen treffen – ideal für Prozesse mit häufigen Ausnahmen oder sich ändernden Bedingungen. 

Computer Vision

Diese Technologie geht weit über einfache Bilderkennung hinaus. Computer Vision-Systeme können Inhalte visuell analysieren, kategorisieren und relevante Elemente in Bildern oder Videos identifizieren. 

Document Understanding – Der Schlüssel zur Verarbeitung unstrukturierter Daten

Eine der überzeugendsten Anwendungen von Intelligent Automation ist das Document Understanding. Während klassische RPA-Bots vor unstrukturierten Dokumenten kapitulieren müssen, eröffnet Document Understanding völlig neue Möglichkeiten: 


Was ist Document Understanding?

Document Understanding kombiniert verschiedene KI-Technologien, um Dokumente zu analysieren, zu verstehen und relevante Informationen zu extrahieren – unabhängig vom Format. Die Technologie: 
 

  • Erkennt und klassifiziert Dokumenttypen (Rechnungen, Verträge, Formulare etc.)  
  • Lokalisiert relevante Informationen (Namen, Beträge, Daten, Vertragsbedingungen etc.)  
  • Extrahiert, validiert und strukturiert diese Informationen für die Weiterverarbeitung  
  • Lernt kontinuierlich aus Korrekturen und verbessert ihre Genauigkeit über die Zeit  

Wie funktioniert Document Understanding in der Praxis?

Der typische Workflow eines Document-Understanding-Prozesses umfasst folgende Schritte:

Grafik mit sechs Schritten der Dokumentenautomatisierung von Erfassung bis Lernen.

Dokumentenerfassung: Dokumente werden aus verschiedenen Quellen (E-Mail, Scanner, Upload-Portal etc.) in das System eingespeist.   

Klassifizierung: Das System identifiziert automatisch den Dokumenttyp – ist es eine Rechnung, ein Vertrag, ein Lebenslauf oder ein Lieferschein?   

Extraktion: Basierend auf dem Dokumenttyp extrahiert das System relevante Informationen. Bei einer Rechnung könnten dies Rechnungsnummer, Datum, Betrag, Steuersatz, Lieferant etc. sein.   

Validierung: Die extrahierten Daten werden auf Plausibilität und Vollständigkeit geprüft. Bei Unsicherheiten oder fehlenden Informationen kann das System eskalieren.   

Verarbeitung: Die validierten Daten werden in nachgelagerte Systeme übertragen und weiterverarbeitet – zum Beispiel für die Buchung einer Rechnung oder die Aktualisierung von Vertragsinformationen.   

Lernen: Korrekturen und Ergänzungen durch menschliche Bearbeiter fließen in den Lernprozess ein und verbessern kontinuierlich die Extraktionsqualität.   

Praxisbeispiele für Intelligent Automation

Lassen Sie uns einige konkrete Szenarien betrachten, in denen Intelligent Automation bereits heute beeindruckende Ergebnisse liefert: 

Beispiel 1: Intelligente Rechnungsverarbeitung

Herausforderung: 
Ein internationaler Konzern erhält täglich ca. einhundert Lieferscheine in unterschiedlichsten Formaten – von perfekten PDFs bis hin zu schlecht formatierten, gedruckten Dokumenten. Die Vielfalt an Lieferanten, Formaten und Sprachen macht eine klassische regelbasierte Verarbeitung unmöglich. 

Intelligent-Automation-Lösung:
Eine kombinierte Lösung aus RPA und Document Understanding: 

Ein RPA-Bot überwacht Eingangswege (E-Mail, EDI, Upload-Portal) und sammelt alle eingehenden Lieferscheine  

Die Document-Understanding-Komponente klassifiziert die Dokumente und extrahiert relevante Informationen  

Daten werden gegen Bestellungen und Lieferantenstammdaten validiert  

Bei hoher Konfidenz erfolgt die automatische Buchung  

Bei Unsicherheiten oder Ausnahmen wird der Lieferschein zur manuellen Prüfung weitergeleitet  

Das System lernt aus den manuellen Korrekturen und verbessert kontinuierlich seine Erkennungsrate

Ergebnis:
Die Lösung verarbeitet 92% der Lieferscheine vollautomatisch. Die Durchlaufzeit pro Dokument sinkt von 10-20min auf unter 2 Minuten. Bemerkenswert: Die Erkennungsrate verbessert sich kontinuierlich durch das lernende System, auch bei neuen Lieferanten oder veränderten Layouts. 

Symbol für automatisierte Rechnungsverarbeitung mit Euro-Zeichen und Mikrochip-Icon.

Beispiel 2: Intelligente Vertragsanalyse

Herausforderung: 
Eine Rechtsabteilung muss regelmäßig hunderte von Verträgen auf bestimmte Klauseln und Risiken prüfen – eine zeitaufwändige manuelle Arbeit, die hohes Fachwissen erfordert. 

Intelligent-Automation-Lösung:
Eine Kombination aus Document Understanding und Gen AI: 

Verträge werden digitalisiert und über ein zentrales Portal erfasst

Die Document-Understanding-Komponente erkennt Vertragstypen und extrahiert Metadaten (Parteien, Laufzeit, Wert etc.)  

Gen AI-Algorithmen analysieren den Vertragstext und identifizieren kritische Klauseln wie Haftungsbeschränkungen, Kündigungsfristen oder Compliance-relevante Aspekte 

Potenzielle Risiken werden nach vordefinierten Kriterien bewertet und visuell hervorgehoben  

Ein RPA-Bot überträgt relevante Informationen in ein Vertragsmanagementsystem und initiiert Follow-up-Prozesse  

Ergebnis:
Die Bearbeitungszeit pro Vertrag sank von durchschnittlich 3 Stunden auf 20 Minuten. Die Erkennungsrate für kritische Klauseln liegt bei über 90%. Mitarbeitende können sich auf die inhaltliche Bewertung konzentrieren, statt Zeit mit dem Durchsuchen umfangreicher Dokumente zu verbringen. 

Digitales Symbol für Dokumentenanalyse mit Lupe auf futuristischem Schaltkreis-Hintergrund.

Document Processing in der Praxis: Ein Blick hinter die Kulissen

Um die Funktionsweise von intelligenter Dokumentenverarbeitung besser zu verstehen, werfen wir einen detaillierten Blick auf einen typischen Verarbeitungsworkflow: 

Die Verarbeitung von Dokumenten hat durch den Einsatz von Generativer Künstlicher Intelligenz einen revolutionären Wandel erfahren. Moderne Workflows kombinieren traditionelle Methoden mit fortschrittlichen KI-Algorithmen, um Dokumente effizient und präzise zu analysieren. 

Pre-Processing: Die Grundlage für präzise Analysen 
Bevor die eigentliche KI-Analyse beginnt, durchlaufen Dokumente eine wichtige Vorbereitungsphase. Hierbei werden Bilder optimiert, indem Kontrast und Schärfe angepasst sowie Hintergrundrauschen entfernt wird. Schief gescannte Dokumente werden automatisch ausgerichtet und entzerrt. Gleichzeitig identifizieren und segmentieren KI-Algorithmen verschiedene Teilbereiche wie Tabellen, Überschriften und Logos, was die nachfolgende Analyse erheblich erleichtert. 

Texterkennung: Präzision durch kontextuelle KI 
Die moderne OCR-Technologie hat durch Generative KI einen enormen Sprung gemacht. Aktuelle Systeme erreichen Erkennungsraten von über 99% bei gedruckten Texten und zeigen zunehmend beeindruckende Ergebnisse bei handschriftlichen Inhalten. Diese Leistung basiert auf der Fähigkeit der KI, verschiedene Schriftarten und -stile zu erkennen, mehrsprachige Inhalte zu verarbeiten und spezielle Zeichen korrekt zu interpretieren. Besonders wertvoll ist die Nutzung von Kontextinformationen: Die KI kann unklare Wörter oft aus dem Zusammenhang erschließen, ähnlich wie Menschen dies tun. 

Intelligente Dokumentenklassifikation 
Fortschrittliche KI-Modelle identifizieren den Dokumenttyp mit hoher Genauigkeit. Sie analysieren dafür Layoutmerkmale wie die Positionierung von Text, Tabellen und Logos, untersuchen Textinhalte auf charakteristische Schlüsselwörter und erkennen visuelle Elemente wie Unternehmenslogos oder typische Formulargestaltungen. Durch den Einsatz von Deep Learning verbessert sich diese Klassifikation kontinuierlich und kann selbst bei unbekannten Dokumentformaten zuverlässige Ergebnisse liefern. 

 

 

Präzise Informationsextraktion 
Für jeden erkannten Dokumenttyp extrahiert die KI gezielte Informationen. Bei Rechnungen werden beispielsweise Rechnungsnummer, Datum, Betrag, Steuersatz und Zahlungsbedingungen identifiziert. Verträge werden nach Vertragsparteien, Laufzeit, Kündigungsfristen und Sonderklauseln durchsucht. Bei Personalunterlagen erkennt das System relevante Personendaten, Qualifikationen und Berufserfahrungen. Generative KI-Modelle können dabei auch implizite Informationen erfassen, die nicht direkt als Schlüssel-Wert-Paare vorliegen. 

Validierung und Anreicherung durch KI-Netzwerke 
Die extrahierten Daten durchlaufen einen umfassenden Validierungsprozess. Die KI prüft sie auf formale Korrektheit hinsichtlich Datums- und Zahlenformaten sowie auf inhaltliche Plausibilität. Durch den Abgleich mit Referenzdaten wie Lieferantenstammdaten oder Produktkatalogen werden Inkonsistenzen erkannt. Bei Bedarf reichert das System die Informationen durch Daten aus anderen Quellen an, wobei die KI eigenständig Verbindungen zwischen verschiedenen Datenpunkten herstellt. 

Konfidenzbestimmung: Transparente Entscheidungsfindung 
Ein wesentlicher Vorteil moderner KI-Systeme ist die Fähigkeit, die eigene Sicherheit zu bewerten. Für jedes extrahierte Datenelement berechnet das System einen Konfidenzwert. Informationen mit hoher Konfidenz werden automatisch weiterverarbeitet, während Elemente mit mittlerer Konfidenz zur Überprüfung markiert werden. Bei niedriger Konfidenz leitet das System die Daten zur manuellen Bearbeitung weiter. Diese Selbsteinschätzung ermöglicht einen optimalen Mix aus Automatisierung und menschlicher Kontrolle. 

Kontinuierliche Verbesserung durch maschinelles Lernen 
Das gesamte System profitiert von kontinuierlichem Lernen. Es verbessert sich durch manuelle Korrekturen und Ergänzungen, passt sich an neue Dokumentvarianten und -formate an und nutzt Feedback zur Klassifikations- und Extraktionsgenauigkeit. Generative KI-Modelle können dabei aus vergleichsweise wenigen Beispielen lernen und ihr Verständnis auf neue, ähnliche Dokumente übertragen. Dies führt zu einer stetig steigenden Leistungsfähigkeit und Anpassungsfähigkeit des Systems. 

Durch diese Integration von Generativer KI in den Dokumentenverarbeitungsprozess werden nicht nur die Geschwindigkeit und Genauigkeit erhöht, sondern auch völlig neue Anwendungsmöglichkeiten erschlossen, die weit über die reine Datenextraktion hinausgehen. 

Die Zukunft: Von Intelligent Automation zu Agentic Automation

    Intelligent Automation repräsentiert einen bedeutenden Entwicklungsschritt, doch die Technologie entwickelt sich rasant weiter. Der nächste evolutionäre Sprung führt zu Agentic Automation – autonomen, KI-gesteuerten Agenten, die komplexe Prozesse eigenständig orchestrieren und optimieren. 

    Was Agentic Automation von aktuellen Intelligent-Automation-Lösungen unterscheidet: 

    • Autonome Entscheidungsfindung: Statt vordefinierten Regeln zu folgen, treffen diese Systeme eigenständige Entscheidungen basierend auf breiten Kontextinformationen  
    • Prozessübergreifendes Arbeiten: Agentic Automation ist nicht auf einzelne Prozesse beschränkt, sondern orchestriert ganze Prozessketten  
    • Selbstoptimierung: Die Systeme analysieren ihre eigene Performance und optimieren ihre Arbeit kontinuierlich  
    • Natürliche Kommunikation: Interaktion mit menschlichen Teammitgliedern über natürliche Sprache statt starrer Schnittstellen  

    Im vierten und letzten Teil unserer Blogreihe werden wir tiefer in die Welt der Agentic Automation eintauchen und aufzeigen, wie diese Technologie die Grenzen des Möglichen weiter verschieben wird. 

    Erste Schritte zu Ihrer Intelligent-Automation-Lösung

    Möchten Sie die Potenziale von Intelligent Automation für Ihr Unternehmen erschließen? Unser spezialisiertes Team berät Sie gerne zu den Möglichkeiten: 

    • Proof of Concept: In einem überschaubaren Pilotprojekt demonstrieren wir das Potenzial für einen ausgewählten Prozess.
    • End-to-End-Implementierung: Von der Konzeption über die Entwicklung bis zum produktiven Betrieb – wir begleiten Sie auf dem gesamten Weg.

    Kontaktieren Sie uns noch heute für ein unverbindliches Erstgespräch und entdecken Sie, wie Intelligent Automation Ihre Prozesseffizienz revolutionieren kann. In der Zwischenzeit freuen wir uns, Sie im vierten Teil unserer Serie zur Zukunft der Prozessautomatisierung begrüßen zu dürfen. 

    Kontaktieren Sie uns! 

    Digitaler Würfel mit Kettensymbol als Darstellung vernetzter Prozessautomatisierung.

    FAQs

    Intelligent Automation bezeichnet die Kombination von Robotic Process Automation (RPA) und Künstlicher Intelligenz (KI), um komplexe Geschäftsprozesse zu automatisieren. Während RPA regelbasierte Aufgaben übernimmt, ermöglicht KI das Verarbeiten unstrukturierter Daten und das Treffen von Entscheidungen. 

    Durch die Integration von KI kann Intelligent Automation auch unstrukturierte Daten wie Texte oder Bilder verarbeiten und komplexe Entscheidungen treffen, was über die Möglichkeiten traditioneller, regelbasierter RPA hinausgeht.

    Intelligent Automation findet Anwendung in Bereichen wie Finanzdienstleistungen, Gesundheitswesen und Versicherungen, um Prozesse wie Kreditantragsbearbeitung, Patientenaufnahme und Schadensregulierung zu optimieren. 

    Neben RPA und KI kommen Technologien wie Machine Learning (ML), Natural Language Processing (NLP) und Computer Vision zum Einsatz, um Daten zu analysieren, Sprache zu verstehen und visuelle Informationen zu verarbeiten.

    Während Intelligent Automation die Kombination von RPA und KI beschreibt, geht Hyperautomation einen Schritt weiter und integriert zusätzlich weitere Technologien wie Process Mining, Advanced Analytics und Low-Code/No-Code-Plattformen. Ziel von Hyperautomation ist es, möglichst viele Prozesse entlang der gesamten Wertschöpfungskette automatisiert, intelligent und nahtlos zu gestalten.

    Das könnte Sie auch interessieren

    Hände auf Laptop-Tastatur mit schwebendem Flussdiagramm für Prozessautomatisierung.

    RPA Process assessment

    jetzt testen 

    RPA-Starterpaket

    mehr erfahren 

    Kontaktieren Sie unseren Experten