Rechnungsverarbeitung automatisieren: Ein Praxis-Beispiel mit lokaler KI
Von 5 Minuten pro Rechnung auf 30 Sekunden. Wie ein KI-gestützter Workflow Eingangsrechnungen automatisch ausliest, strukturiert und für die Buchhaltung aufbereitet.
Das Problem: 100 Rechnungen, 10 Stunden Handarbeit
Der Ablauf ist in den meisten Unternehmen identisch. Eine Rechnung kommt per E-Mail. Jemand öffnet die E-Mail, lädt das PDF herunter, öffnet es, liest Rechnungsnummer, Datum, Betrag und Lieferant ab, tippt die Daten in Excel oder die Buchhaltungssoftware, legt das PDF in eine Ordnerstruktur ab und macht weiter mit der nächsten.
Pro Rechnung dauert das 5 bis 8 Minuten. Bei 100 Rechnungen im Monat sind das über 10 Stunden reine Handarbeit. Dazu kommen Tippfehler mit einer Quote von rund 2 Prozent, falsche Beträge, Zahlendreher, vergessene Rechnungen. Und das in einer Abteilung, wo Genauigkeit nicht optional ist, sondern Pflicht.
Das ist kein exotisches Problem. Laut einer Studie von Ardent Partners verarbeitet ein durchschnittliches Unternehmen mit 50 bis 250 Mitarbeitern zwischen 500 und 5.000 Eingangsrechnungen pro Jahr. Der manuelle Aufwand pro Rechnung liegt branchenweit bei 12 bis 15 Euro, inklusive Arbeitszeit, Fehlerkorrektur und Archivierung.
Die gute Nachricht: Genau dieser Prozess lässt sich mit lokaler KI fast vollständig automatisieren. Nicht als Zukunftsvision, sondern mit Technologie, die heute verfügbar ist.
Vorher vs. Nachher
Bevor wir in die technischen Details gehen, hier das Ergebnis:
| Metrik | Vorher (manuell) | Nachher (KI-gestützt) |
|---|---|---|
| Bearbeitungszeit pro Rechnung | 5-8 Minuten | Unter 1 Minute (inkl. Prüfung) |
| Fehlerquote | ~2% (Tippfehler) | Unter 0,5% |
| Manuelle Eingriffe nötig | 100% | Unter 10% (nur Sonderfälle) |
| Rechnungen pro Stunde verarbeitbar | 8-12 | 60+ |
| Archivierung | Manuell (oft vergessen/falsch) | Automatisch mit korrektem Dateinamen |
Der Clou: Der Mitarbeiter in der Buchhaltung wird nicht ersetzt. Aber statt jede Rechnung von Hand abzutippen, prüft er nur noch das Ergebnis. Aus 5 Minuten Arbeit pro Rechnung werden 30 Sekunden Kontrolle.
Der ROI: Was die Automatisierung konkret spart
Rechnen wir es durch für ein Unternehmen mit 100 Eingangsrechnungen pro Monat:
Zeitersparnis:
- Vorher: 100 Rechnungen x 6,5 Min. = 10,8 Stunden/Monat
- Nachher: 100 Rechnungen x 0,5 Min. (Kontrolle) + 10 Sonderfälle x 5 Min. = 1,7 Stunden/Monat
- Ersparnis: ~9 Stunden pro Monat, 108 Stunden pro Jahr
Kostenersparnis:
- Bei einem Stundensatz von 35 EUR (Buchhaltungskraft inkl. Arbeitgeberkosten): ~3.780 EUR/Jahr an direkter Arbeitszeit
- Reduzierte Fehlerkosten (Korrekturbuchungen, Mahngebühren, Skontoverlust): geschätzt 500-1.500 EUR/Jahr
- Gesamtersparnis: 4.000-5.000 EUR pro Jahr
Bei 500 Rechnungen pro Monat multipliziert sich das entsprechend. Die Automatisierung rechnet sich typischerweise innerhalb von 1 bis 3 Monaten.
So funktioniert der Workflow
Jetzt wird es technisch. Der Workflow besteht aus 8 Schritten, die vollautomatisch ablaufen. Nur bei Sonderfällen greift ein Mensch ein.
Schritt 1: E-Mail empfangen
Ein IMAP-Trigger überwacht das Rechnungspostfach (z.B. rechnungen@firma.de). Sobald eine neue E-Mail eingeht, die einen PDF-Anhang enthält, startet der Workflow automatisch. E-Mails ohne PDF-Anhang werden ignoriert.
Schritt 2: PDF extrahieren
Der PDF-Anhang wird aus der E-Mail gelöst und als Datei zwischengespeichert. Der Dateiname und das Eingangsdatum werden für die spätere Archivierung erfasst.
Schritt 3: Text per OCR auslesen
Hier wird zwischen zwei Fällen unterschieden. Bei Text-PDFs (digital erstellt) kann der Text direkt extrahiert werden. Das ist der einfache Fall und betrifft die Mehrheit der Rechnungen. Bei Scan-PDFs (eingescannt oder fotografiert) kommt OCR (Optical Character Recognition) zum Einsatz. Tools wie Tesseract erkennen den Text im Bild. Mit dem deutschen Sprachpaket (deu.traineddata) funktioniert das auch für Umlaute und typisch deutsche Rechnungsformate zuverlässig.
Schritt 4: KI-Extraktion
Das ist der Kernschritt. Der ausgelesene Text wird an ein lokales KI-Modell übergeben, zum Beispiel Qwen 2.5 oder Mistral, laufend über Ollama auf der lokalen Hardware.
Das Modell bekommt einen präzisen Auftrag: Extrahiere aus dem folgenden Rechnungstext diese 11 Felder und gib sie als JSON zurück.
| Feld | Beispiel |
|---|---|
| Rechnungsnummer | 2026-00142 |
| Rechnungsdatum | 2026-01-15 |
| Fälligkeitsdatum | 2026-02-15 |
| Lieferantenname | Mustermann IT-Services GmbH |
| Lieferantenadresse | Musterstraße 42, 12345 Berlin |
| Nettobetrag | 1.250,00 EUR |
| MwSt.-Satz | 19% |
| MwSt.-Betrag | 237,50 EUR |
| Bruttobetrag | 1.487,50 EUR |
| IBAN | DE89 3704 0044 0532 0130 00 |
| Verwendungszweck | RE 2026-00142 |
Das Entscheidende: Das Modell erfindet nichts. Wenn ein Feld nicht gefunden wird, gibt es null zurück. Es extrahiert ausschließlich, was im Text steht.
Schritt 5: Validierung
Die extrahierten Daten durchlaufen automatische Plausibilitätschecks. Pflichtfelder wie Rechnungsnummer, Datum und Bruttobetrag müssen vorhanden sein. Das Datumsformat wird automatisch in YYYY-MM-DD normalisiert. Beträge werden auf Plausibilität geprüft (größer als 0, kleiner als 100.000 EUR). Falls vorhanden, wird das IBAN-Format geprüft. Und eine mathematische Gegenprobe stellt sicher, dass Netto plus MwSt. den Bruttobetrag ergibt.
Wenn alle Checks bestehen, geht es automatisch weiter. Wenn nicht, wird die Rechnung zur manuellen Prüfung markiert.
Schritt 6: Export
Die strukturierten Daten werden in das Zielsystem geschrieben, je nach Setup in eine Excel-Tabelle, ein Google Sheet, ein Buchhaltungsprogramm oder eine Datenbank. Das Format passt sich dem bestehenden System an, nicht umgekehrt.
Schritt 7: Archivierung
Die Original-PDF wird automatisch umbenannt und abgelegt. Das Namensschema folgt einem einheitlichen Muster, zum Beispiel: 2026-01-15_Mustermann-IT-Services_RE-2026-00142.pdf. Keine vergessenen Dateien mehr im Download-Ordner, keine falschen Zuordnungen.
Schritt 8: Benachrichtigung
Bei erfolgreicher Verarbeitung wird ein Log-Eintrag geschrieben. Bei Fehlern oder Sonderfällen geht eine Benachrichtigung an die zuständige Person, per E-Mail, Messenger oder Dashboard-Eintrag.
Die KI-Komponente im Detail
Warum überhaupt KI? Reicht nicht einfaches Parsing mit Regeln?
Für standardisierte Rechnungen: ja. Aber in der Praxis sieht jede Rechnung anders aus. Unterschiedliche Layouts, unterschiedliche Bezeichnungen („Rechnungsnummer", „Belegnummer", „Invoice No."), unterschiedliche Positionen auf dem Dokument. Regelbasiertes Parsing müsste für jeden Lieferanten einzeln konfiguriert werden.
Ein Sprachmodell löst das Problem anders: Es versteht den Kontext. Es erkennt, dass „Rechnungsnr." und „Invoice Number" dasselbe meinen. Es kann mit unterschiedlichen Layouts umgehen, ohne für jeden Fall eine eigene Regel zu brauchen.
Warum lokal?
Rechnungen enthalten sensible Geschäftsdaten: Lieferantenbeziehungen, Preise, Zahlungsbedingungen, Bankverbindungen. In manchen Fällen auch personenbezogene Daten (Einzelunternehmer, Freiberufler).
Dazu kommen die GoBD-Anforderungen (Grundsätze zur ordnungsgemäßen Führung und Aufbewahrung von Büchern): Original-Belege müssen unverändert archiviert werden, die Verarbeitung muss nachvollziehbar dokumentiert sein. Lokale Verarbeitung vereinfacht beides.
Wenn die Rechnungsdaten nie das lokale Netzwerk verlassen, entfallen Fragen zur Datenübermittlung an Dritte, zur DSGVO-Konformität von Cloud-Diensten und zum Risiko durch den US CLOUD Act. Die Compliance ist von Haus aus gegeben.
Fehlerbehandlung und Edge Cases
Kein Automatisierungssystem ist perfekt. Entscheidend ist, wie mit Fehlern umgegangen wird.
Scan-PDFs mit schlechter Qualität. Manche Rechnungen sind schlecht gescannt, schief, unscharf, mit Flecken. Die OCR-Erkennung schlägt dann fehl oder liefert lückenhaften Text. Lösung: Diese Rechnungen landen automatisch im „Manuell prüfen"-Ordner. Der Mitarbeiter wird benachrichtigt und kann die Rechnung wie gewohnt händisch bearbeiten.
Fehlende Pflichtfelder. Wenn das KI-Modell die Rechnungsnummer oder den Betrag nicht finden kann, wird die Rechnung nicht automatisch gebucht, sondern zur manuellen Prüfung weitergeleitet. Kein stilles Verschlucken, keine falschen Buchungen.
Kleinunternehmer-Rechnungen. Rechnungen ohne Mehrwertsteuer (Kleinunternehmerregelung nach § 19 UStG) sind ein häufiger Sonderfall. Das Modell erkennt das Muster und setzt MwSt.-Satz und MwSt.-Betrag auf 0, statt einen Fehler zu melden.
Rechnungen mit mehreren MwSt.-Sätzen. Manche Rechnungen enthalten Positionen mit 7% und 19% MwSt. Das Modell kann beide Sätze erkennen und separat ausweisen. Die Validierung prüft, ob die Summen korrekt sind.
Englische Rechnungen. Internationale Lieferanten schicken Rechnungen auf Englisch. Da die eingesetzten Sprachmodelle multilingual sind, funktioniert die Extraktion auch bei „Invoice", „Amount Due" oder „Payment Terms". Das Ausgabeformat bleibt dabei einheitlich auf Deutsch.
Datenschutz: Warum lokal hier besonders wichtig ist
Rechnungsdaten sind Geschäftsdaten. Sie verraten, mit wem ein Unternehmen zusammenarbeitet, was es einkauft und zu welchen Konditionen. Bei Freiberufler-Rechnungen stecken personenbezogene Daten drin: Name, Adresse, Bankverbindung, Steuernummer.
Lokale Verarbeitung löst drei Probleme gleichzeitig:
- DSGVO: Keine Datenübermittlung an Dritte. Keine Auftragsverarbeitung. Kein Verarbeitungsverzeichnis für externe Cloud-KI nötig.
- GoBD: Die Original-PDF bleibt unverändert im lokalen Archiv. Die Verarbeitung ist protokolliert und reproduzierbar. Die Aufbewahrungsfrist von 10 Jahren kann auf eigener Infrastruktur eingehalten werden.
- Geschäftsgeheimnisse: Lieferantenbeziehungen und Einkaufskonditionen bleiben vertraulich. Kein Risiko, dass diese Daten als Trainingsdaten für Cloud-Modelle verwendet werden.
Was du brauchst, um loszulegen
Die technischen Voraussetzungen sind überschaubar:
- Hardware: Ein lokales KI-System mit mindestens 8 GB VRAM (für kleinere Modelle) oder 32-64 GB (für zuverlässigere, größere Modelle)
- Software: Ollama (kostenlos, Open Source) für die Modellverwaltung, ein Workflow-Tool wie n8n (Self-hosted, Open Source) für die Automatisierung
- Modell: Qwen 2.5 7B oder Mistral 7B für den Einstieg, beide kostenlos und gut bei strukturierter Extraktion auf Deutsch
- E-Mail-Zugang: IMAP-Zugang zum Rechnungspostfach
- Testdaten: 5-10 echte Rechnungen zum Testen und Validieren
Der geschätzte Aufwand für die Ersteinrichtung liegt bei 10-12 Stunden, inklusive Spezifikation, Entwicklung, Testing und Schulung. Danach läuft das System weitgehend autonom.
Fazit: Automatisierung beginnt mit einem einzigen Workflow
Rechnungsverarbeitung ist kein glamouröses Thema. Aber genau das macht es zum idealen Einstieg in die KI-Automatisierung: Der Prozess ist klar definiert, die Daten sind strukturiert, der ROI ist messbar und das Risiko ist gering.
Die Technologie dafür ist keine Raketenwissenschaft. Open-Source-Modelle, kompakte Hardware, bewährte Workflow-Tools. Alles verfügbar, alles dokumentiert, alles lokal betreibbar.
Der wichtigste Schritt ist der erste. Nicht das perfekte System von Tag eins, sondern ein funktionierender Workflow, der echte Arbeit abnimmt. Von dort aus lässt sich ausbauen, auf Angebote, Verträge, Lieferscheine, Bestellungen.
Automatisierung ist kein Hexenwerk. Und sie beginnt mit einem einzigen Workflow.
Quellen
- Gartner: How to Improve Your Data Quality
- Ardent Partners: Accounts Payable Metrics That Matter
- Billentis: E-Invoicing / E-Billing Report
- Tesseract OCR (Open Source)
- Qwen 2.5 (Alibaba)
- Mistral AI
- Ollama, Lokale KI-Modelle
- BMF: GoBD, Grundsätze ordnungsgemäßer Buchführung
- n8n, Workflow-Automatisierung (Open Source)