Paperless-ngx ist eine Open-Source-Software zur Verwaltung von Dokumenten, die speziell für die Digitalisierung und Automatisierung von papierbasierten Arbeitsabläufen entwickelt wurde. Es ist ein Fork des ursprünglichen Paperless-Projekts und bietet zahlreiche technische Verbesserungen und erweiterte Funktionen und läuft auch in Docker auf einem Raspberry PI.
Was sind einige Vorteile?
Automatisierte Dokumentenerfassung und -verarbeitung
Paperless-ngx ermöglicht die automatische Erfassung von Dokumenten aus verschiedenen Quellen wie Scannern, E-Mails oder Ordnerüberwachung. Es nutzt OCR (Optical Character Recognition), um den Inhalt gescannter Dokumente zu analysieren und durchsuchbar zu machen. Dies erlaubt die automatische Kategorisierung und Tagging der Dokumente, wodurch die manuelle Organisation entfällt.
Zentrale Verwaltung und durchsuchbare Datenbank
Alle Dokumente werden zentral gespeichert und sind über eine durchsuchbare Datenbank schnell auffindbar. Dank der OCR-Funktion lassen sich Dokumente nicht nur nach Dateinamen, sondern auch nach ihrem Textinhalt durchsuchen. Dies vereinfacht das Wiederfinden von Dokumenten erheblich und macht manuelle Archivierungssysteme überflüssig.
Einfache Integration durch E-Mail-Abruf
Paperless-ngx kann direkt E-Mails mit angehängten Dokumenten abrufen und die Anhänge automatisch in das System integrieren. Dies spart Zeit bei der manuellen Verarbeitung von Rechnungen, Quittungen und anderen per E-Mail gesendeten Dokumenten.
Flexible und skalierbare Architektur
Dank der Docker-Containerisierung ist Paperless-ngx einfach auf verschiedenen Systemen zu installieren und zu betreiben. Es kann problemlos in bestehende Infrastrukturen integriert werden, sei es lokal auf einem Server oder in der Cloud. Die Architektur ist skalierbar, was es für kleine bis mittelgroße Unternehmen attraktiv macht. Auf dem Pi 4 läuft es gut.
Anpassbare Workflows und Regeln
Das System unterstützt benutzerdefinierte Workflows und Regeln, um Dokumente automatisch zu klassifizieren oder bestimmte Aktionen durchzuführen. Beispielsweise können Filterregeln definiert werden, um bestimmte Dokumententypen automatisch zu taggen oder zu verschieben. Dies spart Zeit und sorgt für konsistente Organisation.
Sicherer Zugriff und Datenschutz
Paperless-ngx bietet verschiedene Authentifizierungsoptionen, einschließlich OAuth und LDAP, sowie eine rollenbasierte Zugriffskontrolle, die sicherstellt, dass nur berechtigte Benutzer auf bestimmte Dokumente zugreifen können. Verschlüsselungstechnologien sorgen für den Schutz sensibler Daten.
Erweiterbare Open-Source-Plattform
Da Paperless-ngx Open-Source ist, profitieren Benutzer von einer aktiven Community und regelmäßigen Updates. Die Software ist leicht erweiterbar, und es können zusätzliche Funktionen oder Integrationen entwickelt werden, um spezifische Anforderungen zu erfüllen.
Paperless-ngx bietet eine robuste, flexible und automatisierte Lösung für das Dokumentenmanagement. Es reduziert den manuellen Aufwand, verbessert die Dokumentensuche und -organisation und lässt sich leicht in bestehende Systeme integrieren. Die Containerisierung, erweiterbare Architektur und umfangreichen Automatisierungsoptionen machen es zu einem leistungsstarken Werkzeug für die Digitalisierung papierbasierter Prozesse. Wenn das nicht Gründe sind, mal einen alten Raspberry Pi 4 neu dafür aufzusetzen.
Voraussetzung
-Rasberry Pi 4
-64-Bit Rasbian (damit die neue 2.12.1 paperless-ngx installiert werden kann)
Docker muss installiert sein (habe ich hier auch schon mal beschrieben), ist aber nur:
1 2 3 4 5 6 7 8 9 |
curl -fsSL https://get.Docker.com -o get-Docker.sh && chmod +x get-Docker.sh sudo ./get-Docker.sh sudo usermod -aG docker pi newgrp docker sudo reboot now sudo apt install docker-compose // paperless-ngx installieren bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)" |
Hier das Dockerfile docker-compose.yml:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 |
# Docker Compose file for running paperless from the docker container registry. # This file contains everything paperless needs to run. # Paperless supports amd64, arm and arm64 hardware. # # All compose files of paperless configure paperless in the following way: # # - Paperless is (re)started on system boot, if it was running before shutdown. # - Docker volumes for storing data are managed by Docker. # - Folders for importing and exporting files are created in the same directory # as this file and mounted to the correct folders inside the container. # - Paperless listens on port 8000. # # In addition to that, this Docker Compose file adds the following optional # configurations: # # - Instead of SQLite (default), PostgreSQL is used as the database server. # - Apache Tika and Gotenberg servers are started with paperless and paperless # is configured to use these services. These provide support for consuming # Office documents (Word, Excel, Power Point and their LibreOffice counter- # parts. # # To install and update paperless with this file, do the following: # # - Copy this file as 'docker-compose.yml' and the files 'docker-compose.env' # and '.env' into a folder. # - Run 'docker compose pull'. # - Run 'docker compose run --rm webserver createsuperuser' to create a user. # - Run 'docker compose up -d'. # # For more extensive installation and update instructions, refer to the # documentation. services: broker: image: docker.io/library/redis:7 restart: unless-stopped volumes: - redisdata:/data db: image: docker.io/library/postgres:16 restart: unless-stopped volumes: - pgdata:/var/lib/postgresql/data environment: POSTGRES_DB: paperless POSTGRES_USER: paperless POSTGRES_PASSWORD: PASSWORT webserver: image: ghcr.io/paperless-ngx/paperless-ngx:latest restart: unless-stopped depends_on: - db - broker - gotenberg - tika ports: - "8000:8000" volumes: - data:/usr/src/paperless/data - /home/pi/paperless-ngx:/usr/src/paperless/media - ./export:/usr/src/paperless/export - /home/pi/paperless-ngx/consume:/usr/src/paperless/consume env_file: docker-compose.env environment: PAPERLESS_REDIS: redis://broker:6379 PAPERLESS_DBHOST: db PAPERLESS_TIKA_ENABLED: 1 PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000 PAPERLESS_TIKA_ENDPOINT: http://tika:9998 gotenberg: image: docker.io/gotenberg/gotenberg:8.7 restart: unless-stopped # The gotenberg chromium route is used to convert .eml files. We do not # want to allow external content like tracking pixels or even javascript. command: - "gotenberg" - "--chromium-disable-javascript=true" - "--chromium-allow-list=file:///tmp/.*" tika: image: docker.io/apache/tika:latest restart: unless-stopped volumes: data: pgdata: redisdata: |
Wenn alles läuft, kann über die URL http://PI-Adresse:8000 die schöne Gui von paperless-ngx bewundert werden:
Es gibt hier eine gute Anleitung mit bisher 17 Teilen, deshalb hier nur weitergehende Tipps und Anmerkungen bzw. Zusammenfassung.
Wenn viele Dokument gleichzeitig importiert werden oder auch sehr große, hat der Pi schon etwas zu tun:
Wenn wichtige Dokumente importiert werden, ist ein Backup der ganze SD-Karte leicht gemacht, wie hier beschrieben.