{"id":22029,"date":"2024-11-01T04:24:27","date_gmt":"2024-11-01T03:24:27","guid":{"rendered":"http:\/\/blog.wenzlaff.de\/?p=22029"},"modified":"2026-03-31T08:27:35","modified_gmt":"2026-03-31T06:27:35","slug":"dokumentenverwaltung-mit-dem-raspberry-pi-und-paperless-ngx","status":"publish","type":"post","link":"http:\/\/blog.wenzlaff.de\/?p=22029","title":{"rendered":"Dokumentenverwaltung mit dem Raspberry Pi und paperless-ngx"},"content":{"rendered":"<p><a href=\"https:\/\/www.paperless-ngx.com\/\" rel=\"noopener\" target=\"_blank\">Paperless-ngx<\/a> ist eine Open-Source-Software zur Verwaltung von Dokumenten, die speziell f\u00fcr die Digitalisierung und Automatisierung von papierbasierten Arbeitsabl\u00e4ufen entwickelt wurde. Es ist ein Fork des urspr\u00fcnglichen Paperless-Projekts und bietet zahlreiche technische Verbesserungen und erweiterte Funktionen und l\u00e4uft auch in Docker auf einem Raspberry PI. <\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/love-to.gif\" alt=\"\" width=\"512\" height=\"288\" class=\"aligncenter size-full wp-image-22045\" \/><\/p>\n<p>Was sind einige Vorteile? <!--more--><\/p>\n<p><strong>Automatisierte Dokumentenerfassung und -verarbeitung<\/strong><br \/>\nPaperless-ngx erm\u00f6glicht die automatische Erfassung von Dokumenten aus verschiedenen Quellen wie Scannern, E-Mails oder Ordner\u00fcberwachung. Es nutzt OCR (Optical Character Recognition), um den Inhalt gescannter Dokumente zu analysieren und durchsuchbar zu machen. Dies erlaubt die automatische Kategorisierung und Tagging der Dokumente, wodurch die manuelle Organisation entf\u00e4llt.<br \/>\n<strong><br \/>\nZentrale Verwaltung und durchsuchbare Datenbank<\/strong><br \/>\nAlle Dokumente werden zentral gespeichert und sind \u00fcber eine durchsuchbare Datenbank schnell auffindbar. Dank der OCR-Funktion lassen sich Dokumente nicht nur nach Dateinamen, sondern <strong>auch nach ihrem Textinhalt<\/strong> durchsuchen. Dies vereinfacht das Wiederfinden von Dokumenten erheblich und macht manuelle Archivierungssysteme \u00fcberfl\u00fcssig.<br \/>\n<strong><br \/>\nEinfache Integration durch E-Mail-Abruf<\/strong><br \/>\nPaperless-ngx kann direkt E-Mails mit angeh\u00e4ngten Dokumenten abrufen und die Anh\u00e4nge automatisch in das System integrieren. Dies spart Zeit bei der manuellen Verarbeitung von Rechnungen, Quittungen und anderen per E-Mail gesendeten Dokumenten.<\/p>\n<p><strong>Flexible und skalierbare Architektur<\/strong><br \/>\nDank der Docker-Containerisierung ist Paperless-ngx einfach auf verschiedenen Systemen zu installieren und zu betreiben. Es kann problemlos in bestehende Infrastrukturen integriert werden, sei es lokal auf einem Server oder in der Cloud. Die Architektur ist skalierbar, was es f\u00fcr kleine bis mittelgro\u00dfe Unternehmen attraktiv macht. Auf dem Pi 4 l\u00e4uft es gut.<br \/>\n<strong><br \/>\nAnpassbare Workflows und Regeln<\/strong><br \/>\nDas System unterst\u00fctzt benutzerdefinierte Workflows und Regeln, um Dokumente automatisch zu klassifizieren oder bestimmte Aktionen durchzuf\u00fchren. Beispielsweise k\u00f6nnen Filterregeln definiert werden, um bestimmte Dokumententypen automatisch zu taggen oder zu verschieben. Dies spart Zeit und sorgt f\u00fcr konsistente Organisation.<\/p>\n<p><strong>Sicherer Zugriff und Datenschutz<\/strong><br \/>\nPaperless-ngx bietet verschiedene Authentifizierungsoptionen, einschlie\u00dflich OAuth und LDAP, sowie eine rollenbasierte Zugriffskontrolle, die sicherstellt, dass nur berechtigte Benutzer auf bestimmte Dokumente zugreifen k\u00f6nnen. Verschl\u00fcsselungstechnologien sorgen f\u00fcr den Schutz sensibler Daten.<\/p>\n<p><strong>Erweiterbare Open-Source-Plattform<\/strong><br \/>\nDa Paperless-ngx Open-Source ist, profitieren Benutzer von einer aktiven Community und regelm\u00e4\u00dfigen Updates. Die Software ist leicht erweiterbar, und es k\u00f6nnen zus\u00e4tzliche Funktionen oder Integrationen entwickelt werden, um spezifische Anforderungen zu erf\u00fcllen.<\/p>\n<p>Paperless-ngx bietet eine robuste, flexible und automatisierte L\u00f6sung f\u00fcr das Dokumentenmanagement. Es reduziert den manuellen Aufwand, verbessert die Dokumentensuche und -organisation und l\u00e4sst sich leicht in bestehende Systeme integrieren. Die Containerisierung, erweiterbare Architektur und umfangreichen Automatisierungsoptionen machen es zu einem leistungsstarken Werkzeug f\u00fcr die Digitalisierung papierbasierter Prozesse. Wenn das nicht Gr\u00fcnde sind, mal einen alten Raspberry Pi 4 neu daf\u00fcr aufzusetzen.<\/p>\n<p><strong>Voraussetzung<\/strong><br \/>\n-Rasberry Pi 4<br \/>\n-64-Bit Rasbian (damit die neue 2.12.1 paperless-ngx installiert werden kann)<br \/>\n<a href=\"https:\/\/www.docker.com\/blog\/happy-pi-day-docker-raspberry-pi\/\" rel=\"noopener\" target=\"_blank\">Docker<\/a> muss installiert sein (habe ich hier auch schon mal beschrieben), ist aber nur:<\/p>\n<pre class=\"theme:dark-terminal lang:default decode:true \" > \r\n\r\n curl -fsSL https:\/\/get.Docker.com -o get-Docker.sh &amp;&amp; chmod +x get-Docker.sh\r\n sudo .\/get-Docker.sh\r\n sudo usermod -aG docker pi\r\n newgrp docker\r\n sudo reboot now\r\n sudo apt install docker-compose\r\n\r\n \/\/ paperless-ngx installieren\r\n bash -c \"$(curl -L https:\/\/raw.githubusercontent.com\/paperless-ngx\/paperless-ngx\/main\/install-paperless-ngx.sh)\"<\/pre>\n<p>Hier das Dockerfile d<strong>ocker-compose.yml<\/strong>:<\/p>\n<pre class=\"theme:dark-terminal minimize:true lang:default decode:true \" >\r\n\r\n# Docker Compose file for running paperless from the docker container registry.\r\n# This file contains everything paperless needs to run.\r\n# Paperless supports amd64, arm and arm64 hardware.\r\n#\r\n# All compose files of paperless configure paperless in the following way:\r\n#\r\n# - Paperless is (re)started on system boot, if it was running before shutdown.\r\n# - Docker volumes for storing data are managed by Docker.\r\n# - Folders for importing and exporting files are created in the same directory\r\n#   as this file and mounted to the correct folders inside the container.\r\n# - Paperless listens on port 8000.\r\n#\r\n# In addition to that, this Docker Compose file adds the following optional\r\n# configurations:\r\n#\r\n# - Instead of SQLite (default), PostgreSQL is used as the database server.\r\n# - Apache Tika and Gotenberg servers are started with paperless and paperless\r\n#   is configured to use these services. These provide support for consuming\r\n#   Office documents (Word, Excel, Power Point and their LibreOffice counter-\r\n#   parts.\r\n#\r\n# To install and update paperless with this file, do the following:\r\n#\r\n# - Copy this file as 'docker-compose.yml' and the files 'docker-compose.env'\r\n#   and '.env' into a folder.\r\n# - Run 'docker compose pull'.\r\n# - Run 'docker compose run --rm webserver createsuperuser' to create a user.\r\n# - Run 'docker compose up -d'.\r\n#\r\n# For more extensive installation and update instructions, refer to the\r\n# documentation.\r\n\r\nservices:\r\n  broker:\r\n    image: docker.io\/library\/redis:7\r\n    restart: unless-stopped\r\n    volumes:\r\n      - redisdata:\/data\r\n\r\n  db:\r\n    image: docker.io\/library\/postgres:16\r\n    restart: unless-stopped\r\n    volumes:\r\n      - pgdata:\/var\/lib\/postgresql\/data\r\n    environment:\r\n      POSTGRES_DB: paperless\r\n      POSTGRES_USER: paperless\r\n      POSTGRES_PASSWORD: PASSWORT\r\n\r\n  webserver:\r\n    image: ghcr.io\/paperless-ngx\/paperless-ngx:latest\r\n    restart: unless-stopped\r\n    depends_on:\r\n      - db\r\n      - broker\r\n      - gotenberg\r\n      - tika\r\n    ports:\r\n      - \"8000:8000\"\r\n    volumes:\r\n      - data:\/usr\/src\/paperless\/data\r\n      - \/home\/pi\/paperless-ngx:\/usr\/src\/paperless\/media\r\n      - .\/export:\/usr\/src\/paperless\/export\r\n      - \/home\/pi\/paperless-ngx\/consume:\/usr\/src\/paperless\/consume\r\n    env_file: docker-compose.env\r\n    environment:\r\n      PAPERLESS_REDIS: redis:\/\/broker:6379\r\n      PAPERLESS_DBHOST: db\r\n      PAPERLESS_TIKA_ENABLED: 1\r\n      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http:\/\/gotenberg:3000\r\n      PAPERLESS_TIKA_ENDPOINT: http:\/\/tika:9998\r\n\r\n  gotenberg:\r\n    image: docker.io\/gotenberg\/gotenberg:8.7\r\n    restart: unless-stopped\r\n\r\n    # The gotenberg chromium route is used to convert .eml files. We do not\r\n    # want to allow external content like tracking pixels or even javascript.\r\n    command:\r\n      - \"gotenberg\"\r\n      - \"--chromium-disable-javascript=true\"\r\n      - \"--chromium-allow-list=file:\/\/\/tmp\/.*\"\r\n\r\n  tika:\r\n    image: docker.io\/apache\/tika:latest\r\n    restart: unless-stopped\r\n\r\nvolumes:\r\n  data:\r\n  pgdata:\r\n  redisdata:\r\n\r\n<\/pre>\n<p>Wenn alles l\u00e4uft, kann \u00fcber die URL http:\/\/PI-Adresse:8000 die sch\u00f6ne Gui von paperless-ngx bewundert werden:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57.png\" alt=\"\" width=\"2978\" height=\"1956\" class=\"aligncenter size-full wp-image-22031\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57.png 2978w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57-300x197.png 300w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57-1024x673.png 1024w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57-768x504.png 768w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57-1536x1009.png 1536w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-07-um-22.38.57-2048x1345.png 2048w\" sizes=\"auto, (max-width: 767px) 89vw, (max-width: 1000px) 54vw, (max-width: 1071px) 543px, 580px\" \/><\/p>\n<p>Es gibt hier <a href=\"https:\/\/digital-cleaning.de\/index.php\/paperless-ngx-auf-dem-raspberry-pi-erstaunlich-gut-teil-1\/#Bisherige_Teile_der_Paperless-ngx-Serie\" rel=\"noopener\" target=\"_blank\">eine gute Anleitung<\/a> mit bisher 17 Teilen, deshalb hier nur weitergehende Tipps und Anmerkungen bzw. Zusammenfassung.<\/p>\n<p>Wenn viele Dokument gleichzeitig importiert werden oder auch sehr gro\u00dfe, hat der Pi schon etwas zu tun:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38.png\" alt=\"\" width=\"1740\" height=\"384\" class=\"aligncenter size-full wp-image-22030\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38.png 1740w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38-300x66.png 300w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38-1024x226.png 1024w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38-768x169.png 768w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2024\/10\/wenzlaff.de-2024-10-11-um-12.18.38-1536x339.png 1536w\" sizes=\"auto, (max-width: 767px) 89vw, (max-width: 1000px) 54vw, (max-width: 1071px) 543px, 580px\" \/><\/p>\n<p>Wenn wichtige Dokumente importiert werden, ist ein Backup der ganze SD-Karte leicht gemacht, wie hier beschrieben.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Paperless-ngx ist eine Open-Source-Software zur Verwaltung von Dokumenten, die speziell f\u00fcr die Digitalisierung und Automatisierung von papierbasierten Arbeitsabl\u00e4ufen entwickelt wurde. Es ist ein Fork des urspr\u00fcnglichen Paperless-Projekts und bietet zahlreiche technische Verbesserungen und erweiterte Funktionen und l\u00e4uft auch in Docker auf einem Raspberry PI. Was sind einige Vorteile?<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[220],"tags":[2502,6033,6034,2083,6044,6032,2309,1025,6029,2190,5550],"class_list":["post-22029","post","type-post","status-publish","format-standard","hentry","category-anleitung","tag-docker","tag-dokumente","tag-dokumenten-verwaltung","tag-import","tag-paperless","tag-paperless-ngx","tag-pdf","tag-pi","tag-pi-vier","tag-raspberry-pi","tag-workflow"],"_links":{"self":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/22029","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=22029"}],"version-history":[{"count":1,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/22029\/revisions"}],"predecessor-version":[{"id":23154,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/22029\/revisions\/23154"}],"wp:attachment":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=22029"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=22029"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=22029"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}