Ein Muss für NAS-Experten: Ein umfassender Leitfaden zur einfachen Dokumentenverwaltung mit Paperless-ngx

Nach all dem Basteln habe ich festgestellt, dass 90% der NAS-Anwendungen nutzlos sind.

/de/how-to-install-paperless-ngx-on-your-nas/9058fdc48d0956b6f4f84b29e4a4a940.jpg

Nur 3 oder 2 von ihnen sind tatsächlich nützlich.

Die meiste Zeit lassen wir sie nach dem Einrichten nach verschiedenen Anleitungen und Tutorials einfach unberührt.

Von der ersten NAS, die ich hatte, der Star Snail, bis heute, nach 8 Jahren, habe ich unzählige selbst gehostete Anwendungen erforscht.

Der Protagonist, den ich heute vorstelle, gehört zu den verbleibenden 10%, die tatsächlich nützlich sind.

Genauer gesagt kann er als die Top 1% unter diesen 10% der Nützlichkeit betrachtet werden.

Die Vorteile, die er mir bringt, betreffen nicht nur das Leben und die Arbeit, sondern auch eine bessere Dokumentenverwaltung und Dateisuche.

Dank ihm habe ich mindestens 500 Stunden gespart.


Bevor ich ihn offiziell vorstelle, möchte ich über ein anderes Thema sprechen: Warum ich immer nicht in der Lage war, das Apple-Ökosystem zu verlassen.

Das Apple-Ökosystem hat mir nicht nur bequeme Systeme, Sicherheit und reibungslose Integration aller Geräte gebracht, sondern auch einen der größten Gründe: Die leistungsstarke Foto-OCR-Funktion von Apple.

Wenn ich zum Beispiel einen Chat-Screenshot aus einem Gespräch finden möchte, das ich vor einiger Zeit mit einem Verkäufer hatte, um Beweise vorzulegen,

Im Vergleich zur vorherigen Methode, jedes Bild einzeln durchzusuchen, kann ich jetzt einfach nach dem Schlüsselwort Schraubenzieher suchen. Apple Fotos findet direkt das Bild, das einen Schraubenzieher enthält.

image-20231213105413936

image-20231213105424615

Wenn Sie mit dieser Funktion noch nicht vertraut sind, versuchen Sie es nicht sofort selbst.

Das Spielzeug, das ich Ihnen heute vorstelle, kann Ihnen dasselbe bieten:

  • Den gleichen Effekt wie die Apple-Funktion.
  • Gehostet auf Ihrem NAS.
  • Volle Kontrolle über Ihre Daten.

image-20231213110140424

  • Es unterstützt auch Online-Vorschau:

image-20231213131049730

  • Es unterstützt alle digitalen Dokumente: Nicht nur Bilder, sondern auch PDFs, Word-Dokumente, Excel-Tabellen und sogar Markdown-Dateien. Es ermöglicht wirklich die Digitalisierung von Dokumenten, deren einheitliche Verwaltung und effiziente Suche.

image-20231213110911380

Das ist das neue Spielzeug, das ich Ihnen heute vorstelle, Paperless-ngx. Wie der Name schon sagt, geht es darum, papierlos zu werden.

Es kann Ihnen helfen, Ihre Verträge, physischen Dokumente, Rechnungen und mehr zu organisieren, während es auch digitale Dokumente (Word, Excel, PDF usw.) verwaltet.

paperless-ngx-banner


Paperless-ngx ist nicht nur ein Dokumentenmanagementsystem. Es ist eine umfassende Lösung, die Ihre physischen Dateien in durchsuchbare Online-Archive umwandelt und den Papierverbrauch reduziert. Zu seinen Kernfunktionen gehören:

  • Dokumentenorganisation und Indexierung: Organisieren Sie gescannte Dokumente mithilfe von Tags, Korrespondenten, Typen und mehr.
  • OCR-Texterkennung: Führen Sie eine optische Zeichenerkennung auf Dokumenten durch, um eine Textsuche und -auswahl zu ermöglichen, auch für Dokumente mit Bildern.
  • Unterstützung mehrerer Sprachen: Verwenden Sie die Open-Source-Engine Tesseract, um über 100 Sprachen zu unterstützen.
  • Langzeit-Speicherformat: Speichern Sie Dokumente im PDF/A-Format, das für die Langzeitarchivierung entwickelt wurde.
  • Intelligente Tagging und Klassifizierung: Fügen Sie automatisch Tags, Korrespondenten und Dokumententypen mithilfe von maschinellem Lernen hinzu.
  • Breite Dateiunterstützung: Unterstützung für PDF-Dokumente, Bilder, einfache Textdateien, Office-Dokumente und mehr.
  • Anpassbare Dateiverwaltung: Paperless-ngx verwaltet Dateinamen und Ordner und unterstützt verschiedene Konfigurationen.
  • Moderne Webanwendung: Anpassbares Dashboard, Filter, Stapelbearbeitung, Drag & Drop-Upload, benutzerdefinierte Ansichten, freigegebene Links und mehr.
  • Volltextsuche: Autovervollständigung, Relevanzbewertung und Hervorhebung der übereinstimmenden Suchbegriffe.
  • E-Mail-Verarbeitung: Importieren Sie Dokumente aus E-Mail-Konten und konfigurieren Sie mehrere Konten und Regeln.
  • Berechtigungssystem für mehrere Benutzer: Integriertes robustes Berechtigungssystem für mehrere Benutzer.
  • Optimierung für Mehrkernsysteme: Parallele Verarbeitung mehrerer Dokumente.

Einrichtungsschritte:

Folgen Sie kostenlos, um auf dem Laufenden zu bleiben.

container-manager-1

container-station-1

container-station-2

Tutorial-Referenz:

Installieren Sie Portainer in NAS in 30 Sekunden

  • Öffnen Sie die File Station und erstellen Sie einen Ordner paperless-ngx im Docker-Ordner.

image-20231212182330224

  • Erstellen Sie die folgenden Verzeichnisse innerhalb des Ordners paperless-ngx:
    • consume
    • data
    • export
    • media
    • pgdata
    • redisdata

image-20231212182342117

Ich verwende den Container Manager von Synology für diese Einrichtung, aber Portainer und QNAP sind ähnlich:

image-20231212182358034

Kopieren Sie die folgende Konfiguration:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
version: "3.4"
services:
  broker:
    image: library/redis:7
    restart: unless-stopped
    volumes:
      - /volume1/docker/paperless-ngx/redisdata:/data

  db:
    image: library/postgres:15
    restart: unless-stopped
    volumes:
      - /volume1/docker/paperless-ngx/pgdata:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: paperless

webserver:
  image: paperlessngx/paperless-ngx:latest
  restart: unless-stopped
  depends_on:
    - db
    - broker
    - gotenberg
    - tika
  ports:
    - "28000:8000"  # ändere es, wenn du möchtest
  healthcheck:
    test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
    interval: 30s
    timeout: 10s
    retries: 5
  volumes:
    - /volume1/docker/paperless-ngx/data:/usr/src/paperless/data
    - /volume1/docker/paperless-ngx/media:/usr/src/paperless/media
    - /volume1/docker/paperless-ngx/export:/usr/src/paperless/export
    - /volume1/docker/paperless-ngx/consume:/usr/src/paperless/consume
  environment:
    PAPERLESS_REDIS: redis://broker:6379
    PAPERLESS_DBHOST: db
    PAPERLESS_TIKA_ENABLED: 1
    PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
    PAPERLESS_TIKA_ENDPOINT: http://tika:9998
    PAPERLESS_OCR_LANGUAGES: chi-sim chi-tra  # ändere es, wenn du möchtest
    PAPERLESS_OCR_LANGUAGE: eng+chi_sim  # ändere es, wenn du möchtest
    USERMAP_UID: 0
    USERMAP_GID: 0
    PAPERLESS_TIME_ZONE: Asia/Shanghai  # ändere es, wenn du möchtest
  dns:
    - 8.8.8.8
    - 8.8.4.4

gotenberg:
  image: gotenberg/gotenberg:7.10
  restart: unless-stopped
  command:
    - "gotenberg"
    - "--chromium-disable-javascript=true"
    - "--chromium-allow-list=file:///tmp/.*"

tika:
  image: apache/tika:latest
  restart: unless-stopped

Erklärung der Konfiguration (anpassbar):

Ich habe die Teile in der obigen Datei markiert, die meiner Meinung nach mit “# ändere es, wenn du möchtest” geändert werden können. Für den Rest wird Anfängern nicht empfohlen, sie zu ändern.

  • Abschnitt “ports” des Webservers: Du kannst ihn auf einen anderen Port wie “38000:8000” ändern, ändere nicht die 8000 am Ende

  • PAPERLESS_OCR_LANGUAGES: Setze die unterstützten Sprachen für Paperless, chi-sim chi-tra (Vereinfachtes Chinesisch, Traditionelles Chinesisch), du kannst die gewünschte Sprache hinzufügen, z.B. jpn

    Außerdem enthält das System bereits Englisch, Deutsch, Italienisch, usw.

  • PAPERLESS_OCR_LANGUAGE: Standard-Sprache für OCR, ich habe sie hier auf Englisch und Vereinfachtes Chinesisch gesetzt

  • PAPERLESS_TIME_ZONE: Setze deine Zeitzone

image-20231212182432126

image-20231212182442058

Greife über den Browser auf das Programm zu: [IP]:[Port]

IP ist die IP-Adresse deines NAS (meine ist 172.16.22.22) und der Port ist in der obigen Konfigurationsdatei definiert. Wenn du meiner Anleitung gefolgt bist, ist es 28000.

image-20231213115505007

Aber anscheinend hast du noch keinen Benutzernamen und kein Passwort, also lass uns einen Benutzer und ein Passwort erstellen:

Wähle den Webserver-Container aus und öffne das Terminal:

image-20231212182454272

python3 manage.py createsuperuser

Gib folgende Informationen ein:

  • Benutzername
  • E-Mail
  • Passwort

image-20231212182500769

image-20231212182524985

image-20231212182535297

Der Text wurde extrahiert:

image-20231212182553777

image-20231212182603518

image-20231212182610480

image-20231212182618189

In der Bearbeitungsansicht kannst du das erkannte Ergebnis sehen und Änderungen vornehmen:

image-20231212182641514

image-20231212182625422

image-20231212182740034

image-20231212182653729

Du kannst auch die Drittanbieter-App paperless_app herunterladen

image-20231213123109606

Du kannst auch andere Scan-Apps verwenden und sie dann in pp importieren (bessere Erkennung), wie z.B. die kostenlose Microsoft Lens

Screenshot von Microsoft Lens auf einem iPhone

Screenshot von Microsoft Lens auf einem iPhone

Du kannst auch deinen physischen Drucker anschließen und automatisch in Paperless hochladen:

image-20231213123313667

Wenn du weitere Ideen hast, teile sie gerne mit.

Wenn dir dieser Artikel gefallen hat, denke bitte daran, ihn zu liken, zu bookmarken und Dad’s Digital Garden zu folgen. Wir werden weiterhin praktische Anleitungen zur Selbst-Erstellung von Anwendungen bringen. Gemeinsam nehmen wir unsere Daten in die Hand und erschaffen unsere eigene digitale Welt!

Wenn du während des Einrichtungsprozesses auf Probleme stößt oder Vorschläge hast, hinterlasse bitte einen Kommentar für Diskussion und Lernen.