Für das papierlose Büro
PDF Archiver: Open-Source-Projekt zur Langzeit-Archivierung
ifun.de-Leser Julian hat uns auf sein Open-Source-Projekt PDF Archiver aufmerksam gemacht, das sowohl im Mac App Store geladen werden kann als auch in Quelltext-Form auf dem Code-Portal Github zum freien Zugriff bereitsteht.
Die Anwendung soll beim Organisieren der eigenen PDF-Ablage zur Hand gehen und setzt dafür weder auf eine proprietäre Cloud-Lösung noch auf ein Datenbank-Format, dass in wenigen Jahren vielleicht schon nicht mehr unterstützt wird.
Der PDF Archiver setzt auf eine eigene Dateinamen-Konvention, die Schlagwörter, Daten und Beschreibungen einfach im Dateinamen der Dokumente notiert und so weitgehend unabhängig von Betriebssystem, Cloud-Anbieter und Mac- bzw. PC-Anwendung eingesetzt werden kann. Das Format ist dabei relativ übersichtlich:
- Datum: yyyy-mm-dd (Datum des Dokumentes)
- Beschreibung: –ikea-tradfri-gateway (eine kurze Inhaltsangabe)
- Tags: __bill_ikea_iot (Schlagwörter die beim Wiederfinden helfen sollen)
Julian erklärt:
[…] Freunde von mir und ich haben von dem Projekt fileee.com gehört und fanden die Idee prinzipiell super. Dort wird der Workflow Dokumente zu digitalisieren und zu sortieren vereinfacht. Allerdings waren wir sehr skeptisch unsere gesamten Dokumente diesem einen Unternehmen anzuvertrauen. […]
Somit war klar: wir wollten ein Konzept haben, bei dem man seine Dokumente weiterhin selbst kontrolliert und entscheidet, wo diese gespeichert werden sollen. Außerdem war eine langfristig Speicherung (auch >10 Jahre) gefordert. Wir kamen zu der Lösung, dass möglichst viele Informationen über das Dokument im Dateinamen stehen sollten und der Dateiname trotzdem so aufgebaut ist, dass man problemlos das Betriebssystem/Dateisystem auf dem die Daten gespeichert werden, wechseln kann.
So besitzt die Mac-Anwendung derzeit eigentlich nur die Aufgabe, vorhandene Dokumente schnell zu verschlagworten. Durchsucht werden die Dokumente anschließend auf Dateisystem-Ebene bzw. mit Hilfe des Finders.
Julian hat die Idee hinter dem PDF Archiver in diesem Blogeintrag ausführlich formuliert und würde sich über Ideen und Anregungen freuen.
Noch ist die Mac-App keine Download-Empfehlung, sobald die Applikation jedoch auch in der Lage ist, schon vorhandene Archive anzuzeigen, zu durchsuchen und beim nachträglichen Sortieren zur Hand zu gehen, könnte sich der PDF Archiver durchaus zu einer EagleFiler-Alternatove Mausern. Wir halten euch auf dem Laufenden.
Sowas suche ich für Windows.
So etwas für MacOS und Windows, perfekt
Gute Idee!
Aber auch PDF ist doch nicht so sicher und Langzeitarchivierungstauglich? Ich erinnere nur mal an Apple Preview…. was wenn man irgendwann bemerkt, dass die PDFs zwar existieren, dank Preview aber nur noch aus leeren, weißen PDFs bestehen?
Langzeitarchivierung ist wirklich nichts einfaches, vermutlich müsste man fast alte Systeme im Keller sammeln, damit man ggf. auf diese zurückgreifen kann.
Es gibt auch ein PDF Format speziell für die Langzeitarchivierung: https://de.wikipedia.org/wiki/PDF/A
Am sichersten wäre aber wohl ein JPEG/PNG/TIFF und eine einfache Textdatei mit dem OCR Text.
Dass die Formate mal nicht mehr gelesen werden können ist doch recht unwahrscheinlich.
Dafür wurde extra das PDF/A Format entwickelt. Es ist wird auf x Jahre (genaue Dauer habe ich nicht im Kopf) von allen Acrobat Readern unterstützt und ist öffentlich dokumentiert.
Unterstützen das auch andere Programme und ist garantiert, dass Apple das nicht wieder mit irgendeiner tollen Idee zerstören kann?
Danke für den Hinweis!
Spannend, aber ich würde die Sachen eher mit OCR scannen. Dann such ich einfach nach IKEA und krieg alles wo IKEA drin ist. Und kann auch nach Sachen suchen, die ich nicht als Schlagwort genutzt habe.
Genau so mache ich es auch. Nur habe ich noch keinen anständigen Scanner der auch duplex scan beherrscht.
Hat da jemand einen Tipp?
Ich nutze Scanbot. Läd auch gleich in die iCloud hoch. ;)
Fujitsu IX500
Nutze ich schon ziemlich lange und bin total begeistert
ScanSnap ix500. Duplex Scan mit OCR. Und sehr schnell.
Zuhause: Fujitsu Scansnap iX500. Funktioniert sowohl zuhause am Mac als auch auf Windows im Büro wunderbar (inkl. Duplex). Möcht‘ ich nicht mehr missen.
Unterwegs: Scanbot, aber dazwischen liegen (wie zu erwarten) Welten…
Ich. bin extrem happy mit dem BROTHER ADS-2600.
Ich schiebe ein Papier rein, drücke auf dem Display z.B. auf den Softbutton „Rechnung, doppelseitig“.
Es läuft durch und wird vom Scanner an meine Gmail-Adresse geschickt ind dort als Rechnung einsortiert.
Mit dem passenden Google Script wird die Rechnung dann in mein Google Drive geladen und am Mac von „Receipts“ einsortiert. Besser geht es kaum :)
Ich habe einen aktuellen größeren hp-drucker mit duplex druck und duplex scan. Bei größeren Dokumenten, also ab 5 Seiten, habe ich damit aber regelmäßig probleme. Ein Scansnap ist hierbei schlicht eine ganz andere Leistungsklasse, kostet aber auch etwas mehr.
Für meine Dokumente benutzte ich übrigens Paperless, was öfters mal im Angebot ist, oder in bundles. Das funktioniert für mich auch ganz gut.
Ich nutze Epson WF 7610. druckt zwar nicht besonders gut, aber scannt super. Duplex bis DIN A4 und zusätzlich Auflagenglas DIN A3, scannt dann auch die langen IKEA Quittungen. druckt auch bis DIN A3 randlos
fujitsu snapscan. Jeder Brief in meinem Briefkasten wird gescannt, PDF durchsuchbar, und dann mit der obigen Dateinamenkonvention (verwende ich seit mehr als 10 Jahren) abgelegt.
Dann über eine Automator Aktion in den richtigen Ordner abgelegt.
Daher ist die Applikation für mich nutzlos.
Open Source und dann 3,5 Tacken im App Store???
Open Source heißt nicht „kostenlos“. Es heißt nur, dass der Code offengelegt wird.
Nur weil du nachgucken kannst, was in deinem Joghurt drin ist, bekommst du es ja trotzdem nicht geschenkt. :)
Open Source != kostenlos
Siehe z.B. Red Hat.
Kannst es doch mit XCode selber compileieren.
Was hat opensource mit der Monetarisierung zu tun? Kompilier es dir doch selbst, es hält dich keiner davon ab. Eine App im App Store anzubieten kostet nunmal Geld und ich glaube nicht das da so viel Gewinn übrig bleibt.
Mal aus interesse: Was schützt dann den Programmierer davor, dass jemand anders eine Zeile ohne Funktion im Code ergänzt und das gleiche Produkt für 50 cent weniger zum Verkauf anbietet?
Das Urheberrecht.
versucht doch mal ecoDMS. Läuft unt Mac, Win, Qnap, Synology. Hab es getestet und fand es hervorragend. Einfach, für den Privateinsatz in einem vernünftigen Umfang kostenfrei und durchaus mit einer schnellen und guten OCR.
Leider musste ich wieder was anderes nutzen, da ich schon über 5.000 Dokumente in einem ELO Archiv habe, welche man nicht so einfach und kostenneutral migrieren kann. Bin wohl auf ewig da gefangen:(
Das ist zu mächtig und auf Synology benötigt es Docker
Ich habe mir auch ecoDMS angeschaut. Läuft in einer ContainerStation auf meiner QNAP. Das ist wirklich ein sehr mächtiges Tool ich denke abr das es sehr vernüftig ist. Am Anfang ist glaube ich sehr viel nötig damit es läuft, aber ich denke es ist ein Super Management tool. Schauen wir mal :)
Das Programm Doo war mal gut, wurde aber eingestellt und läuft unter High Sierra nicht mehr richtig. Schade.
Doo ist bei mir immer abgestürzt. Egal, ob ich es unter SnowLeopard, MountainLion oder Sierra benutzt habe.
Die Idee dahinter war aber schon cool. Schade, das es nicht mehr weiter entwickelt wird.
Paperless von Mariner Software ist wie itunes für Dokumente, versteckt aber alles in einer Datenbank. Da ist ein späterer Wechsel von Betriebssystem oder Verwaltungssoftware fast unmöglich.
Könnt Ihr einen iOS-PDF-Scanner empfehlen, der möglichst kleine PDFs erzeugt?
Geht nur um das Einscannen von Rechnungen: s/w und komprimiert bekomme ich pro DIN A4-Seite mit Scanner Pro von Readdle auf PDFs zwischen 300-400kb.
Finescanner Pro macht die kleinsten PDFs. Man muss dafür die OCR-Funktion benutzen. Größe ist dann ungefähr ein Zehntel des Üblichen (und der erkannte Text ist inklusive).
Danke für den Tipp. Das Programm steht zwar noch komplett am Anfang seiner Entwicklung, aber das Konzept der Ablage einfach im Filesystem ist für mich jedoch genau der richtige Ansatz. Für mich ist dieses Grund genug warum ich mich jetzt ernsthaft damit beschäftige eine elektronische Dokumentenablage zu erwägen.
Geht mir gerade ganz genauso :D
Dem schließe ich mich an.
Als ich die Beschreibung las, dachte ich, genau was ich schon lange suche.
Bin begeistert wie einfach das Programm zu bedienen ist. Genial finde ich die Verschlagwortung im Dateinamen und Übernahme als Finder-Tags.
Mein Workflow:
Scannen mit dem ScanSnap ix100 als durchsuchbare PDF direkt ins „untagged“ Verzeichnis, mit PDF Archiver einlesen und bearbeiten, sichern. Die PDF wird danach direkt ins Archiv-Verzeichnis verschoben. Fertig.
Danke für den Tip. Generell bin ich an Paperless-Themen hier sehr interesseiert. Seit 2010 scanne ich meine Dokumente, seit 2016 mit dem iX500. Dazu lasse ich mir von der Software Hazel helfen, die auch Tags und Dateinamen jonglieren kann. Auch eine Ordnerstruktur lässt sich damit aufbauen. Bei diesem pdf-Archiver sehe ich etwas die Gefahr, dass die Anzahl der Tags ausufern könnte. Desweiteren habe Tags eigentlich am meinsten Sinn, wenn sie Zusatzinformation bieten, die nicht im Dateinamen stehen oder im Dokumenteninhalt.
Danke für den Tip. Generell bin ich an Paperless-Themen hier sehr interesseiert. Seit 2010 scanne ich meine Dokumente, seit 2016 mit dem iX500. Dazu lasse ich mir von der Software Hazel helfen, die auch Tags und Dateinamen jonglieren kann. Auch eine Ordnerstruktur lässt sich damit aufbauen. Bei diesem pdf-Archiver sehe ich etwas die Gefahr, dass die Anzahl der Tags ausufern könnte. Desweiteren habe Tags eigentlich am meinsten Sinn, wenn sie Zusatzinformation bieten, die nicht im Dateinamen stehen oder im Dokumenteninhalt.
Mac Nutzer müssen sich für plain Text Aufgaben eben eine App schreiben…
Wie siehts nie iDocuments aus ?