Save Webpages
Information here is stale and needs to be updated!
Services
Wallabag
Selfhosted Pocket-like service
Raindrop.io
Bookmark Service - saves full page copy (in most cases)
Pocket ist erste Wahl, weil es die ganze Website speichert und offline auf den Geräten zur Verfügung stellt.
Nachteil: free Version speichert keine archivierten Artikel.
Archive.is
Speichert ganze Website, hat aber keine API/Interface um eigene Artikel abzurufen (same with Archive.org)
API: http://mementoweb.org/depot/native/archiveis/
Workflow
Speichere Kopien von Webseiten lokal (oder cloud)
Bookmark eine Seite via Pocket und speichere diese via IFTTT als Markdown, PDF und ePub in Dropbox
Da Markdown im Moment am sichersten ist, könnte eine Konvertierung automatisch mit Pandoc, lokal ablaufen. Besser wäre aber ein Cloud-Service.
Eventuell kann die Readability API helfen, den Content besser darzustellen.
Was ist das? http://brettterpstra.com/projects/nvalt/
Best Case:
Browserbookmark triggert das speichern in Pocket und archive.is (muss url irgendwo speichern) dann wird aus der Seite eine Markdown, EPub und PDF Version erzeugt und auf Google Drive und in Dropbox gespeichert (was immer besser ist). Das Ganze benötigt natürlich ein Interface, um die gespeicherten Artikel katalogisieren, durchsuchbar zu machen etc.
Die ganze Arbeit lohnt evt. nicht und man bezahlt einfach Pocket ;-).
Google Drive
Pro
- Drucke Webseiten aus Chrome zu Drive (inkl. Seitenvereinfachung)
- Sehr gut durchsuchbar
Con
- Interface?
- Apps?
- Google?
Dropbox
Pro
- Läuft einfach
- Einbindung ins Dateisystem etc.
Con
- Inhalte nicht durchsuchbar (Nur Business-Accounts)
Pro
- gekapseltes Format mit Bildern
- kann überall gelesen werden
- durchsuchbar (index)
Con
- keine freie API, müsste programmiert werden (wkHTMLtoPDF)
- PDF Reader auf dem Phone können das Layout nicht anpassen
Markdown
Service
https://codebeautify.org/html-to-markdown API
preview = 1 = html
Pro
- Textformat, überall lesbar
- Kann in diverse Formate exportiert werden (in epub, pdf, html via Pandoc)
Con
- Nicht so leicht lesbar als nur Text
- Braucht Nachbearbeitung (Pandoc)
- Verlinkt Bilder, aber wenn diese offline sind hat man Pech
EPub
Service
DotEPUB stellt eine API und Bookmarklets bereit. Kann mit IFTTT und Dropbox verwendet werden. (Leider nicht so richtig)
Pro
- Reader auf allen Plattformen
- Layout anpassbar
- Klein
Con
- Nicht durchsuchbar
HTML
- Portable Snapshot
- Not optimized for reading
Artikel
Zusammenfassung
Nicht einfach lösbar!
Webpage zu PDF Konverter kosten meistens Geld oder können nicht per GET angesprochen werden.
Die Readability API liefert JSON und keine Website on the fly.
Archive.is hat ebenfalls keine GET Api (anderenfalls würde vermutlich das Web dort gespiegelt werden)
Die Konvertierung in Markdown als Backup ist derzeit die einzige Möglichkeit die Artikel als reinen Text zu bekommen. Ob die Bilder bei späterer Ansicht noch verfügbar sind, steht auf einem anderen Blatt.
Am besten wäre es wenn Seiten als PDF über Chrome/Cloud gedruckt werden können.