Dokumente/Bücher einscannen Grundstellende einstellungen

  • Ich habe einen alten Dokumentenscanner bekommen weil dieser nicht unter W7 oder neuer arbeitet. Also hab ich ihn einfach mir Windows XP betrieben.
    Diesen hier: http://www.fujitsu.com/global/…nued/fi4120c/fi4120c.html


    Jetzt kann ich einfach viele Seiten hintereinander scannen. Aber zu welchen Einstellungen. Habe mal Test als Grayscale mit 150 DPI gemacht: http://www.roman-oswald.de/download/test.pdf


    Ja es ist schief, aber das kommt weil das original auch schief ist.


    Und noch eins, diesmal ein A4. Dies hat ein dünnes Papier, es scheint etwas durch.: http://www.roman-oswald.de/download/test2.pdf


    Ist dies machbar, oder doch andere Einstellungen. Ich nutze NAPS2 zum einscannen: https://www.naps2.com


    Bleibt noch die Sache mit Bücher, auftrennen...?

  • Ein FAX Geraet arbeitet mit 200dpi. Das wurde ich auch nehmen. Mehr muss nur sein, wenn es um kleine Details geht.
    Bei einer guten Vorlage kann man ohne weiteres mit SchwarzWeiss arbeiten. Grayscale ist oft nicht notwendig.


    Viel Spass

    ;------------------------------------
    ;----- ENABLE NMI INTERRUPTS
    (aus: IBM BIOS Source Listing)

  • Definition was die von Bitsaversmachen (bitet runterscrollen) . Ich mache mit meinem Abbyy finereader die PDFs nicht nach Vorgabe von bitsavers, halte aber die Bilder als png fest.


    MM: S/W in 400dpi, Graustufe auch als 400DPI einscannen, die PDF kann in der Größe entsprechend den Wünschen erstellt werden.
    Als Scanner nutze ich den cannon image formula c125.



    The PDF Document Format
    Documents here are kept in a minimal subset of PDF format, just using it as a
    container for lossless Group 4 fax compression (ITU-T recommendation T.6) images.
    Contributions are normally post-processed by tools to put them in exactly this format,
    so that all of the documents here are the same and can be burst at some point in the
    future when OCR technology is mature enough to do a good job of recognition.


    Documents were scanned using a Ricoh IS520 30ppm duplex production scanner from the late 90's through 2007.
    Conversion to higher performance Kodak DS 2500D scanning occured in July, 2007.
    The 2500D is an OEM version of the Panasonic KV-S2055 scanner.
    In 2008, the Kodak was replaced by a Panasonic KV-S3065W, which
    is capable of color 600dpi scanning, and has the capability to scan
    sheets several feet long.


    Post-processing is done using Lemkesoft's Graphic Converter
    TIFF to PDF conversion is done using Eric Smith's tumble


    The preferred form for any contributed text scan is as a collection of lossless
    Group 4 fax compression (ITU-T recommendation T.6) images saved as TIFF
    files with a minium scan resolution of 400 dpi.


    Lower scan resolutions produce noticable artifacts if a page needs to be
    straightened in post-processing.


    Lossy compression formats, such as JPEG, should NEVER be used to save pages
    of text, since the compression format destroys edge resolution and contrast
    would make it difficult to OCR in the future.

  • Ich scanne im Normalfall mit 300 DPI in Graustufen, dann klappts auch mit der OCR, die ich grundsätzlich immer direkt mitmache.
    Wenn das ganze dann mal ausgedruckt werden soll passen die 300 DPI auch perfekt.
    Farbige Vorlgen scanne ich natürlich auch in Farbe.
    Wenn die Vorlage sehr feine Details enthält gehe ich mit der Auflösung evtl. noch höher.

  • Da kann man nur zustimmen. Scannen von "Altpapier" was schwarz-weiß bedruckt ist, muß man ja nicht in Farbe machen, aber Graustufen sollten es schon sein. Und 256 ist da besser als 16. Auflösung zum Nur-Lesen am Bildschirm würde ja mit 150dpi reichen - ABER: wenn man das mal ausdrucken, will sollte es schon was mehr sein. Meines Erachtens ist das absolute Minimum für vernünftige Archivierung 300dpi - wünschenswert wären wahrscheinlich 600dpi. Daher ist 400 sicher ein guter Kompromiß, der bißchen nachbessern erlaubt bei absoluter Minimalqualität für eine ordentliche (gedruckte) Reproduktion.
    Das Thema ist doch auch: Runterrechnen und Thresholds setzen etc. ist kein Thema (und wird immer noch schneller werden), das Scannen dagegen wiederholst Du vermutlich nicht wieder. Da sollte es gleich von Anfang an so sein, daß es auch später noch ansehnlich aussieht.

  • Bleibt noch die Sache mit Bücher, auftrennen...?

    Wenn es sich um alte Bücher / Dokumente über unsere Oldies handelt, würde ich das keinesfalls machen. Da würde ich den Original-Zustand erhalten wollen. Mir tut es immer in der Seele weh, wenn ich von Fans höre, dass sie den Buchrücken maschinell abschneiden, um dann einfach scannen zu können. Danach kleben sie den Buchrücken neu. Damit ist der Wert der Rarität deutlich gesunken.


    Auch wenn man die Seiten nicht entfernt und das Buch / Manual Blatt für Blatt einfach auf den Scanner plättet, sieht das hinterher deutlich "gebraucht" aus. Eventuell sogar so, als ob es "schief gelesen" wurde.


    Ich bin kein Scan-Spezialist. Wäre gut zu wissen, ob es eine schonendere Methode gibt, die man sich auch leisten kann.


    Ich finde es schon wichtig, alte Bücher, Manuals etc. über unsere Oldies in PDFs zu archivieren und jedermann kostenfrei verfügbar zu machen.

  • Hier gibt es in der Uni-Bibliothek Buchscanner. Da kann man das Buch offen drauflegen, zu scannende Doppelseite nach oben, und muß es nicht plattdrücken. Es gibt keinen Deckel, den man nach jeder Seite hochklappen müßte, das Umblättern geht schnell, die Maschine rechnet die Verzerrung durch den Falz weg und schreibt einem eine Datei auf einen mitgebrachten USB-Stick.


    Gruß,
    Markus

  • Sehr interessant für mich, davon hör ich zum ersten Mal. Das ist Klasse. Bei so stressfreier Behandlung überleben sie unbeschadet weiterhin. Das freut nicht nur Sammler.


    Leider hab ich hier diese Möglichkeit nicht. In unserer städt. Leih-Bib haben sie keinen Scanner und viele meiner geplätteten Sharp-Docs sahen danach leider auch dementsprechend ungepflegt aus. Wenn man sie dann geschlossen und beschwert lange Zeit unbebutzt liegen lässt, gewinnen sie etwas von ihrem einst neuen Zustand zurück, aber, es ist auch dann im Vergleich deutlich nicht mehr derselbe.


    Ich mache beim erstmaligen Öffnen eine kleine nostalgische Zeitreise. Ich lande damit ein Stück in der Vergangenheit. Meist habe ich bereits einen Bezug zu den Dokumenten und kenne sie von "damals". Daher tauchen Erinnerungen auf, Wissenswertes aus diesen Tagen, das ich oft auf meiner HP verarbeitet habe.

  • Bücher und Hefte "von damals" die benutzt wurden sind auch in einem solchen Zustand. Oft ist die Bindung nicht mehr in Ordnung und / oder das Buch hat weitere Gebrauchsspuren.


    Ganz schlimm war aber von vielen gedruckten Heften und Büchern die Papierqualität. Das Papier war oft unterste Qualität, nicht glatt und auch nicht säurefrei. Eine Langzeitlagerung dieser Druckwerke war nicht angedacht und heute sind die Blätter stark nachgedunkelt und teilweise kaum lesbar.


    Ich nutze den Abbyy Finereader und den PDF-XChange Editor. PDFs erstelle ich wenn möglich in Graustufe (nicht verlustlose Komprimierung) und Schwarz/Weiss (verlustlose Komprimierung) die gescannten Bildr sind als bmp oder png in einem RAR-Archiv abgelegt. RAR hat als einziger mir bekannter Archiver die Möglichkeit Wiederherstellungsinformationen (->Redundanz) hinzuzufügen.

  • Wenn was schwarzweiß gedruckt wurde, würde ich das auch nur in schwarzweiß scannen. Durch Graustufen gewinnt man da IMHO nichts. Als Scanauflösung würde ich 300 dpi oder ein (ganzzahliges!) Vielfaches davon nehmen, weil es damit keine Skalierungs/Moiree-Effekte gibt, wenn man es mal wieder ausdrucken will, denn gängige Laserdrucker arbeiten auch mit 300,600,1200 dpi.

  • Durch Graustufen gewinnt man da IMHO nichts.


    Doch, Klarheit.
    Wenn die Vorlage macken hat, oder auf Recyclingpapier gedruckt wurde (ich habe hier auch Dokumente die sind Schwarz auf Dunkelgrau), hat man bei 1Bit ganz gerne entweder hier und da schwarze Pixel, oder von den Zeichen/Grafiken fehlt hier und da etwas - gerne auch in Kombination.


    OK, vielleicht sollte ich auch erwähnen dass mein Scanner (Bj. 1997, läuft nur unter W98 vernünftig) nicht viele Einstellungsmöglichkeiten bietet um das Scanergebnis bei 1Bit zu verbessern.

  • Ich sammel keine Bücher. Nach Möglichkeit habe ich diese doppelt um dann ein Buch passend für den Scanner zu zerlegen.


    Blasphemie!!! Orwell's 1984 wird Wirklichkeit!! ... na, zumindest fast. Du veranstaltest hoffentlich kein Freudenfeuer nach dem Scan ;-)


    Ich habe vor Jahren mal mit dem Gedanken gespielt einen richtigen Buchscanner zu bauen. Es gibt sehr schöne kommerzielle, die selbständig umblättern können und somit ein Buch, ohne es zu zerstören, komplett einscannen können (die kommerziellen sind aber finanziell für mich nicht erschwinglich)


    Zum Glück sammle ich nur Apple-Bücher - die doppelten verschenke ich meist. Denn zum Glück hat jemand anderes diese Bücher bereits eingescannt (oft mehr recht als schlecht, und noch öfters ohne OCR-Einbettung)


    Der schicke Canon-Scanner gefällt mir ausgesprochen gut - passt zu meinem G5 ;-)

    "There is no reason for any individual to have a computer in his home." Ken Olson, president, chairmen and founder of Digital Equipment Corp, 1977

  • Das sieht ja richtig gut aus, allerdings habe ich den Eindruck, daß die Materialkosten dafür nicht unerheblich sind.
    Und der Arbeitsaufwand wird auch nicht ganz ohne sein.
    Aber immerhin scheint das Ding in der Lage zu sein, ein Buch weitgehend automatisch einzuscannen.

  • Wenn es sich um alte Bücher / Dokumente über unsere Oldies handelt, würde ich das keinesfalls machen. Da würde ich den Original-Zustand erhalten wollen. Mir tut es immer in der Seele weh, wenn ich von Fans höre, dass sie den Buchrücken maschinell abschneiden, um dann einfach scannen zu können. Danach kleben sie den Buchrücken neu. Damit ist der Wert der Rarität deutlich gesunken.

    Ich habe alle Bücher 'RAM-ROM-I/O Assemblerlistings' von Schineis/Braun gescannt. Dazu habe ich die Bücher von einem Buchbinder auseinandernehmen und nach der Scan-Aktion wieder binden lassen. Die Bücher sehen danach besser aus als vor der Aktion :-)


    Die Listings waren damals als 'Kopierschutz' auf farbigem Papier gedruckt - die modernen Scanner können mittlerweile die Hintergrundfarbe entfernen. Man bekommt so eine perfekte Vorlage für die spätere Nachbearbeitung. Auf alle Fälle muss man in der besten Auflösung scannen - manchmal sind die höchsten Auflösungen nur interpoliert, das bringt überhaupt nix.


    Man sollte immer mit einer Seite experimentieren, bis alles stimmt. So eine Aktion wiederholt man nicht einfach, wenn das Ergebnis unzureichend ist.

  • Ich habe alle Bücher 'RAM-ROM-I/O Assemblerlistings' von Schineis/Braun gescannt. Dazu habe ich die Bücher von einem Buchbinder auseinandernehmen und nach der Scan-Aktion wieder binden lassen. Die Bücher sehen danach besser aus als vor der Aktion :-)


    Gute Aktion. :thumbup:
    Ein paar Fragen hätte ich dazu :)
    - In welchem Kostenrahmen bewegt sich sowas?
    - Welche Listings waren das denn genau? ;)

  • Das hat sicher seinen Preis.
    Ich kenn mich nicht mit Sammeln aus. Könnte mir aber vorstellen, dass Sammler das möglicherweise nicht gut finden. Es ist nicht mehr der ursprüngliche Zustand obwohl toll/fachmännisch gemacht.
    Btw, Buchbinderei haben meine Frau und ich mal als Hobby versucht. Hat viel Spass gemacht.


  • Blasphemie!!! Orwell's 1984 wird Wirklichkeit!! ... na, zumindest fast. Du veranstaltest hoffentlich kein Freudenfeuer nach dem Scan ;-)
    .....
    .....


    Der schicke Canon-Scanner gefällt mir ausgesprochen gut - passt zu meinem G5 ;-)


    Die Blätter und der Einband des Buches/Heftes werden in Archivboxen sicher und weitgehenst luftabgeschlossen aufbewahrt. Bei den alten, nicht säurefreien Papieren habe ich allerdings keine Lösung mit der das weitere Zersetzen des Papieres verhindert werden kann. Dafür ist aber die PDF zu Archivierungszwecken gemacht worden - ich sichere den Inhalt und nicht die äußere Form.


    Der Cannon Scanner ist vor allem eins - sehr platzsparend. Für dicken Einband oder Einzelseiten nutze ich einen alten epson perfection 2850 photo

  • Ich habe ca viele der hier hinterlegten PDFs selber erstellt

    Du hast Dir sehr viel Arbeit gemacht, Respekt.
    Benutzerfreundlicher wäre es, wenn die einzelnen PDFs verlinkt wären. Auch die nimmersatte Datenkrake Google würde dann die Dateien indizieren. Ich glaube nicht, dass er das jetzt macht. So hätte das zur Folge, dass Deine Dokumente in Suchergebnissen angeboten würden. Auf einer eigenen Homepage könnte das sogar das PageRanking steigern. Google ist content-hungrig.

  • Gerade bei nur auf billigst-Papier gedruckten Sachen, die sich mit der Zeit sowieso selbsttätig vernichten, ist der physische Erhalt für Normalsterbliche kaum leistbar.
    Da muß man froh sein, wenn sich jemand die Arbeit macht, den Inhalt zu retten.

  • Gut, dann werde ich mal testweise mit 300dpi und 600dpi scannen.


    @fritzeflink Mit welchem der beiden Programme indexierst du die PDF-Dateien? Habe mir eben mal eine der Genie Anleitungen angesehen. Interessant, dass man es auswählen kann. Wenn dies auch bei Listings gut funktioniert, kann ich wieder mal das Regierungsspiel spielen was in dem Genie 1 Ordner beigefügt ist.

  • Gut, dann werde ich mal testweise mit 300dpi und 600dpi scannen.


    @fritzeflink Mit welchem der beiden Programme indexierst du die PDF-Dateien? Habe mir eben mal eine der Genie Anleitungen angesehen. Interessant, dass man es auswählen kann. Wenn dies auch bei Listings gut funktioniert, kann ich wieder mal das Regierungsspiel spielen was in dem Genie 1 Ordner beigefügt ist.



    Auswählen ?


    Ich scanne die Seiten mit dem Cannon Scanner und seinem capturontouch Programm als BMP (oder PNG), lese diese mit dem abbyy Finereader 12 ein (Finereader >12 hat eine unmögliche Bedienung da auf W10 angepaßt), versuche die Bildkomposition lesbarer zu machen, speichere das Projekt und dann die PDF entspechend der gewünschten Auflösung in Farbe, in s/w dann auch als OCRed. Wenn das Projekt fertig ist speichere ich die Bilder aus dem Abbyy als PNG nochmal ab.


    Die OCRd Datei lese ich mit dem Tracker PDF-Editor und erzeuge manuell das Index, ABBYY kann beim OCRen auch ein Index erzeugen, dieses ist aber für alte Druckwerke nicht sinnvoll.
    Der Tracker PDF-Editor kann den Inhalt des Index als Text-Datei speichern und auch einlesen, womit ich den Index einmal erstelle und die vorhandenen PDFs (s/w 300dpi, 400dpi, Graustufe) mit einem Index versehe.
    Aktuell ist der Abbyy Finereader als Version 14 zu kaufen, ich empfehle die Version 12, eine PRO muß es nicht sein. Allerdings mag ein frischer ABBYY Nutzer die FR14 Menueführung sympatisch finden, ich nutze ABBYY ja schon seit 2000.


    Unter WinXP hatte ich eine Acrobatpro 6x, manchmal schöner aber heute nicht mehr zeitgemäß .