Frage an die Daten-Forensiker im Forum

  • Eine höllandische Kollegin möchte an eine Datei ihrer Schwester, die in den 80er oder 90er Jahren auf einer 5.25" Diskette gespeichert wurde. Die Diskette war leider auf meinem Pentium 4 nicht mehr lesbar. Die Oberfläche der Diskette sah schon sehr abgeschliffen aus.


    Von dieser Datei wurden aber vor etlichen Jahren zur Datensicherung zwei Image-Dateien erstellt. Diese Images kann ich leider auch nicht mounten. Man findet aber die Texte, angeblich eine Wordperfect-Datei, in diesen Image-Dateien.


    Hat jemand eine Idee, wie man an die Orginal-Datei kommen könnte?


    Datei Carthago_Raw_data_Atarist.txt.zip 360kb:

    Ihr persönlicher Freigabelink | WEB.DE Online-Speicher
    Mit diesem Link erhalten Sie Zugriff auf die mit Ihnen geteilten Daten.
    c.web.de


    Datei Carthago_Raw_data_IBM.txt.zip 720kb:

    Ihr persönlicher Freigabelink | WEB.DE Online-Speicher
    Mit diesem Link erhalten Sie Zugriff auf die mit Ihnen geteilten Daten.
    c.web.de

  • Reicht es nicht mit einem Editor sich den Text wieder aus dem Backupfile zu holen ?

    Nach einem kurzen Blick in die beiden 'Images' gilt es wohl erst zu klären, ob die 'Sicherungen' überhaupt verifiziert wurden. In der Atarist-Version fehlt zum Beispiel mindestens in Sektor (mit Leerzeichen gefüllt), der in der IBM-Version vorhanden ist (aber auch dort fehlen die Inhalten von einigen Sektoren).


    Mounten wird schwierig, da es kein richtiges Dateisystem gibt. Nur so etwas ähnliches wie FAT-Einträge in Setor 9, die aber nicht zu FAT12 passen...

            move.w  #%0010011100000000,sr

  • Die Daten sind schon ziemlich kaputt. Es gibt keinerlei Strukturen mehr (da hilft dann auch kein Fotorescue).


    Es ist nicht einmal sicher, das beide Dateien den gleichen Stand hatten oder wieviel Fehler beim Image lesen noch passiert sind. Ganze Sektoren fehlen jedenfalls in beiden Versionen (s.o.)

    Wenn man das sektorweise (bzw. cluster-) betrachtet, fallen schon Unterschiede auf die nicht zusammenpassen. Das kann natürlich auch daran liegen, dass das abgespeicherte Ergebnis (marginal) unterschiedlich zw. ST und IBM war.

    So kann man jetzt nur versuchen die Gesamtdatei sektorweise zu rekonstruieren. Da würde ein Ausdruck (o.ä.) des Textes auf jeden Fall helfen.

    Die IBM-Fassung hat etwa 1.5x soviel Daten wie die ST Version =O

  • LS-120, sofern irgendwie zugänglich, hat mir oft gute Dienste erwiesen beim Erstellen von Images unlesbarer Disketten.

    Zuletzt wiederbelebt:

    - ATARI PC1: 8088@8MHz (RAM Chips defekt)

    - Mainboard Shuttle HOT-327 386/387 (FPU Takt fehlte)

    - Mainboard ECS 3000FX 386/486 (abgerissener Chipsatz, Fehlteile ersetzt)

  • Bei dem Text geht es um Ausgrabungen in Carthago (Für die Lateiner unter Euch: Ceterum censeo Carthaginem esse delendam). Insbesondere ein paar Tabellen aus der Datei sind für die Schwester meiner Kollegin wichtig.


    Ich habe versucht die Images mit Debian-Linux zu mounten. Hat aber nicht geklappt.


    Wie kann man eine 5.25" Diskette reinigen?


    In ein LS-120 Laufwerk passen keine 5.25" Diskette, oder?


    Kennt jemand ein Programm, dass Wordperfect-Dateien schreiben und lesen kann? Vielleicht kann ich so die Tabellen in eine Datei kopieren.

  • Gegenüber der Leseseite aufschneiden und die Scheibe rausnehmen. Orientierung nicht vergessen!

    Auf eine saubere Fläche auflegen und mit Glasreiniger sauber machen. Dann die andere Seite auf eine neue saubere Fläche auflegen und die auch sauber machen. Falls die Hülle nicht dreckig ist dann wieder da rein, ansonsten eine saubere Diskettenhülle dafür nehmen.

  • Fuer die ATARI 368K Version (368.640 Bytes) kommt normal nur das

    QD-Format in Betracht:

    ...aber damit geben die cpmtools auch nichts gescheites raus :(

  • Die Diskette war leider auf meinem Pentium 4 nicht mehr lesbar. Die Oberfläche der Diskette sah schon sehr abgeschliffen aus.

    Wie kann man eine 5.25" Diskette reinigen?

    Das Reinigen des Kopfes ist auf jeden Fall empfehlenswert!


    Vor einer Reinigung der Diskette würde ich noch überprüfen, ob sich nicht die Magnetschicht schon beim Lesen ablöst/abgelöst hat. In diesem Fall könnte eine Reinigung der Diskette zu einem völligen Datenverlust führen. Was in einem solchen Fall zu tun ist, wird im Netz (z.B. bei Tonbändern, etc.) beschrieben.


    Da beim Lesen mit einem Floppycontroller bei fehlerhaften Sektoren möglicherweise abgebrochen, aber jedenfalls mehrmals wiederholt wird, wäre es sinnvoll die Diskette mittels Kryoflux, Fluxcopy oder anderen fluxbasierten Technologien zu archivieren. Dies würde auf jeden Fall die Diskettenoberfläche schonen.


    PAW

  • Nur noch mal zum Verständnis für mich: Die verlinkten/angehängten Dateien sind die Diskimages?

    Ich habe mal versucht das Carthago_Raw_IBM mit ImDisk zu mounten, was aber wegen "kein Filesystem" fehlschlug.

    :grübel:

    Viele Grüße,

    Knut

    :cat2:

  • Nur noch mal zum Verständnis für mich: Die verlinkten/angehängten Dateien sind die Diskimages?

    Ich habe mal versucht das Carthago_Raw_IBM mit ImDisk zu mounten, was aber wegen "kein Filesystem" fehlschlug.

    :grübel:

    So wurde es mir von meiner Kollegin erklärt. Die Dateigrößen würden aus meiner Sicht auch zu Disketten passen.


    Nur die ersten Bytes sind irgendwie Schrott (Hex):

    E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 usw.

  • Hier mal ein Einblick, was so drinsteht.


    Im Textfenster ist es nicht vollständig, weil 10000 Zeichen Begrenzung; daher .txt nehmen.


    Das Ganze scheint wirklich ein Textverarbeitungsformat zu sein, sind auf alle Fälle jede Menge Steuerzeichen drin. Vielleicht läßt sich die .txt ja irgendwo durch einen WordPerfect Konverter schieben. (Wenns denn wirklich WP ist. Vielleicht war es ja auch ein Schneider Joyce o.ä.)



  • Nur die ersten Bytes sind irgendwie Schrott (Hex):

    E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 usw.


    Da ist anscheinend ein Inhaltsverzeichnis davor. Der eigentliche Text beginnt bei $3000. Nach dem Text kommen dann wieder E5. Ist also so eine Art "Leer"-Markierung der Disk.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Nur die ersten Bytes sind irgendwie Schrott.

    Nicht nur die.


    Bauchgefühl:

    0xE5 = Formatierungspattern

    0x20 = (wenn ganzer Sektor, 512 Bytes) nicht lesbarer Sektor im Image


    Ansonsten:

    1 = 0x20, 8+3 = Name, 4 = ?, 16 = Indizes


    Habe ich so noch nicht gesehen, aber ich kenne mich mit alten Dateisystemen nicht gut aus (außer Amiga halt).


    ps: DFL waren glaube ich so eine Art Wörterbuchlisten, die Datei ist auf jeden Fall kleiner als die 001

            move.w  #%0010011100000000,sr

  • Das macht möglicherweise Sinn, wenn jeder Eintrag in der Dateiliste nur max. 16 Sektoren ansagen darf. Dann wäre der Eintrag zu lesen als


    Name - Bemerkung - Sektorennummern


    und die Datei "CARTHAGO001" belegt dann "03 04 05 06 ... 0F 10 11 12"

    und wird bei "CARTHAGO001. w" in "13 14 15 ... 18 19 1A"


    fortgesetzt.


    "CARTHAGODFL" belegt dann "Sektor" "02".


    (wird wohl irgend so ein old-school FAT sein; FAT12 oder eher)



    Wenn das so stimmt, kann man sich zumindest das Umsortieren nach Sektoren sparen, weil alles schön hintereinander liegt.

    Die Steuerzeichen muß aber trotzdem noch jemand wiedererkennen oder mal durchprobieren, wo man damit einen brauchbaren Text erhält.


    Wichtig: dafür die Datei aus cut.dd.zip benutzen. Die enthält alle Bytes inkl "Vorspann" vor dem eigentlichen Text.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Die CARTHAGO.DFL belegt nur einen Sektor und liegt bei 0x4400 (also 512 * 34, und 34 = 32 + 02 ; bleiben also nicht viele Möglichkeiten für C/H/S):

    - die Sektorgröße scheint also 512 Bytes zu sein

    - die ersten 16 Bytes sind Sektor-Daten (Header)

    - da die Dateidaten nicht immer den gesamten letzten Sektor belegen, müsste irgendwo die genutzte Größe stehen (der Rest ist ein Speicherauszug/Zufall/Müll)


    Da die CARTHAGO.001 fortlaufende Sektoren belegt, sollte man 'nur' jeweils den Sektor-Header entfernen müssen...

    ...beibt das Problem der 'leeren' Sektoren (die in einem Image vorhanden sind und im anderen fehlen)

            move.w  #%0010011100000000,sr

  • Nachträge:

    - DFL und 001 liegen per Index um 1 auseinander und um 8 * 512 Byte

    - die 16 Bytes Header sind vielleicht keine 'Sektor-Header' (macht von den Daten her keinen Sinn)

    - Offset = Index * 8 * 512 + 9216 Bytes (passt auch mit dem Ende der Datei, 9216 = 2 * 512 + 2 * 8 * 512)

    - an Index 0 ist die FAT (9216 = 0x2400)


    ps: ich gehe im Moment immer von der IBM-Variante aus

            move.w  #%0010011100000000,sr

    Edited once, last by nicode ().

  • [...], die in den 80er oder 90er Jahren auf einer 5.25" Diskette gespeichert wurde.


    Von dieser Datei wurden aber vor etlichen Jahren zur Datensicherung zwei Image-Dateien erstellt.

    1) Auf welchem System wurden die Disketten denn gespeichert?

    2) Mit welchem System und welcher Software wurden die Images erstellt?


    Mich beschleicht das Gefühl, dass die Diskette mit einer falschen Geometrie gesichert wurde. Ich würde mich an deiner Stelle auf die Originaldiskette konzentrieren (und bei Bedarf physikalisch nicht mehr lesbare Sektoren aus dem Image heraus zu suchen und einzufügen). Und da du nur ein Original hast, darüber nachzudenken, es jemanden machen zu lassen, der das nicht zum ersten Mal macht :)

            move.w  #%0010011100000000,sr

  • Ich habe WordStar nur als Text-Editor in Erinnerung. Konnte man damit Tabellen etc anlegen?

    Nur "per Hand" ... für Tabellen gab es CalcStar, Multiplan, SuperCalc und Visicalc ... in dem "IBM-Image" befindet sich ab Offset 0x5413:

    Code
    .LH 10
    .MB 3
    
    ^SCARTHAGO,_alle_houtdeterminaties^S

    bedeutet in WordStar:

    .LH = Sets the line height in 48ths of an inch

    .MB = Sets the bottom margin, in lines

    ^S  = Underline ON/OFF toggle


    ... auch andere WordStar-Steuercodes, wie ^X = Strikeout ON/OFF toggle und ^D = Double strike printing ON/OFF toggle, tauchen da sehr häufig auf ...

  • Guten Morgen

    abrandt


    Hast du noch weitere Info "wie, mit welchem Programm, mit welcher Hardware die beiden Image erstellt wurden,


    was war das Grundsystem, mit welchem die 5,25 Diskette, und auch wann erstellt wurde,


    gibt es noch Info welche" Word Perfect " Version benutzt verwendet wurde,