Frage an die Daten-Forensiker im Forum

  • Hallo nicode  fanhistorie


    Die Frage, wie und womit die Images erstellt wurden, habe ich natürlich als erstes gestellt. Leider konnte mir meine Kollegin darauf keine Antwort geben.

    Ob die Datei auf den Images wirklich mit Word Perfect erstellt wurde, scheint ja auch zweifelhaft zu sein.


    Vielleicht schreibt man sich tatsächlich ein Programm, dass die noch lesbaren Daten aus dem IBM-Image liest und die Codes aus dem Cheat Sheet (gefunden von 6502 ) interpretiert.

  • Guten Morgen

    abrandt


    danke für die Rückinfo,

    was mir so um 1986-89 einfallen würde zur Images Erstellung wäre copyQM von Sydex ,


    Frage :

    hat eine der Image Dateien noch eine Dateierweiterung /bzw in welchem Format liegt diese vor

  • abrandt

    Sorry Falls ich nerve, aber da ich kein holländisch kann, möchte ich Anfragen, ob du oder jemand holländisch kann dies wenn auch nur stückhaft übersetzten kannst

    Steuerzeichen sind solange aktiv, bis diese wieder deaktiviert wurden




    WEISST DU NOCH ETWAS zu dem Inhalt, bzw wie sich der Inhalt sich darstellt, wie kann man z. b dies interpretieren

  • Die Image-Dateien hat mir meine Kollegin mit der (sinnlosen) Endung .txt geliefert. Mehr sinnvolle Informationen zum Image-Format lässt sich leider mehr beschaffen.

  • Wichtig: dafür die Datei aus cut.dd.zip benutzen. Die enthält alle Bytes inkl "Vorspann" vor dem eigentlichen Text.

    Mir scheint die Datei cut.dd zu kurz zu sein!


    Nach der Anzahl der belegten Blöcke sollte sie rund 98KB lang sein, ist hier aber nur rund 48KB.

    Im Image wird der Bereich von hex 5400 bis hex 1CFF0 belegt, was den 98KB entspricht.


    Das Verzeichnis sieht CP/M sehr ähnlich, ist aber für die Datenextraktion nicht wirklich relevant.

    Wäre höchstens für die Suche des zugehörigen Anwendungsprogrammes von Vorteil.

    Code
     Adresse   00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F    0123456789ABCDEF
    0000.2400  20 43 41 52 54 48 41 47 4F 30 30 31 03 20 20 80   │ CARTHAGO001.  .│
    0000.2410  03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 10 11 12   │................│
    0000.2420  20 43 41 52 54 48 41 47 4F 44 46 4C 20 20 20 02   │ CARTHAGODFL   .│
    0000.2430  02 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20   │.               │
    0000.2440  20 43 41 52 54 48 41 47 4F 30 30 31 05 20 20 77   │ CARTHAGO001.  w│
    0000.2450  13 14 15 16 17 18 19 1A 20 20 20 20 20 20 20 20   │........        │
    0000.2460  E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5   │................│
    0000.2470  E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5 E5   │................│
     Adresse   00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F    0123456789ABCDEF

    Nach CP/M-Notation ergibt sich für die Länge für CARTHAGO001 folgendes:


    Letzter Dateieintrag in Zeile 2440: 05 x 16KB + hex77 x 128 = 97152

    (05 gibt die Anzahl aller bisher belegten 16KB Blöcke an (inkl. der vorigen Extents).

    Die hex 77 geben die Anzahl der restlichen, belegten 128 Byte Records in diesem Extent an.)


    Die Image-Dateien hat mir meine Kollegin mit der (sinnlosen) Endung .txt geliefert. Mehr sinnvolle Informationen zum Image-Format lässt sich leider mehr beschaffen.

    Das scheint mir auch nicht nötig zu sein. (Ich beziehe mich hier immer auf das IBM-Image.)

    Das Image scheint auf den ersten Blick in Ordnung zu sein. Habe aber nicht alles durchgesehen.


    Zuerst gehört der Extrakt cut.dd entsprechend erweitert, damit eine komplette Datei vorliegt.

    Danach muss nach der passenden Anwendung gesucht werden, damit die Steuercodes richtig interpretiert werden können.



    PAW

  • Hallo fanhistorie


    leider kann ich auch kein holländisch.


    Bei dem Text soll es sich aber um Daten zu einer Ausgrabung in/bei Karthago handeln (https://de.wikipedia.org/wiki/Karthago). In den Tabellen sind z.B. Daten von Radiokohlenstoffdatierungen.

    (Mir ist es auch ein Rätsel, warum man nicht ein Ausdruck der Daten gibt)


    Zeigt aber wieder, dass man wichtige Daten regelmäßig in ein noch lesbares Format (z.B. PDF/A) überführen muss.


    Vielen Dank für die vielen Tipps.

  • Eventuell kann der Transformenator helfen.




    Mit freundlichen Grüßen


    fritz

  • Guten Morgen

    root42


    Da du doch öfters drüben bist, kannst du ggf bei der Übersetzung etwas helfen

  • Also ich bin Hollandischer Muttersprachler, ( na gut, Flämisch...), und mir fällt auf das bestimmte Buchstaben auf andere Zeichen abgebildet werden.

    Zb. ab mitte 1123


    "Gezien het karakter van de Carthaagse nederzetting - die zijn rijkdom verkreeg door handel, kon importmateriaal verwacht worden"

    Deepl meint, korrekt :

    „In Anbetracht des Charakters der karthagischen Siedlung, die ihren Reichtum durch Handel erlangte, konnte man mit Importmaterial rechnen“


    Der Buchstabe k wird auf ë abgebildet, den Buchstabe n auf î und noch einiges mehr. Klemmt(e) da irgenwo ein Bit ?

  • Haha! Ja, ich glaube mein Wissen reicht aus um dort einkaufen zu gehen, aber nicht mehr. :D Aber danke für's Vertrauen!

  • Die botanischen Namen sind allesamt Gehölze. Man hat Holz und Holzkohle gefunden und untersucht(datiert?).

    Paßt somit zu Archäologie.

    Das hilft natürlich nicht bei der Frage nach Textprogram oder Dateisystem :sunny:

    Viele Grüße,

    Knut

    :cat2:

  • Also in etwa so :

    ===============


    HOUT_EN_HOUTSKOOL_IN_CARTHAGO


    Inleiding


    Het hout en houtskool dat in Carthago gedurende diverse jaren is verzameld is gedurende de jaren 1977-1982 in het B.A.I. te Groningen onderzocht.

    De resultaten van dit onderzoek worden hier besproken.


    In Noord-Afrikee is nog weinig houtonderzoek vam archeologisch vindplaatsen verricht.

    Daarom is het onvermijdelijk dat de er determinatieproblemen waren.

    Gezien het karakter van de Carthaagse nederzetting - die zijn rijkdom verkreeg door handel, kon importmateriaal verwacht worden wat de problemen nog groter maakte.


    In dit verslag word een beschrijving gegeven van de gevonden hout- en houtskool soorten teneinde verder onderzoek te vergemakkelijken.

    ==========================================

    Deepl meint : ( man-o-man Deepl ist gut...)


    HOLZ_UND_KOHLE_IN_KARTHAGO


    Einleitung


    Das über mehrere Jahre in Karthago gesammelte Holz und die Holzkohle wurden in den Jahren 1977-1982 am B.A.I. in Groningen untersucht.

    Die Ergebnisse dieser Untersuchung werden hier besprochen.


    In Nordafrika wurden bisher nur wenige Holzuntersuchungen an archäologischen Stätten durchgeführt.

    Daher ist es unvermeidlich, dass es Bestimmungsprobleme gab.

    Angesichts des Charakters der karthagischen Siedlung, die ihren Reichtum durch Handel erwarb, war mit Importmaterial zu rechnen, was die Probleme noch vergrößerte.


    Der vorliegende Bericht enthält eine Beschreibung der gefundenen Holz- und Holzkohlearten, um weitere Untersuchungen zu erleichtern.

  • Letzter Dateieintrag in Zeile 2440: 05 x 16KB + hex77 x 128 = 97152

    (05 gibt die Anzahl aller bisher belegten 16KB Blöcke an (inkl. der vorigen Extents).

    Die hex 77 geben die Anzahl der restlichen, belegten 128 Byte Records in diesem Extent an.)

    Danke, passt auch zu den Daten. Anbei auf 128-Byte-Blöcke gekürzt.


    ps: ändert aber immer noch nichts daran, dass scheinbar Sektordaten in der 001 fehlen (0x009400 und 0x010400).

  • Wordstar benützt doch das bit 7 als Markierung der Wortenden. Von daher, zusammen mit den Dot Kommandos scheint das doch sehr sicher eine Wordstar Datei zu sein.


    Wenn man bit 7 wegfiltert, sollten die Texte lesbarer werden.


    Martin

    Wer hat sich das ausgedacht? :fp:

  • Wenn man sich die ersten vier Byte der DFL ansieht, dann könnte man das als 'E2.4' oder '4.2E' lesen (je nach Bytereihenfolge).

    Vielleicht war es auch 'WordStar for PCjr' (eigentlich ein NewWord 2.x, aber konnte der PCjr überhaupt 720KB-Disketten?).

    "Wenn Ihr Amiga mit einem 68020 oder einem 68030 ausgestattet ist, müssen Sie auf 68000 zurückgehen, um spielen zu können." -- Unreal-Handbuch

  • Von daher, zusammen mit den Dot Kommandos scheint das doch sehr sicher eine Wordstar Datei zu sein.


    Ja - dann bräucht man halt nur jemanden, der das zufällig installiert hat. Sollte sich doch hier eigentlich finden lassen. CP/M Fraktion ...

    Oder jemand mit einem installierten DOS Rechner. Wordstar sollte sich doch finden lassen. Wird man dann ja sehen, ob es da was lesen kann.


    Wegen den Dot Kommandos: irgendwie gibt es auch seltsame Endemarkierungen für die Wörter. Aber anscheinend nicht für alle. Es gibt aber sehr oft hinter einem Wort und vor dem nachfolgenden Space ($20) ein $E5 oder $EE oder sowas.

    Das scheint mir auch was typisches für das Textprogamm zu sein. Würde man üblicherweise nicht so oft erwarten.

    Vielleicht "triggert" das ja bei jemandem was in der Erinnerung.



    Mir scheint die Datei cut.dd zu kurz zu sein!


    Nach der Anzahl der belegten Blöcke sollte sie rund 98KB lang sein, ist hier aber nur rund 48KB.


    Mag sein. Ich habe allerdings auch die AtariST Variante verwendet. Möglicherweise ist die unterschiedlich. Oder (Erklärung2) mit 256Bytes per Sektor würde es Pi*Daumen auch wieder hinkommen.


    Ich habe nur davor alles was nach Leer und Catalog aussah weggeschnitten und dahinter alles was nicht mehr wie Text aussah (sondern fast uniform $E5 war). In der Hoffnung, daß man das so direkt in die Textverarbeitung importieren kann - was aber nicht geklappt hat. Was mich wiederum - wenns wirklich WordStar ist - nicht wundern würde.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Von daher, zusammen mit den Dot Kommandos scheint das doch sehr sicher eine Wordstar Datei zu sein.

    Ja - dann bräucht man halt nur jemanden, der das zufällig installiert hat. Sollte sich doch hier eigentlich finden lassen. CP/M Fraktion ...

    Oder jemand mit einem installierten DOS Rechner. Wordstar sollte sich doch finden lassen. Wird man dann ja sehen, ob es da was lesen kann.

    Also Wordstar 4.0 unter (Run)CP/M mag die cut.dd nicht - oder sollte ich eine andere testen? ;)


  • Also Wordstar 4.0 unter (Run)CP/M mag die cut.dd nicht - oder sollte ich eine andere testen? ;)


    Ja, kannst ja mal noch die andere probieren. Die aus dem Link hier direkt drüber.


    Bei mir sieht die aber in WS 5.5 nicht anders aus.

    Irgendwie paßt da entweder was vom Format her nicht, oder nur der Anfang der Datei ist noch um zwei / drei Byte verschoben.


    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Mag sein. Ich habe allerdings auch die AtariST Variante verwendet. Möglicherweise ist die unterschiedlich. Oder (Erklärung2) mit 256Bytes per Sektor würde es Pi*Daumen auch wieder hinkommen.

    Ich habe mal die beiden Images, den Bereich der Datei CARTHAGO001, miteinnander manuell verglichen. Da zeigt sich, dass der erste Leerblock (ein Sektor mit lauter Blanks) in beiden Images vorkommt. Der Sektor davor ist in beiden noch gleich, danach geht es aber unterschiedlich weiter. Es sieht so aus, dass beim Atari-image viel mehr Sektoren fehlen. Sieht man auch daran, dass der Datenbereich beim Atari wesentlich kürzer ist.


    Damit fällt auch die Möglichkeit, die fehlenden Sektoren im IBM-Image, durch die vom Atari-Image zu ersetzen, aus.


    PAW

  • Bei mir sieht die aber in WS 5.5 nicht anders aus.

    Ich war jetzt mal ganz mutig und hatte "Wordstar for Windows 2.0" unter Win7 32Bit installiert

    (6 Disketten-Images auspacken und alle Dateien in ein Vezeichnis "schmeissen" zur Installation)


    Aber auch hier meinte "Wordstar for Windows 2.0" dies sei keine Datei, die mit ihm erstellt wurde.


    Testweise lies ich es als Wordstar 7.0 importieren, bekam aber auch nichts sinnvolles :(

  • Es gibt in der 001 noch ein Pattern, welches möglicherweise auf eine Strukturierung hindeutet...


    Block beginnt mit "H            R  ",xx,xx, außer der letzte Block "H*end*       ",...


    ps: Vor dem nächsten Header enden die Datenblöcke immer mit 1A,FF,20


    Ich habe die Blöcke mal aufgetrennt (anbei).