Power Macintosh (PCI) Cache Auswirkungen

  • Ich habe heute mal ein wenig getestet, was der Cache so an Performance bringt:


    Macbench 5.0: 7500 200MP CPU


    CPUFPU
    0K100%100%
    256K115%105%
    1024K143%107%


    Die Ergebnisse aus Speedometer 4.0.2 unterscheiden sich mit weniger als 2%, daher ohne Aussage.

    Bei 3D-Tests in Ravebench 1.1.2 gab es auch keine erkennbaren Unterschiede.


    Bei Ravebench wird wohl der Zugriff auf den Framebuffer den Cache umgehen.

    Bei Speedometer laufen die CPU Tests möglicherweise im L1 Cache ab.


    Ob der Cache also tatsächlich 43% in Anwendungen ausmachen würde ist daher fraglich.


    Das Apple Network Server 1Mb Cache Modul ist leider für den 7500 etwas zu hoch, so dass sich das Gehäuse nicht schließen lässt.

    In einen 8600 könnte es jedoch passen (leider fehlt mir aktuell ein funktionstüchtiges 8600 MB)


    -Jonas

  • Wenn ich irgendwann mal einen 1MB L2 Cache für den 610066 bekomme kann ich das gerne mal testen,

    ich suche schon lange nach so einem l2-Cache, da ist aber einfach nicht ran zu kommen.

  • Bei Speedometer laufen die CPU Tests möglicherweise im L1 Cache ab.

    So ist es. Selbst wenn man 68k-Kisten mit weitaus kleineren externen Caches testet macht das in Speedometer meist so gut wie keinen Unterschied.

    MacBench ist da wie du auch rausgefunden hast die bessere Wahl.

  • Wenn ich irgendwann mal einen 1MB L2 Cache für den 610066 bekomme kann ich das gerne mal testen,

    ich suche schon lange nach so einem l2-Cache, da ist aber einfach nicht ran zu kommen.

    Der 601 soll ja massiv von einem großen L2 profitieren, mehr noch als der 604.

    Wenn ich ein lauffähiges 7200 MB hätte, könnte ich das auch mal testen ...


    In internet gibt es noch eine Seite mit ein paar Benchmarks zu L2 und PPC

    macinfo.de


    -Jonas

  • Meine 601/100 Karte für den 7500 ist wohl defekt. Es kommt keine Regung, wenn die eingebaut ist.

    Ich werde mich mal umschauen, ob ich noch eine andere 601-Karte finde.


    Ich habe noch ein wenig mit dem 200MP-Karte getestet und folgendes festgestellt:

    Eine Phase5 200MHz 604e Karte mit 1Mb Cache is 31% schneller beim Macbench 3 CPU-Benchmark als die 200MP-Karte.

    Bei Quake (Nekropolis/640x480) erreicht die Phase5 Karte 13,5fps während die 200MP-Karte nur 12,2fps erreicht.

    Das sind ca. 10% höhere Leistung in Quake für Phase5 ... warum?


    Beide Karten haben 50MHz Bustakt und 200MHz 604e CPUs.

    Von der Phase5-Karte habe ich auch eine scheinbar baugleiche (leider instabile) 250MHz Variante, die ich aber in dem System wegen Abstürzen nicht testen konnte.


    Die Phase5 200MHz Karte schein massiv von dem 1Mb Cache zu profitieren und erreicht einen ca. 60% höheren CPU-Wert bei Macbench 3.0 gegenüber 0K Cache. Bei Quake scheint der Cache keine Rolle zu spielen, da mit oder ohne Cache 13,5fps erreicht werden.


    -Jonas

  • evtl. schnelleres Cache RAM verbaut ?

    Der cache is auf dem Mainboard. Auf der CPU-Karte ist nur die CPU und ein wenig GLUE.


    Unabhängig davon habe ich mal angefangen ein paar real-world Beispiele rechnen zu lassen.

    Dazu nutze ich Cinema 4D XL (v5.0.1) und rendere dann die "two dolphins" Sequenz (95 Bilder als DV-Video NTSC 640x480).


    Der Mac Mini 1.25GHz (512K L2, 64K L1) brauchte 511s

    Der dual 604e 200MHz (1M L2, 64K L1) brauchte 1782s


    Der 1250MHz Mac Mini ist somit 3,49 mal schneller als der 200MHz dual 604e. Rein rechnerisch ergibt das 358MHz relativen Takt (90% von 2x200MHz), verglichen mit dem G4. Ich finde das schon recht gut wenn man bedenkt, dass Cinema 4D auch die AltiVec Einheit nutzen konnte.


    Ich mache noch einen Test ohne L2 beim dual 604e.


    Update:

    Ohne L2 cache: 2318s vs. 1782s mit 1Mb L2 cache beim dual 200MHz 604e.

    Das sind ziemlich genau 30% mehr Leistung... cool.



    -Jonas

  • Na ja, man sieht daran schön, wie schwierig (bis sinffrei) das manchmal mit den Benchmarks ist.


    Den Mac Mini müßtest Du ja wenigstens mit gleichem L2 Cache antreten lassen. Oder so, daß die 512K niemals vollaufen.


    Trotzdem sind solche Vergleiche natürlich schon schön, auch wenn sie wie hier nur zeigen, daß die Entwicklung eben dann doch nicht so schnell ist, wie man es gemeinhin annimmt.



    (apropos und leicht abseits vom Thema habe ich vorhin in einem C64 Buch gefunden, daß der im KERNAL eine Polynomberechnungsroutine mitbringt. Sowas ist prinzipiell auch ein schöner Test. Wenn die Länge des Polynoms ausreichend groß ist, kommen da jede Menge Multiplikationen zusammen und immer schön gemischt mit Additionen. Und natürlich auch Schleifen, weil man ja im Sekundenbereich eine Ansage haben will. ; Gerade bei 3D oder Grafiktests weiß man eigentlich nie, was da verglichen wird. Das stimmt schon zwischen den einzelnen Engines nicht mehr wirklich, insbesondere, wenn die auf irgendwas optimiert sind (Texturenkompression oder vereinfachte Genauigkeit beim Translatieren/Rotieren).)

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • wenn man bedenkt, dass Cinema 4D auch die AltiVec Einheit nutzen konnte


    Wird sie den im Test benutzt ?


    Und: ich hätte ja gedacht, daß die in den Folgemodellen immer noch vorhanden ist. Sowas wirft man doch nicht wieder raus. Habe da aber keine Ahnung, wie das beim Mac Mini aussieht. Die Werbungen dafür (AltiVec) sind/waren auf jeden Fall ganz großes Kino ! ;)

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • wenn man bedenkt, dass Cinema 4D auch die AltiVec Einheit nutzen konnte


    Wird sie den im Test benutzt ?


    Und: ich hätte ja gedacht, daß die in den Folgemodellen immer noch vorhanden ist. Sowas wirft man doch nicht wieder raus. Habe da aber keine Ahnung, wie das beim Mac Mini aussieht. Die Werbungen dafür (AltiVec) sind/waren auf jeden Fall ganz großes Kino ! ;)

    Ich habe mal nachgesehen und festgestellt:

    Cinema 4D XL v5 kam 1997 auf den Markt. Da gab es noch keine G3 oder G4 :fp:

    Ich könnte ja mal versuchen eine spätere Version zu verwenden ... mal schauen.


    -Jonas

  • Hier mal Cinebench 2000 (1.0) benchmarks:


    ComputerShading (CB)Rendering (CB) Single CPURendering (CB) Multi-CPUMP-Factor
    Mac Mini 1250MHz (L2:512K@1250MHz)9,9014,94
    604e 2x 200MHz (L2:1Mb@50MHz)1,781,462,351,61
    604e 2x 200MHz (no L2)1,701,071,521,42


    Kein Cache vs. 1Mb Cache:

    36% mehr Leistung im single CPU Betrieb

    54% mehr Leistung im dual CPU Betrieb


    Der G4 ist erheblich schneller im Vergleich zu der älteren V5 Version von Cinema 4D XL. AltiVec scheint tatsächlich eine große Auswirkung zu haben. der Leistungsunterschied zwischen dem Dual 604e@200MHz liegt jetzt bei 1 : 6,3 in CB2000 (V6) gegenüber 1 : 3,5 in V5. AltiVec kann also in bestimmten Situationen durchaus den gleichen Leistungszuwachs wie eine 2. CPU bringen.


    Der große L2 Cache scheint sehr große Auswirkungen auf die Dual-CPU Leistung zu haben. Ich schätze, dass das Vorhalten von Daten für zwei CPUs bei einem große Cache effizienter ist.


    -Jonas