TommyGun Routinen

Octoate · 14. Juni 2007

Hi all,
da ich mal ein wenig mit TommyGun (<a class="postlink" href="http://www.users.on.net/~tonyt73/TommyGun/">http://www.users.on.net/~tonyt73/TommyGun/</a>) beschaeftigt habe und das Tool nicht schlecht finde, hab ich mal versucht Sprites aus dem Programm heraus darzustellen. Da es bisher keine Beispielroutinen gibt sind dabei folgende zwei kleinen Routinen zur Spritedarstellung herausgekommen.
Die beiden Routinen habe ich "in a hurry" geschrieben, man kann also sicherlich noch Geschwindigkeit rausholen. Jegliche Vorschlaege werden gerne angenommen.

Die Routinen habe ich bisher nur in Mode 0 benutzt. Die anderen Modes habe ich damit nicht getestet.

Vielleicht hat ja noch jemand Lust, TommyGun ein wenig zu testen und baut z.B. die Map-Routinen, denn die gibts bisher auch nicht. Was meint ihr?

Code

;*************************************
; SPRITE ROUTINE WITHOUT TRANSPARENCY
;
; DE = source address of the sprite
; HL = destination address
; B  = width
; C  = height
;*************************************
writesprite:
        ex de, hl
        ld a, (hl)          ;width
        ld (schl1+1), a    ;self modification -> schl1->b

        ;calculate width for sprite
        dec a
        neg
        add a, &FF
        ld (width1+1), a

        inc hl
        ld c, (hl)          ;height
        inc hl
        ex de, hl

schl1:  ld b, 0
schl2:  ld a, (de)
        ld (hl), a
        inc de
        inc hl
        djnz schl2
        ld a, l
width1: add a, &FB
        ld l, a
        ld a, h
        adc a, 7
        ld h, a
        jr nc, schl3
        ld a, l
        add a, &50
        ld l, a
        ld a, h
        adc a, &C0
        ld h, a
schl3:  dec c
        jp nz, schl1
        ret

Alles anzeigen

Code

;*************************************
; SPRITE ROUTINE WITH TRANSPARENCY
;
; DE = source address of the sprite
; HL = destination address
; B  = width
; C  = height
;*************************************
writetransparency:
        ex de, hl
        ld a, (hl)          ;width
        ld (again2+1), a    ;self modification -> again2->b

        ;calculate width for sprite
        dec a
        neg
        add a, &FF
        ld (width+1), a

        inc hl
        ld c, (hl)          ;height
        inc hl
        ex de, hl

again2: ld b, 0
again1: push bc
        ld a, (de)
        and &aa
        jp nz, com1
        ld a, (hl)
        and &aa
com1:   ld c, a
        ld a, (de)
        and &55
        jp nz, com2
        ld a, (hl)
        and &55
com2:   or c
        ld (hl), a
        inc de
        inc hl
        pop bc
        djnz again1
        ld a, l
width:  add a, &F4
        ld l, a
        ld a, h
        adc a, 7
        ld h, a
        jp nc, again3
        ld a, l
        add a, &50
        ld l, a
        ld a, h
        adc a, &C0
        ld h, a
again3: dec c
        jp nz, again2
        ret

Alles anzeigen

Prodatron · 14. Juni 2007

Hi,

hier, die arbeitet etwas zügiger:

Code

;*************************************
; SPRITE ROUTINE WITHOUT TRANSPARENCY
;
; DE = source address of the sprite
;      (includes header with 1B width [64byte maximum!], 1B height)
; HL = destination address
;*************************************
writesprite:
        ex de,hl
        ld a,64
        sub (hl)
        add a
        ld (width1+1),a
        xor a
        sub (hl)
        ld (width2+1),a
        inc hl
        ld a,(hl)
        inc hl
        ex de,hl
width1: jr width1
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi:ldi
        ldi:ldi:ldi:ldi
width2: ld bc,#700
        add hl,bc
        jr nc,width3
        ld bc,#c050
        add hl,bc
width3: dec a
        jp nz,width1
        ret

Alles anzeigen

CU,
Prodatron

Prodatron · 14. Juni 2007

Übrigens:

Code

dec a
        neg
        add a, &FF

-> schneller ->

Code

dec a
        neg
        dec a

-> noch schneller ->

Code

dec a
        cpl

CU,
Prodatron

Octoate · 14. Juni 2007

Oha, jetzt holste aber jede Kleinigkeit noch raus :D. Ich glaub ich muss mehr in selbstmodifizierenden Code denken. Hab ich frueher nie benutzt und ist irgendwie ein wenig ungewohnt ;). Solange man kein ROM schreibt...
Muss demnaechst mal die Maps anschauen, vielleicht kann man da dann auch ne schnelle Routine basteln und dem Autor dann als Beispiel zukommen lassen.

Prodatron · 14. Juni 2007

Zitat von "Octoate"

Oha, jetzt holste aber jede Kleinigkeit noch raus :D. Ich glaub ich muss mehr in selbstmodifizierenden Code denken. Hab ich frueher nie benutzt und ist irgendwie ein wenig ungewohnt ;). Solange man kein ROM schreibt...
Muss demnaechst mal die Maps anschauen, vielleicht kann man da dann auch ne schnelle Routine basteln und dem Autor dann als Beispiel zukommen lassen.

Also meine Routine braucht in der "inner loop" 5 ms pro byte, während die ursprüngliche 12 braucht, also mehr als doppelt so lang. Gerade bei so aufgelösten Schleifen ist selbstmodifizierter Code super, da man dann trotz fehlendem Zähler eine dynamische Ausführungswiederholung hat. Das findet sich in den Lowlevel-Screen-Routinen von SymbOS des öfteren.
Die anderen Einsatzgebiete von selbstmodifiziertem Code (Variablen direkt in den Code schreiben, Jump-Ziele patchen, Befehle austauschen [z.B. Flag setzen oder löschen]) hat zwar auch Geschwindigkeitsvorteile, die sind aber oft nicht so extrem.

CU,
Prodatron

super_castle · 14. Juni 2007

hallo, arbeitet die x-richtung byteweise oder pixelweise?
mfg

Prodatron · 14. Juni 2007

Zitat von "super_castle"

hallo, arbeitet die x-richtung byteweise oder pixelweise?
mfg

Die arbeitet byteweise. Für Mode 0 würde ich eh niemals pixelweise Routinen schreiben, da das geschwindigkeitsmäßig große Abstriche bedeutet und man ja jedes Sprite eh "nur" 2x ablegen muß, wenn man es pixelweise positionieren will.

super_castle · 15. Juni 2007

das heisst ein softscrolling bekommt man nicht hin?
es ist also in x-richtung eine blockverschiebung?

der mauszeiger in symbos geht aber pixelweise, könntest du die routine mal hier reinstellen?

mfg

Prodatron · 15. Juni 2007

Zitat von "super_castle"

das heisst ein softscrolling bekommt man nicht hin?
es ist also in x-richtung eine blockverschiebung?

Du legst das Sprite ja 2x ab, die zweite Kopie ist um ein Pixel verschoben. Du hast dann ein "Softscrolling":
- plotte an scradr+0 spritekopie 1
- plotte an scradr+0 spritekopie 2
- plotte an scradr+1 spritekopie 1
- plotte an scradr+1 spritekopie 2
- plotte an scradr+2 spritekopie 1
usw...

Zitat

der mauszeiger in symbos geht aber pixelweise, könntest du die routine mal hier reinstellen?

Für den lege ich je nach Screenmode ebenfalls mehrere Kopien an, in Mode2 sind es 8 pixelverschobene Kopien, in Mode1 sinds 4 und in Mode0 (fliegt allerdings bald raus) sind 2.

Hier der innere Teil der Routine, die den Mauszeiger plottet:

Code

;B=sichtbare breite in bytes, C=höhe, DE=scradr, HL=And-Maske des Sprites, IX=Or-Maske des Sprites,
;(mspout2+1)=<Maskenbreite in Bytes> - <sichtbare Spritebreite in bytes>,
;(mspout5+1)=256 - <sichtbare Spritebreite in bytes>


mspout3 push bc         ;4
mspout4 ld a,(de)       ;2
        and (hl)        ;2
        or (ix+0)       ;5
        ld (de),a       ;2
        inc hl          ;2
        inc ix          ;3
        inc de          ;2
        djnz mspout4    ;4/3
mspout2 ld bc,0         ;3
        add hl,bc       ;3
        add ix,bc       ;4
        ex de,hl        ;1
mspout5 ld bc,#700      ;3
        add hl,bc       ;3
        jr nc,mspout6   ;3/2
        ld bc,#c050     ;3
        add hl,bc       ;3
mspout6 ex de,hl        ;1
        pop bc          ;3
        dec c           ;1
        jr nz,mspout3   ;3/2

Alles anzeigen

Da die Routine clipping-fähig ist, sind die drei Zeilen ab mspout2 notwendig, ansonsten kann man die weglassen, wenn die Maskenbreite immer gleich der sichtbaren Breite ist.

Prodatron · 15. Juni 2007

Nach was zu den Transparentfähigen Routinen:
Wie man sieht, benötigt Octos Innerloop 37 Microsekunden, die SymbOS-Mauszeiger-Innerloop nur 22 Microsekunden, wobei diese durch die zusätzliche And-Maske sogar flexibler ist, was die transparenten Pixel betrifft. Eigentlich kann man meinen, daß man für Mode 0 keine And-Maske benötigt, da es bei 16 Farben kein Problem ist, eine (also die 0) davon fest für Transparenz zu reservieren. Aber es ist Geschwindigkeitsmäßig halt ein großer Vorteil.

Auch so richtig viele Gedanken über transparentfähige Spriteroutinen hat sich Richard Wilson, der WinApe Author, hier gemacht:
<a class="postlink" href="http://www.cpcwiki.com/index.php/Programming:Fast_Sprites">http://www.cpcwiki.com/index.php/Progra ... st_Sprites</a>

Cool ist die Idee, die And/Or-Maske zusammenzuklatschen, man braucht dann kein IX mehr und man spart weitere 4 Microsekunden pro Byte (knapp 20%). Wenn ich mal dazu komme, stell ich die SymbOS-Mauszeigerroutine auch darauf um.

CU,
Prodatron

super_castle · 15. Juni 2007

jub, danke.

mfg

super_castle · 15. Juni 2007

Zitat

Du legst das Sprite ja 2x ab, die zweite Kopie ist um ein Pixel verschoben. Du hast dann ein "Softscrolling":

mus es nicht 8x abgelegt werden für eine byteverschiebung in pixel?

mfg

Prodatron · 15. Juni 2007

Wie gesagt:
- in Mode2 sind es 8 pixelverschobene Kopien
- in Mode1 sinds 4
- und in Mode0 sind 2

Und weil Octo wohl in Mode0 arbeiten will, braucht er nur 2 Kopien.

CU,
Prodatron

Octoate · 15. Juni 2007

Jupp, wobei pixelweise wohl nicht unbedingt notwendig ist. Aber ich spiele ja im Moment nur damit ein wenig rum, mal schauen, obs mal mehr werden koennte oder nicht.