diff options
author | Daniel Garcia <danielgarcia@gmail.com> | 2014-02-19 00:00:36 +0400 |
---|---|---|
committer | Daniel Garcia <danielgarcia@gmail.com> | 2014-02-19 00:00:36 +0400 |
commit | 902bf544a44ad0ec5bd35c6b462c0f4b2e7da5c9 (patch) | |
tree | cee522c9a993b68b115612bdf7589addc3b4c2c1 /clockless_trinket.h | |
parent | 0bfebe9752414ffa068e8f3421a073fa59e899eb (diff) |
Initial checkin of the dithering/white balance code for the trinket
Diffstat (limited to 'clockless_trinket.h')
-rw-r--r-- | clockless_trinket.h | 232 |
1 files changed, 121 insertions, 111 deletions
diff --git a/clockless_trinket.h b/clockless_trinket.h index 7fb593dd..45eea2de 100644 --- a/clockless_trinket.h +++ b/clockless_trinket.h @@ -29,7 +29,7 @@ template<> __attribute__((always_inline)) inline void _dc<0>(register uint8_t & template<> __attribute__((always_inline)) inline void _dc<1>(register uint8_t & loopvar) {asm __volatile__("cp r0,r0":::);} template<> __attribute__((always_inline)) inline void _dc<2>(register uint8_t & loopvar) {asm __volatile__("rjmp .+0":::);} -#define D1(ADJ) _dc<T1-(2+ADJ)>(loopvar); +#define D1(ADJ) _dc<T1-(1+ADJ)>(loopvar); #define D2(ADJ) _dc<T2-(1+ADJ)>(loopvar); #define D3(ADJ) _dc<T3-(1+ADJ)>(loopvar); @@ -54,25 +54,25 @@ public: virtual void clearLeds(int nLeds) { static byte zeros[3] = {0,0,0}; - showRGBInternal_AdjTime(0, false, nLeds, 0, zeros); + showRGBInternal_AdjTime(0, false, nLeds, CRGB(0,0,0), zeros); } // set all the leds on the controller to a given color - virtual void showColor(const struct CRGB & data, int nLeds, uint8_t scale = 255) { + virtual void showColor(const struct CRGB & data, int nLeds, CRGB scale = CRGB::White) { showRGBInternal_AdjTime(0, false, nLeds, scale, (const byte*)&data); } - virtual void show(const struct CRGB *rgbdata, int nLeds, uint8_t scale = 255) { + virtual void show(const struct CRGB *rgbdata, int nLeds, CRGB scale = CRGB::White) { showRGBInternal_AdjTime(0, true, nLeds, scale, (const byte*)rgbdata); } #ifdef SUPPORT_ARGB - virtual void show(const struct CARGB *rgbdata, int nLeds, uint8_t scale = 255) { + virtual void show(const struct CARGB *rgbdata, int nLeds, CRGB scale = CRGB::White) { showRGBInternal_AdjTime(1, true, nLeds, scale, (const byte*)rgbdata); } #endif - void __attribute__ ((noinline)) showRGBInternal_AdjTime(int skip, bool advance, int nLeds, uint8_t scale, const byte *rgbdata) { + void __attribute__ ((noinline)) showRGBInternal_AdjTime(int skip, bool advance, int nLeds, CRGB scale, const byte *rgbdata) { mWait.wait(); cli(); @@ -87,32 +87,36 @@ public: } #define USE_ASM_MACROS - + #define ASM_VARS : /* write variables */ \ [b0] "+r" (b0), \ [b1] "+r" (b1), \ [b2] "+r" (b2), \ [count] "+x" (count), \ - [scale_base] "+r" (scale_base), \ + [scale_base] "+a" (scale_base), \ [data] "+z" (data), \ [loopvar] "+a" (loopvar) \ : /* use variables */ \ + [ADV] "r" (advanceBy), \ [hi] "r" (hi), \ [lo] "r" (lo), \ - [scale] "r" (scale), \ - [ADV] "r" (advanceBy), \ - [zero] "r" (zero), \ + [s0] "r" (s0), \ + [s1] "r" (s1), \ + [s2] "r" (s2), \ + [d0] "r" (d0), \ + [d1] "r" (d1), \ + [d2] "r" (d2), \ + [PORT] "M" (FastPin<DATA_PIN>::port()-0x20), \ [O0] "M" (RGB_BYTE0(RGB_ORDER)), \ [O1] "M" (RGB_BYTE1(RGB_ORDER)), \ - [O2] "M" (RGB_BYTE2(RGB_ORDER)), \ - [PORT] "M" (FastPin<DATA_PIN>::port()-0x20) \ + [O2] "M" (RGB_BYTE2(RGB_ORDER)) \ : /* clobber registers */ // 1 cycle, write hi to the port -#define HI1 asm __volatile__("out %[PORT], %[hi]" ASM_VARS ); +#define HI1 asm __volatile__("out 0x02, %[hi]" ASM_VARS ); // 1 cycle, write lo to the port -#define LO1 asm __volatile__("out %[PORT], %[lo]" ASM_VARS ); +#define LO1 asm __volatile__("out 0x02, %[lo]" ASM_VARS ); // 2 cycles, sbrs on flipping the lne to lo if we're pushing out a 0 #define QLO2(B, N) asm __volatile__("sbrs %[" #B "], " #N ASM_VARS ); LO1; // load a byte from ram into the given var with the given offset @@ -128,7 +132,9 @@ public: // 2 cycles - jump out of the loop #define BRLOOP1 asm __volatile__("breq 2f" ASM_VARS ); // 2 cycles - perform one step of the scaling (if a given bit is set in scale, add scale-base to the scratch space) -#define SCALE2(B, N) asm __volatile__("sbrc %[scale], " #N "\n\tadd %[" #B "], %[scale_base]" ASM_VARS ); +#define SCALE02(B, N) asm __volatile__("sbrc %[s0], " #N "\n\tadd %[" #B "], %[scale_base]" ASM_VARS ); +#define SCALE12(B, N) asm __volatile__("sbrc %[s1], " #N "\n\tadd %[" #B "], %[scale_base]" ASM_VARS ); +#define SCALE22(B, N) asm __volatile__("sbrc %[s2], " #N "\n\tadd %[" #B "], %[scale_base]" ASM_VARS ); // 1 cycle - rotate right, pulling in from carry #define ROR1(B) asm __volatile__("ror %[" #B "]" ASM_VARS ); // 1 cycle, clear the carry bit @@ -136,18 +142,29 @@ public: // 1 cycle, move one register to another #define MOV1(B1, B2) asm __volatile__("mov %[" #B1 "], %[" #B2 "]" ASM_VARS ); // 4 cycles, rotate, clear carry, scale next bit -#define RORSC4(B, N) ROR1(B) CLC1 SCALE2(B, N) +#define RORSC04(B, N) ROR1(B) CLC1 SCALE02(B, N) +#define RORSC14(B, N) ROR1(B) CLC1 SCALE12(B, N) +#define RORSC24(B, N) ROR1(B) CLC1 SCALE22(B, N) // 4 cycles, scale bit, rotate, clear carry -#define SCROR4(B, N) SCALE2(B,N) ROR1(B) CLC1 +#define SCROR04(B, N) SCALE02(B,N) ROR1(B) CLC1 +#define SCROR14(B, N) SCALE12(B,N) ROR1(B) CLC1 +#define SCROR24(B, N) SCALE22(B,N) ROR1(B) CLC1 // define the beginning of the loop -#define LOOP asm __volatile__("1:" ASM_VARS ); +#define LOOP asm __volatile__("1:" ASM_VARS ); d0 += DADVANCE; d1 += DADVANCE; d2 += DADVANCE; d0 &= e0; d1 &= e1; d2 &= d2; #define DONE asm __volatile__("2:" ASM_VARS ); // delay time - +#define DADVANCE 3 +#define DITHER 1 +#define PRESCALE0_4() if(DITHER) { asm __volatile__("cpse %[scale_base], r1\n\t add %[scale_base],%[d0]\n\tbrcc L_%=\n\tldi %[scale_base], 0xFF\n\tL_%=:\n\t" ASM_VARS); } \ + else { _dc<4>(loopvar); } +#define PRESCALE1_4() if(DITHER) { asm __volatile__("cpse %[scale_base], r1\n\t add %[scale_base],%[d1]\n\tbrcc L_%=\n\tldi %[scale_base], 0xFF\n\tL_%=:\n\t" ASM_VARS); } \ + else { _dc<4>(loopvar); } +#define PRESCALE2_4() if(DITHER) { asm __volatile__("cpse %[scale_base], r1\n\t add %[scale_base],%[d2]\n\tbrcc L_%=\n\tldi %[scale_base], 0xFF\n\tL_%=:\n\t" ASM_VARS); } \ + else { _dc<4>(loopvar); } // This method is made static to force making register Y available to use for data on AVR - if the method is non-static, then // gcc will use register Y for the this pointer. - static void __attribute__ ((noinline)) showRGBInternal(int skip, bool advance, int nLeds, uint8_t scale, const byte *rgbdata) { + static void __attribute__ ((noinline)) showRGBInternal(int skip, bool advance, int nLeds, CRGB & scale, const byte *rgbdata) { byte *data = (byte*)rgbdata; data_t mask = FastPin<DATA_PIN>::mask(); data_ptr_t port = FastPin<DATA_PIN>::port(); @@ -156,118 +173,111 @@ public: data_t lo = *port & ~mask; *port = lo; + uint8_t d0, d1, d2; + uint8_t e0, e1, e2; + uint8_t s0, s1, s2; uint8_t b0, b1, b2; + static uint8_t d[3] = {0,0,0}; + uint16_t count = nLeds; uint8_t scale_base = 0; uint16_t advanceBy = advance ? (skip+3) : 0; - const uint8_t zero = 0; + + // initialize the scales + s0 = scale.raw[B0]; + s1 = scale.raw[B1]; + s2 = scale.raw[B2]; + + // initialize the e & d values + uint8_t S; + S = s0; e0 = 0xFF; while(s0 >>= 1) { e0 >>= 1; } + d0 = d[0] & e0; + S = s1; e1 = 0xFF; while(s1 >>= 1) { e1 >>= 1; } + d1 = d[1] & e1; + S = s2; e2 = 0xFF; while(s2 >>= 1) { e2 >>= 1; } + d2 = d[2] & e0; + b0 = data[RGB_BYTE0(RGB_ORDER)]; + if(DITHER && b0) { b0 = qadd8(b0, d0); } b0 = scale8(b0, scale); - b1 = data[RGB_BYTE1(RGB_ORDER)]; + b1 = 0; b2 = 0; - register uint8_t loopvar; + register uint8_t loopvar=0; - if(RGB_ORDER == RGB) { - // If the rgb order is RGB, we can cut back on program space usage by making a much more compact - // representation. - - // multiply count by 3, don't use * because there's no hardware multiply - count = count+(count<<1); - advanceBy = advance ? 1 : 0; - { - /* asm */ - LOOP - // Sum of the clock counts across each row should be 10 for 8Mhz, WS2811 -#if TRINKET_SCALE - // Inline scaling, RGB ordering matches byte ordering - HI1 D1(0) QLO2(b0, 7) LDSCL3(b1,O1) D2(3) LO1 SCALE2(b1,0) D3(2) - HI1 D1(0) QLO2(b0, 6) RORSC4(b1,1) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 5) SCROR4(b1,2) D2(4) LO1 SCALE2(b1,3) D3(2) - HI1 D1(0) QLO2(b0, 4) RORSC4(b1,4) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 3) SCROR4(b1,5) D2(4) LO1 SCALE2(b1,6) D3(2) - HI1 D1(0) QLO2(b0, 2) RORSC4(b1,7) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 1) IDATA2 D2(2) LO1 D3(0) - // In the last bit's first block, we decrement and branch to done if we decremented to 0 - HI1 D1(0) QLO2(b0, 0) DCOUNT2 BRLOOP1 MOV1(b0, b1) D2(4) LO1 D3(2) JMPLOOP2 -#else - // no inline scaling, RGB ordering matches byte ordering - HI1 D1(0) QLO2(b0, 7) LD2(b1,O1) D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b0, 6) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 5) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 4) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 3) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 2) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 1) IDATA2 D2(2) LO1 D3(0) - // In the last bit's first block, we decrement and branch to done if we decremented to 0 - HI1 D1(0) QLO2(b2, 0) DCOUNT2 BRLOOP1 MOV1(b0,b1) D2(4) LO1 D3(2) JMPLOOP2 -#endif - DONE - D2(4) LO1 D3(0) - } - } - else { { /* asm */ LOOP // Sum of the clock counts across each row should be 10 for 8Mhz, WS2811 + // The values in the D1/D2/D3 indicate how many cycles the previous column takes + // to allow things to line back up. + // + // While writing out byte 0, we're loading up byte 1, applying the dithering adjustment, + // then scaling it using 8 cycles of shift/add interleaved in between writing the bits + // out. When doing byte 1, we're doing the above for byte 2. When we're doing byte 2, + // we're cycling back around and doing the above for byte 0. #if TRINKET_SCALE // Inline scaling - RGB ordering - HI1 D1(0) QLO2(b0, 7) LDSCL3(b1,O1) D2(3) LO1 SCALE2(b1,0) D3(2) - HI1 D1(0) QLO2(b0, 6) RORSC4(b1,1) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 5) SCROR4(b1,2) D2(4) LO1 SCALE2(b1,3) D3(2) - HI1 D1(0) QLO2(b0, 4) RORSC4(b1,4) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 3) SCROR4(b1,5) D2(4) LO1 SCALE2(b1,6) D3(2) - HI1 D1(0) QLO2(b0, 2) RORSC4(b1,7) D2(4) LO1 ROR1(b1) CLC1 D3(2) - HI1 D1(0) QLO2(b0, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 0) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 7) LDSCL3(b2,O2) D2(3) LO1 SCALE2(b2,0) D3(2) - HI1 D1(0) QLO2(b1, 6) RORSC4(b2,1) D2(4) LO1 ROR1(b2) CLC1 D3(2) - HI1 D1(0) QLO2(b1, 5) SCROR4(b2,2) D2(4) LO1 SCALE2(b2,3) D3(2) - HI1 D1(0) QLO2(b1, 4) RORSC4(b2,4) D2(4) LO1 ROR1(b2) CLC1 D3(2) - HI1 D1(0) QLO2(b1, 3) SCROR4(b2,5) D2(4) LO1 SCALE2(b2,6) D3(2) - HI1 D1(0) QLO2(b1, 2) RORSC4(b2,7) D2(4) LO1 ROR1(b2) CLC1 D3(2) - HI1 D1(0) QLO2(b1, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 0) IDATA2 D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b2, 7) LDSCL3(b0,O0) D2(3) LO1 SCALE2(b0,0) D3(2) - HI1 D1(0) QLO2(b2, 6) RORSC4(b0,1) D2(4) LO1 ROR1(b0) CLC1 D3(2) - HI1 D1(0) QLO2(b2, 5) SCROR4(b0,2) D2(4) LO1 SCALE2(b0,3) D3(2) - HI1 D1(0) QLO2(b2, 4) RORSC4(b0,4) D2(4) LO1 ROR1(b0) CLC1 D3(2) - HI1 D1(0) QLO2(b2, 3) SCROR4(b0,5) D2(4) LO1 SCALE2(b0,6) D3(2) - HI1 D1(0) QLO2(b2, 2) RORSC4(b0,7) D2(4) LO1 ROR1(b0) CLC1 D3(2) - HI1 D1(0) QLO2(b2, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 0) DCOUNT2 BRLOOP1 D2(3) LO1 D3(2) JMPLOOP2 + HI1 D1(1) QLO2(b0, 7) LDSCL3(b1,O1) D2(3) LO1 D3(0) + HI1 D1(1) QLO2(b0, 6) PRESCALE1_4() D2(4) LO1 SCALE12(b1,0) D3(2) + HI1 D1(1) QLO2(b0, 5) RORSC14(b1,1) D2(4) LO1 ROR1(b1) CLC1 D3(2) + HI1 D1(1) QLO2(b0, 4) SCROR14(b1,2) D2(4) LO1 SCALE12(b1,3) D3(2) + HI1 D1(1) QLO2(b0, 3) RORSC14(b1,4) D2(4) LO1 ROR1(b1) CLC1 D3(2) + HI1 D1(1) QLO2(b0, 2) SCROR14(b1,5) D2(4) LO1 SCALE12(b1,6) D3(2) + HI1 D1(1) QLO2(b0, 1) RORSC14(b1,7) D2(4) LO1 ROR1(b1) CLC1 D3(2) + HI1 D1(1) QLO2(b0, 0) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 7) LDSCL3(b2,O1) D2(3) LO1 D3(0) + HI1 D1(1) QLO2(b1, 6) PRESCALE2_4() D2(4) LO1 SCALE22(b2,0) D3(2) + HI1 D1(1) QLO2(b1, 5) RORSC24(b2,1) D2(4) LO1 ROR1(b2) CLC1 D3(2) + HI1 D1(1) QLO2(b1, 4) SCROR24(b2,2) D2(4) LO1 SCALE22(b2,3) D3(2) + HI1 D1(1) QLO2(b1, 3) RORSC24(b2,4) D2(4) LO1 ROR1(b2) CLC1 D3(2) + HI1 D1(1) QLO2(b1, 2) SCROR24(b2,5) D2(4) LO1 SCALE22(b2,6) D3(2) + HI1 D1(1) QLO2(b1, 1) RORSC24(b2,7) D2(4) LO1 ROR1(b2) CLC1 D3(2) + HI1 D1(1) QLO2(b1, 0) IDATA2 D2(2) LO1 D3(0) + HI1 D1(1) QLO2(b2, 7) LDSCL3(b2,O1) D2(3) LO1 D3(0) + HI1 D1(1) QLO2(b2, 6) PRESCALE0_4() D2(4) LO1 SCALE22(b0,0) D3(2) + HI1 D1(1) QLO2(b2, 5) RORSC04(b0,1) D2(4) LO1 ROR1(b0) CLC1 D3(2) + HI1 D1(1) QLO2(b2, 4) SCROR04(b0,2) D2(4) LO1 SCALE02(b0,3) D3(2) + HI1 D1(1) QLO2(b2, 3) RORSC04(b0,4) D2(4) LO1 ROR1(b0) CLC1 D3(2) + HI1 D1(1) QLO2(b2, 2) SCROR04(b0,5) D2(4) LO1 SCALE02(b0,6) D3(2) + HI1 D1(1) QLO2(b2, 1) RORSC04(b0,7) D2(4) LO1 ROR1(b0) CLC1 D3(2) + HI1 D1(1) QLO2(b2, 0) DCOUNT2 BRLOOP1 D2(3) LO1 D3(2) JMPLOOP2 #else // no inline scaling - non-straight RGB ordering - HI1 D1(0) QLO2(b0, 7) LD2(b1,O1) D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b0, 6) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 5) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 4) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 3) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 2) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b0, 0) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 7) LD2(b2,O2) D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b1, 6) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 5) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 4) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 3) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 2) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b1, 0) IDATA2 D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b2, 7) LD2(b0,O0) D2(2) LO1 D3(0) - HI1 D1(0) QLO2(b2, 6) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 5) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 4) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 3) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 2) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 1) D2(0) LO1 D3(0) - HI1 D1(0) QLO2(b2, 0) DCOUNT2 BRLOOP1 D2(3) LO1 D3(2) JMPLOOP2 + HI1 D1(1) QLO2(b0, 7) LD2(b1,O1) D2(2) LO1 D3(0) + HI1 D1(1) QLO2(b0, 6) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 5) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 4) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 3) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 2) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 1) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b0, 0) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 7) LD2(b2,O2) D2(2) LO1 D3(0) + HI1 D1(1) QLO2(b1, 6) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 5) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 4) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 3) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 2) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 1) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b1, 0) IDATA2 D2(2) LO1 D3(0) + HI1 D1(1) QLO2(b2, 7) LD2(b0,O0) D2(2) LO1 D3(0) + HI1 D1(1) QLO2(b2, 6) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 5) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 4) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 3) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 2) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 1) D2(0) LO1 D3(0) + HI1 D1(1) QLO2(b2, 0) DCOUNT2 BRLOOP1 D2(3) LO1 D3(2) JMPLOOP2 #endif DONE D2(4) LO1 D3(0) } } + + // save the d values + d[0] = d0; + d[1] = d1; + d[2] = d2; } #ifdef SUPPORT_ARGB |