d9/dc3/chasing__spirals_8cpp_8hpp_source.html

// Chasing Spirals — three implementations (Float, Q31 scalar, Q31 SIMD).

//

// All variants share setupChasingSpiralFrame() which builds a per-pixel SoA

// geometry cache (base_angle, dist_scaled, radial filters, pixel_idx) and

// a Perlin fade LUT.  Per-frame constants (center, linear/radial offsets)

// are computed once and passed via FrameSetup.

//

// Q31 scalar:  Batches 3 channel sincos into one sincos32_simd call per pixel,

//              then evaluates Perlin noise and radial filter per channel.

// Q31 SIMD:    Processes 4 pixels at a time with full SIMD pipeline (aligned

//              SoA loads → sincos32_simd → Perlin → clamp/scale → scatter).

//              Perlin exits to scalar per-lane (SSE2 has no integer gather).


#include "fl/stl/align.h"

#include "fl/stl/compiler_control.h"

#include "fl/fx/2d/animartrix_detail/engine.h"

#include "fl/fx/2d/animartrix_detail/chasing_spiral_state.h"

#include "fl/fx/2d/animartrix_detail/perlin_s16x16.h"

#include "fl/math/noise/perlin_s16x16_simd.h"

#include "fl/fx/2d/animartrix_detail/perlin_float.h"

#include "fl/math/simd.h"

#include "fl/math/sin32.h"

#include "fl/fx/2d/animartrix_detail/viz/chasing_spirals.h"


FL_FAST_MATH_BEGIN

FL_OPTIMIZATION_LEVEL_O3_BEGIN


namespace fl {


namespace {


using FP = fl::s16x16;

using Perlin = perlin_s16x16;


// Common setup values returned by setupChasingSpiralFrame.

// Carries raw SoA pointers (no PixelLUT AoS struct).


struct FrameSetup {

    int total_pixels;

    const fl::i32 *base_angle;

    const fl::i32 *dist_scaled;

    const fl::i32 *rf3;

    const fl::i32 *rf_half;

    const fl::i32 *rf_quarter;

    const fl::u16 *pixel_idx;

    const fl::i32 *fade_lut;

    const fl::u8  *perm;

    fl::i32 cx_raw;

    fl::i32 cy_raw;

    fl::i32 lin0_raw;

    fl::i32 lin1_raw;

    fl::i32 lin2_raw;

    fl::i32 rad0_raw;

    fl::i32 rad1_raw;

    fl::i32 rad2_raw;

    fl::span<CRGB> leds;

};


// Convert s16x16 angle (radians) to A24 format for sincos32


FASTLED_FORCE_INLINE u32 radiansToA24(i32 base_s16x16, i32 offset_s16x16) {

    constexpr i32 RAD_TO_A24 = 2670177;

    return static_cast<u32>((static_cast<i64>(base_s16x16 + offset_s16x16) * RAD_TO_A24) >> FP::FRAC_BITS);

}


// Compute Perlin coordinate from sincos result and distance


FASTLED_FORCE_INLINE i32 perlinCoord(i32 sc_val, i32 dist_raw, i32 offset) {

    return offset - static_cast<i32>((static_cast<i64>(sc_val) * dist_raw) >> 31);

}


// Clamp s16x16 value to [0, 1] and scale to [0, 255]


FASTLED_FORCE_INLINE i32 clampAndScale255(i32 raw_s16x16) {

    constexpr i32 FP_ONE = static_cast<i32>(1) << FP::FRAC_BITS;

    if (raw_s16x16 < 0) raw_s16x16 = 0;

    if (raw_s16x16 > FP_ONE) raw_s16x16 = FP_ONE;

    return (raw_s16x16 << 8) - raw_s16x16;

}


// Apply radial filter to noise value and clamp to [0, 255]


FASTLED_FORCE_INLINE i32 applyRadialFilter(i32 noise_255, i32 rf_raw) {

    i32 result = static_cast<i32>((static_cast<i64>(noise_255) * rf_raw) >> (FP::FRAC_BITS * 2));

    if (result < 0) result = 0;

    if (result > 255) result = 255;

    return result;

}


// Load 4 aligned i32 values from an SoA array into a SIMD register.

//

// FrameSetup pointers already carry assume_aligned<16> from setupChasingSpiralFrame(),

// but reinterpret_cast<const u32*> strips the compiler's alignment metadata.

// Re-asserting assume_aligned<16> here restores the hint so the compiler can

// emit aligned SIMD loads (e.g. movaps/movdqa on x86) instead of unaligned ones

// (movups/movdqu), which avoids a micro-op penalty on older cores and removes

// a redundant alignment check on modern ones.


FASTLED_FORCE_INLINE simd::simd_u32x4 loadAligned(const i32 *arr, int i) {

    return simd::load_u32_4_aligned(

        fl::assume_aligned<16>(reinterpret_cast<const u32*>(arr + i))); // ok reinterpret cast

}


// Write one pixel from per-channel SIMD registers at the given lane.


FASTLED_FORCE_INLINE void scatterPixel(fl::span<CRGB> leds, u16 idx,

    simd::simd_u32x4 r, simd::simd_u32x4 g, simd::simd_u32x4 b, int lane) {

    leds[idx] = CRGB(static_cast<u8>(simd::extract_u32_4(r, lane)),

                     static_cast<u8>(simd::extract_u32_4(g, lane)),

                     static_cast<u8>(simd::extract_u32_4(b, lane)));

}


// Process one color channel for 4 pixels using a full SIMD pipeline.

// Returns 4 clamped [0, 255] channel values.


simd::simd_u32x4 simd4_processChannel(

    simd::simd_u32x4 base_vec, simd::simd_u32x4 dist_vec,

    i32 radial_offset, i32 linear_offset,

    const i32 *fade_lut, const u8 *perm, i32 cx_raw, i32 cy_raw,

    simd::simd_u32x4 rf_vec) {


    constexpr i32 RAD_TO_A24 = 2670177;


    // Angle conversion: Q16.16 → A24

    auto offset_vec    = simd::set1_u32_4(static_cast<u32>(radial_offset));

    auto sum_vec       = simd::add_i32_4(base_vec, offset_vec);

    auto rad_const_vec = simd::set1_u32_4(static_cast<u32>(RAD_TO_A24));

    auto angles_vec    = simd::mulhi_su32_4(sum_vec, rad_const_vec);


    SinCos32_simd sc = sincos32_simd(angles_vec);


    // Perlin coordinates: nx = lin+cx - cos*dist, ny = cy - sin*dist

    auto lin_cx  = simd::set1_u32_4(static_cast<u32>(linear_offset + cx_raw));

    auto cy_vec  = simd::set1_u32_4(static_cast<u32>(cy_raw));

    auto nx_vec  = simd::sub_i32_4(lin_cx,

        simd::sll_u32_4(simd::mulhi32_i32_4(sc.cos_vals, dist_vec), 1));

    auto ny_vec  = simd::sub_i32_4(cy_vec,

        simd::sll_u32_4(simd::mulhi32_i32_4(sc.sin_vals, dist_vec), 1));


    // Perlin noise (SIMD floor/frac/wrap, scalar fade/perm/grad/lerp per lane)

    auto raw_vec = perlin_s16x16_simd::pnoise2d_raw_simd4_vec(

        nx_vec, ny_vec, fade_lut, perm);


    // Clamp [0, FP_ONE], scale ×255, apply radial filter, clamp [0, 255]

    auto zero   = simd::set1_u32_4(0u);

    auto fp_one = simd::set1_u32_4(static_cast<u32>(static_cast<i32>(1) << FP::FRAC_BITS));

    auto clamped = simd::min_i32_4(simd::max_i32_4(raw_vec, zero), fp_one);

    auto noise_scaled = simd::sub_i32_4(simd::sll_u32_4(clamped, 8), clamped);


    auto max255 = simd::set1_u32_4(255u);

    auto result = simd::mulhi32_i32_4(noise_scaled, rf_vec);

    return simd::min_i32_4(simd::max_i32_4(result, zero), max255);

}


// Extract common frame setup logic shared by all variants.

// Builds SoA geometry cache lazily (once when grid size changes).

// state is the caller's per-instance ChasingSpiralState member (not a global).


FrameSetup setupChasingSpiralFrame(Context &ctx, ChasingSpiralState &state) {

    auto *e = ctx.mEngine.get();

    e->get_ready();


    // Timing (once per frame, float is fine here)

    e->timings.master_speed = 0.01;

    e->timings.ratio[0] = 0.1;

    e->timings.ratio[1] = 0.13;

    e->timings.ratio[2] = 0.16;

    e->timings.offset[1] = 10;

    e->timings.offset[2] = 20;

    e->timings.offset[3] = 30;

    e->calculate_oscillators(e->timings);


    const int num_x = e->num_x;

    const int num_y = e->num_y;

    const int total_pixels = num_x * num_y;


    // Per-frame constants (float->FP boundary conversions)

    constexpr FP scale(0.1f);

    const FP radius_fp(e->radial_filter_radius);

    const FP center_x_scaled = FP(e->animation.center_x * 0.1f);

    const FP center_y_scaled = FP(e->animation.center_y * 0.1f);


    const FP radial0(e->move.radial[0]);

    const FP radial1(e->move.radial[1]);

    const FP radial2(e->move.radial[2]);


    // Reduce linear offsets modulo the Perlin noise period before converting

    // to s16x16. Two reasons:

    //   1. Prevents s16x16 overflow (range ±32767 in integer part).

    //   2. Float32 precision fix: matches the same reduction applied in

    //      Chasing_Spirals_Float (animartrix v1 and v2 float paths) so both

    //      paths compute identical Perlin coordinates at all time values.

    //      Without this reduction, float32 loses per-pixel coordinate precision

    //      when move.linear grows large (ULP at 200,000 ≈ 0.024 > pixel step 0.1).

    // Perlin noise is exactly periodic with period 256 at integer coordinates,

    // so with scale_x=0.1 the effective period for offset_x is 256/0.1 = 2560.

    // See: tests/fl/fx/2d/animartrix2.cpp "period reduction" test cases.

    constexpr float perlin_period = 2560.0f; // 256.0f / scale_x(0.1f)

    constexpr float scale_f = 0.1f;

    const FP linear0_scaled = FP(fmodf(e->move.linear[0], perlin_period) * scale_f);

    const FP linear1_scaled = FP(fmodf(e->move.linear[1], perlin_period) * scale_f);

    const FP linear2_scaled = FP(fmodf(e->move.linear[2], perlin_period) * scale_f);


    constexpr FP three_fp(3.0f);

    constexpr FP one(1.0f);


    // Build per-pixel SoA geometry (once when grid size changes)

    if (state.count != total_pixels) {

        const int padded = (total_pixels + 3) & ~3;  // multiple of 4 for SIMD safety

        state.base_angle.resize(padded, 0);

        state.dist_scaled.resize(padded, 0);

        state.rf3.resize(padded, 0);

        state.rf_half.resize(padded, 0);

        state.rf_quarter.resize(padded, 0);

        state.pixel_idx.resize(padded, 0);


        const FP inv_radius = one / radius_fp;

        const FP one_third = one / three_fp;

        int idx = 0;

        for (int x = 0; x < num_x; x++) {

            for (int y = 0; y < num_y; y++) {

                const FP theta(e->polar_theta[x][y]);

                const FP dist(e->distance[x][y]);

                const FP rf = (radius_fp - dist) * inv_radius;

                state.base_angle[idx]  = (three_fp * theta - dist * one_third).raw();

                state.dist_scaled[idx] = (dist * scale).raw();

                state.rf3[idx]         = (three_fp * rf).raw();

                state.rf_half[idx]     = (rf >> 1).raw();

                state.rf_quarter[idx]  = (rf >> 2).raw();

                state.pixel_idx[idx]   = e->mCtx->xyMapFn(x, y, e->mCtx->xyMapUserData);

                idx++;

            }

        }

        state.count = total_pixels;

    }


    // Initialize Perlin fade LUT once per state lifetime

    if (!state.fade_lut_initialized) {

        Perlin::init_fade_lut(state.fade_lut);

        state.fade_lut_initialized = true;

    }


    const i32 cx_raw   = center_x_scaled.raw();

    const i32 cy_raw   = center_y_scaled.raw();

    const i32 lin0_raw = linear0_scaled.raw();

    const i32 lin1_raw = linear1_scaled.raw();

    const i32 lin2_raw = linear2_scaled.raw();

    const i32 rad0_raw = radial0.raw();

    const i32 rad1_raw = radial1.raw();

    const i32 rad2_raw = radial2.raw();


    // Stamp alignment on SoA pointers at the source so every downstream

    // consumer (Q31 scalar loop, SIMD 4-wide loop, loadAligned helper)

    // inherits the hint without needing per-site annotations.

    //

    // Why this matters for performance:

    //   1. The SIMD path calls loadAligned() which feeds load_u32_4_aligned().

    //      With the alignment hint the compiler emits movdqa/movaps (aligned

    //      128-bit loads) instead of movdqu/movups (unaligned). On older x86

    //      (pre-Nehalem) unaligned loads are significantly slower; on modern

    //      cores they still cost an extra micro-op when the address crosses a

    //      cache-line boundary.

    //   2. The Q31 scalar path benefits too: the compiler can widen scalar

    //      i32 loads into SIMD gathers or auto-vectorize more aggressively

    //      when it knows the base pointer is 16-byte aligned.

    //   3. fade_lut (256-entry i32 Perlin fade table) is accessed in every

    //      Perlin noise evaluation; the alignment hint lets the compiler

    //      assume cache-line-friendly access patterns.

    //

    // The underlying SoA arrays are allocated with FL_ALIGNAS(16) in

    // ChasingSpiralState, so this is a promise (not a request).

    // pixel_idx is u16 (2 bytes) and not SIMD-loaded, so no hint needed.

    return FrameSetup{

        total_pixels,

        fl::assume_aligned<16>(state.base_angle.data()),

        fl::assume_aligned<16>(state.dist_scaled.data()),

        fl::assume_aligned<16>(state.rf3.data()),

        fl::assume_aligned<16>(state.rf_half.data()),

        fl::assume_aligned<16>(state.rf_quarter.data()),

        state.pixel_idx.data(),

        fl::assume_aligned<16>(state.fade_lut),

        PERLIN_NOISE,

        cx_raw,

        cy_raw,

        lin0_raw,

        lin1_raw,

        lin2_raw,

        rad0_raw,

        rad1_raw,

        rad2_raw,

        e->mCtx->leds

    };

}


} // anonymous namespace


// ============================================================================

// Float Implementation (original algorithm, uses v2 Engine)

// ============================================================================


void Chasing_Spirals_Float::draw(Context &ctx) {

    auto *e = ctx.mEngine.get();

    e->get_ready();


    // Perlin noise is periodic with period 256 at integer coordinates.

    // scale_x = 0.1, so the effective period for offset_x is 256/0.1 = 2560.

    // Reducing move.linear[i] modulo this period before use keeps float32

    // coordinate arithmetic precise even at extreme uptime values.

    // Without this, float32 loses per-pixel precision when adding a small

    // per-pixel term (~0.1) to a large offset (e.g. 200,000), since float32

    // ULP at that magnitude (~0.024) is coarser than the per-pixel step.

    // This matches the reduction already applied in setupChasingSpiralFrame

    // for the Q31 path, keeping both paths in agreement at all time values.

    static constexpr float perlin_period = 2560.0f; // 256.0f / scale_x(0.1f)


    e->timings.master_speed = 0.01;

    e->timings.ratio[0] = 0.1;

    e->timings.ratio[1] = 0.13;

    e->timings.ratio[2] = 0.16;

    e->timings.offset[1] = 10;

    e->timings.offset[2] = 20;

    e->timings.offset[3] = 30;

    e->calculate_oscillators(e->timings);


    for (int x = 0; x < e->num_x; x++) {

        for (int y = 0; y < e->num_y; y++) {

            e->animation.angle =

                3 * e->polar_theta[x][y] + e->move.radial[0] -

                e->distance[x][y] / 3;

            e->animation.dist = e->distance[x][y];

            e->animation.scale_z = 0.1;

            e->animation.scale_y = 0.1;

            e->animation.scale_x = 0.1;

            e->animation.offset_x = fl::fmodf(e->move.linear[0], perlin_period);

            e->animation.offset_y = 0;

            e->animation.offset_z = 0;

            e->animation.z = 0;

            float show1 = e->render_value(e->animation);


            e->animation.angle =

                3 * e->polar_theta[x][y] + e->move.radial[1] -

                e->distance[x][y] / 3;

            e->animation.dist = e->distance[x][y];

            e->animation.offset_x = fl::fmodf(e->move.linear[1], perlin_period);

            float show2 = e->render_value(e->animation);


            e->animation.angle =

                3 * e->polar_theta[x][y] + e->move.radial[2] -

                e->distance[x][y] / 3;

            e->animation.dist = e->distance[x][y];

            e->animation.offset_x = fl::fmodf(e->move.linear[2], perlin_period);

            float show3 = e->render_value(e->animation);


            float radius = e->radial_filter_radius;

            float radial_filter = (radius - e->distance[x][y]) / radius;


            e->pixel.red = 3 * show1 * radial_filter;

            e->pixel.green = show2 * radial_filter / 2;

            e->pixel.blue = show3 * radial_filter / 4;


            e->pixel = e->rgb_sanity_check(e->pixel);

            e->setPixelColorInternal(x, y, e->pixel);

        }

    }

}


// ============================================================================

// Q31 Scalar Implementation (fixed-point, non-vectorized)

// ============================================================================


void Chasing_Spirals_Q31::draw(Context &ctx) {

    auto setup = setupChasingSpiralFrame(ctx, mState);

    const int total_pixels  = setup.total_pixels;

    const i32 *fade_lut     = setup.fade_lut;

    const u8  *perm         = setup.perm;

    const i32  cx_raw       = setup.cx_raw;

    const i32  cy_raw       = setup.cy_raw;

    const i32  lin0_raw     = setup.lin0_raw;

    const i32  lin1_raw     = setup.lin1_raw;

    const i32  lin2_raw     = setup.lin2_raw;

    const i32  rad0_raw     = setup.rad0_raw;

    const i32  rad1_raw     = setup.rad1_raw;

    const i32  rad2_raw     = setup.rad2_raw;

    fl::span<CRGB> leds     = setup.leds;


    // Compute one noise channel from a batched SinCos32_simd result.

    auto noise_channel = [&](const SinCos32_simd &sc, int lane,

                             i32 lin_raw, i32 dist_raw) -> i32 {

        i32 cos_v = static_cast<i32>(simd::extract_u32_4(sc.cos_vals, lane));

        i32 sin_v = static_cast<i32>(simd::extract_u32_4(sc.sin_vals, lane));

        i32 nx = perlinCoord(cos_v, dist_raw, lin_raw + cx_raw);

        i32 ny = perlinCoord(sin_v, dist_raw, cy_raw);

        return clampAndScale255(Perlin::pnoise2d_raw(nx, ny, fade_lut, perm));

    };


    for (int i = 0; i < total_pixels; i++) {

        const i32 base_raw = setup.base_angle[i];

        const i32 dist_raw = setup.dist_scaled[i];


        // Batch all 3 channel sincos into one SIMD call (4th lane unused)

        simd::simd_u32x4 angles = simd::set_u32_4(

            radiansToA24(base_raw, rad0_raw),

            radiansToA24(base_raw, rad1_raw),

            radiansToA24(base_raw, rad2_raw), 0);

        SinCos32_simd sc = sincos32_simd(angles);


        i32 s0 = noise_channel(sc, 0, lin0_raw, dist_raw);

        i32 s1 = noise_channel(sc, 1, lin1_raw, dist_raw);

        i32 s2 = noise_channel(sc, 2, lin2_raw, dist_raw);


        i32 r = applyRadialFilter(s0, setup.rf3[i]);

        i32 g = applyRadialFilter(s1, setup.rf_half[i]);

        i32 b = applyRadialFilter(s2, setup.rf_quarter[i]);


        leds[setup.pixel_idx[i]] = CRGB(static_cast<u8>(r),

                                         static_cast<u8>(g),

                                         static_cast<u8>(b));

    }

}


// ============================================================================

// SIMD Implementation (vectorized 4-wide processing)

// ============================================================================


void Chasing_Spirals_Q31_SIMD::draw(Context &ctx) {

    auto setup = setupChasingSpiralFrame(ctx, mState);

    const int   total_pixels  = setup.total_pixels;

    const i32  *base_angle    = setup.base_angle;

    const i32  *dist_scaled   = setup.dist_scaled;

    const i32  *rf3_arr       = setup.rf3;

    const i32  *rf_half_arr   = setup.rf_half;

    const i32  *rf_qtr_arr    = setup.rf_quarter;

    const u16  *pixel_idx     = setup.pixel_idx;

    const i32  *fade_lut      = setup.fade_lut;

    const u8   *perm          = setup.perm;

    const i32   cx_raw        = setup.cx_raw;

    const i32   cy_raw        = setup.cy_raw;

    const i32   lin0_raw      = setup.lin0_raw;

    const i32   lin1_raw      = setup.lin1_raw;

    const i32   lin2_raw      = setup.lin2_raw;

    const i32   rad0_raw      = setup.rad0_raw;

    const i32   rad1_raw      = setup.rad1_raw;

    const i32   rad2_raw      = setup.rad2_raw;

    fl::span<CRGB> leds       = setup.leds;


    // SIMD pixel pipeline: process 4 pixels per iteration

    int i = 0;

    for (; i + 3 < total_pixels; i += 4) {

        // Aligned SoA loads (arrays are FL_ALIGNAS(16), stride is 4)

        auto base_vec    = loadAligned(base_angle,  i);

        auto dist_vec    = loadAligned(dist_scaled, i);

        auto rf3_vec     = loadAligned(rf3_arr,     i);

        auto rf_half_vec = loadAligned(rf_half_arr, i);

        auto rf_qtr_vec  = loadAligned(rf_qtr_arr,  i);


        auto r_vec = simd4_processChannel(

            base_vec, dist_vec, rad0_raw, lin0_raw, fade_lut, perm, cx_raw, cy_raw, rf3_vec);

        auto g_vec = simd4_processChannel(

            base_vec, dist_vec, rad1_raw, lin1_raw, fade_lut, perm, cx_raw, cy_raw, rf_half_vec);

        auto b_vec = simd4_processChannel(

            base_vec, dist_vec, rad2_raw, lin2_raw, fade_lut, perm, cx_raw, cy_raw, rf_qtr_vec);


        // Scatter to LED array (pixel_idx holds arbitrary xyMap-remapped indices)

        scatterPixel(leds, pixel_idx[i+0], r_vec, g_vec, b_vec, 0);

        scatterPixel(leds, pixel_idx[i+1], r_vec, g_vec, b_vec, 1);

        scatterPixel(leds, pixel_idx[i+2], r_vec, g_vec, b_vec, 2);

        scatterPixel(leds, pixel_idx[i+3], r_vec, g_vec, b_vec, 3);

    }


    // Scalar fallback for remaining pixels (when total_pixels % 4 != 0)

    for (; i < total_pixels; i++) {

        const i32 base_raw = base_angle[i];

        const i32 dist_raw = dist_scaled[i];


        auto noise_ch = [&](i32 rad_raw, i32 lin_raw) -> i32 {

            u32 a24 = radiansToA24(base_raw, rad_raw);

            SinCos32 sc = sincos32(a24);

            i32 nx = perlinCoord(sc.cos_val, dist_raw, lin_raw + cx_raw);

            i32 ny = perlinCoord(sc.sin_val, dist_raw, cy_raw);

            i32 raw = Perlin::pnoise2d_raw(nx, ny, fade_lut, perm);

            return clampAndScale255(raw);

        };


        i32 s0 = noise_ch(rad0_raw, lin0_raw);

        i32 s1 = noise_ch(rad1_raw, lin1_raw);

        i32 s2 = noise_ch(rad2_raw, lin2_raw);


        i32 r = applyRadialFilter(s0, rf3_arr[i]);

        i32 g = applyRadialFilter(s1, rf_half_arr[i]);

        i32 b = applyRadialFilter(s2, rf_qtr_arr[i]);


        leds[pixel_idx[i]] = CRGB(static_cast<u8>(r), static_cast<u8>(g), static_cast<u8>(b));

    }

}


} // namespace fl


FL_OPTIMIZATION_LEVEL_O3_END

FL_FAST_MATH_END

setup
void setup()
Definition AnalogOutput.ino:65

leds
fl::CRGB leds[NUM_LEDS]
Definition Animartrix.ino:93

state
TestState state
Definition ClientValidationReal.h:49

scale
fl::UISlider scale("Scale", 4,.1, 4,.1)

align.h
Alignment macros and utilities for FastLED.

chasing_spiral_state.h

chasing_spirals.h

fl::Chasing_Spirals_Float::draw
void draw(Context &ctx) override
Definition chasing_spirals.cpp.hpp:292

fl::Chasing_Spirals_Q31_SIMD::draw
void draw(Context &ctx) override
Definition chasing_spirals.cpp.hpp:416

fl::Chasing_Spirals_Q31_SIMD::mState
ChasingSpiralState mState
Definition chasing_spirals.h:33

fl::Chasing_Spirals_Q31::draw
void draw(Context &ctx) override
Definition chasing_spirals.cpp.hpp:362

fl::Chasing_Spirals_Q31::mState
ChasingSpiralState mState
Definition chasing_spirals.h:24

fl::s16x16::FRAC_BITS
static constexpr int FRAC_BITS
Definition s16x16.h:22

fl::s16x16::raw
constexpr i32 raw() const FL_NOEXCEPT
Definition s16x16.h:60

fl::s16x16
Definition s16x16.h:19

fl::span
Definition span.h:385

compiler_control.h

offset
fl::UISlider offset("Offset", 0.0f, 0.0f, 1.0f, 0.01f)

engine.h

perlin_s16x16.h

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::radiansToA24
FASTLED_FORCE_INLINE u32 radiansToA24(i32 base_s16x16, i32 offset_s16x16)
Definition chasing_spirals.cpp.hpp:59

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FP
fl::s16x16 FP
Definition chasing_spirals.cpp.hpp:32

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::Perlin
perlin_s16x16 Perlin
Definition chasing_spirals.cpp.hpp:33

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::scatterPixel
FASTLED_FORCE_INLINE void scatterPixel(fl::span< CRGB > leds, u16 idx, simd::simd_u32x4 r, simd::simd_u32x4 g, simd::simd_u32x4 b, int lane)
Definition chasing_spirals.cpp.hpp:99

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::applyRadialFilter
FASTLED_FORCE_INLINE i32 applyRadialFilter(i32 noise_255, i32 rf_raw)
Definition chasing_spirals.cpp.hpp:78

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::simd4_processChannel
simd::simd_u32x4 simd4_processChannel(simd::simd_u32x4 base_vec, simd::simd_u32x4 dist_vec, i32 radial_offset, i32 linear_offset, const i32 *fade_lut, const u8 *perm, i32 cx_raw, i32 cy_raw, simd::simd_u32x4 rf_vec)
Definition chasing_spirals.cpp.hpp:108

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::perlinCoord
FASTLED_FORCE_INLINE i32 perlinCoord(i32 sc_val, i32 dist_raw, i32 offset)
Definition chasing_spirals.cpp.hpp:65

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::setupChasingSpiralFrame
FrameSetup setupChasingSpiralFrame(Context &ctx, ChasingSpiralState &state)
Definition chasing_spirals.cpp.hpp:150

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::clampAndScale255
FASTLED_FORCE_INLINE i32 clampAndScale255(i32 raw_s16x16)
Definition chasing_spirals.cpp.hpp:70

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::loadAligned
FASTLED_FORCE_INLINE simd::simd_u32x4 loadAligned(const i32 *arr, int i)
Definition chasing_spirals.cpp.hpp:93

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rf_quarter
const fl::i32 * rf_quarter
Definition chasing_spirals.cpp.hpp:43

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::lin0_raw
fl::i32 lin0_raw
Definition chasing_spirals.cpp.hpp:49

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::cy_raw
fl::i32 cy_raw
Definition chasing_spirals.cpp.hpp:48

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rf3
const fl::i32 * rf3
Definition chasing_spirals.cpp.hpp:41

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rad0_raw
fl::i32 rad0_raw
Definition chasing_spirals.cpp.hpp:52

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::lin2_raw
fl::i32 lin2_raw
Definition chasing_spirals.cpp.hpp:51

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::base_angle
const fl::i32 * base_angle
Definition chasing_spirals.cpp.hpp:39

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::pixel_idx
const fl::u16 * pixel_idx
Definition chasing_spirals.cpp.hpp:44

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::fade_lut
const fl::i32 * fade_lut
Definition chasing_spirals.cpp.hpp:45

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rf_half
const fl::i32 * rf_half
Definition chasing_spirals.cpp.hpp:42

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::perm
const fl::u8 * perm
Definition chasing_spirals.cpp.hpp:46

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::leds
fl::span< CRGB > leds
Definition chasing_spirals.cpp.hpp:55

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::dist_scaled
const fl::i32 * dist_scaled
Definition chasing_spirals.cpp.hpp:40

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::total_pixels
int total_pixels
Definition chasing_spirals.cpp.hpp:38

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rad2_raw
fl::i32 rad2_raw
Definition chasing_spirals.cpp.hpp:54

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::lin1_raw
fl::i32 lin1_raw
Definition chasing_spirals.cpp.hpp:50

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::rad1_raw
fl::i32 rad1_raw
Definition chasing_spirals.cpp.hpp:53

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup::cx_raw
fl::i32 cx_raw
Definition chasing_spirals.cpp.hpp:47

fl::anonymous_namespace{chasing_spirals.cpp.hpp}::FrameSetup
Definition chasing_spirals.cpp.hpp:37

fl::fl::u8
unsigned char u8
Definition s16x16x4.h:132

fl::fl::assume_aligned
T * assume_aligned(T *ptr) FL_NOEXCEPT
Definition s16x16x4.h:126

fl::simd::simd_u32x4
platforms::simd_u32x4 simd_u32x4
Definition types.h:26

fl::x
x
Definition transposition.cpp.hpp:24

fl::u8
unsigned char u8
Definition stdint.h:131

fl::CRGB
fl::CRGB CRGB
Definition video.h:15

fl::y
y
Definition transposition.cpp.hpp:23

fl::sincos32_simd
FASTLED_FORCE_INLINE SinCos32_simd sincos32_simd(simd::simd_u32x4 angles) FL_NOEXCEPT
Process 4 angles simultaneously, returning vectorized sin/cos values SIMD-optimized: vectorized angle...
Definition sin32.h:145

fl::FP_ONE
static constexpr i32 FP_ONE
Definition flowfield.cpp.hpp:484

fl::i64
fl::i64 i64
Definition s16x16x4.h:222

fl::fmodf
float fmodf(float x, float y) FL_NOEXCEPT
Definition math.h:336

fl::result
expected< T, E > result
Alias for expected (Rust-style naming)
Definition result.h:31

fl::sincos32
FASTLED_FORCE_INLINE SinCos32 sincos32(u32 angle) FL_NOEXCEPT
Definition sin32.h:88

fl
Base definition for an LED controller.
Definition crgb.hpp:179

fl::SinCos32::sin_val
i32 sin_val
Definition sin32.h:25

fl::SinCos32::cos_val
i32 cos_val
Definition sin32.h:26

fl::SinCos32
Definition sin32.h:24

perlin_float.h

perlin_s16x16_simd.h

FL_OPTIMIZATION_LEVEL_O3_BEGIN
#define FL_OPTIMIZATION_LEVEL_O3_BEGIN

FASTLED_FORCE_INLINE
#define FASTLED_FORCE_INLINE

FL_FAST_MATH_BEGIN
#define FL_FAST_MATH_BEGIN

FL_FAST_MATH_END
#define FL_FAST_MATH_END

FL_OPTIMIZATION_LEVEL_O3_END
#define FL_OPTIMIZATION_LEVEL_O3_END

simd.h
Umbrella header for SIMD subsystem.

sin32.h

fl::Context::mEngine
fl::unique_ptr< Engine > mEngine
Definition context.h:38

fl::Context
Definition context.h:24

fl::perlin_s16x16_simd::pnoise2d_raw_simd4_vec
static fl::simd::simd_u32x4 pnoise2d_raw_simd4_vec(fl::simd::simd_u32x4 nx_vec, fl::simd::simd_u32x4 ny_vec, const fl::i32 *fade_lut, const fl::u8 *perm)
Definition perlin_s16x16_simd.cpp.hpp:19

fl::perlin_s16x16::init_fade_lut
static void init_fade_lut(fl::i32 *table)
Definition perlin_s16x16.cpp.hpp:14

fl::perlin_s16x16
Definition perlin_s16x16.h:16