QuadBiquad_8h_source.html

 #pragma once

 #include <array>

 #include <arm_neon.h>

 #include <new>

 #include <stdlib.h>

 #include "Biquad.h"

 #include <stdio.h>


 class QuadBiquad

 {

 public:

         static unsigned int constexpr kNumFilters = 4;

         std::array<BiquadCoeffT<float>, kNumFilters> filters;


         QuadBiquad()

         {

                 if(size_t(this) & size_t(alignof(QuadBiquad) - 1))

                 {

                         fprintf(stderr, "QuadBiquad object is improperly aligned. Avoid heap allocation, use operator new or use -std=c++17\n");

                         std::bad_alloc e;

                         throw(e);

                 }

         }


         void* operator new(size_t sz) {

                 auto ptr = aligned_alloc(alignof(QuadBiquad), sz);

                 if(!ptr)

                 {

                         std::bad_alloc e;

                         throw(e);

                 }

                 return ptr;

         }


         int setup(const BiquadCoeff::Settings& settings);


         void update();


         void process(float data[kNumFilters])

         {

                 // See here https://developer.arm.com/architectures/instruction-sets/simd-isas/neon/intrinsics

                 // for more on ARM intrinsics

                 float32x4_t in = vld1q_f32(data);

                 // We need to do the following: (see Biquad::process)

                 // out = in * a0 + z1; (A)

                 // z1 = in * a1 + z2 - b1 * out; split into two(B, C):

                 // z2 = in * a2 - b2 * out; split into two(D, E):

                 // store the output (F)

                 // These are interleaved below to avoid NEON to stall while

                 // waiting for results.


                 // A: out = in * a0 + z1;

                 float32x4_t out = vmlaq_f32(z1, in, a0);

                 // B: z1 = in * a1 + z2;

                 z1 = vmlaq_f32(z2, in, a1);

                 // D: z2 = in * a2;

                 z2 = vmulq_f32(in, a2);

                 // F: store the output

                 vst1q_f32(data, out);

                 // C: z1 = z1 - b1 * out; ***

                 z1 = vmlaq_f32(z1, b1, out);

                 // E: z2 = z2 - b2 * out; ***

                 z2 = vmlaq_f32(z2, b2, out);

                 // ***: note that we inverted the sign of the b1 and b2 coefficients

                 // in update() and we use vmlaq instead of vmlsq here. This is

                 // because vmlaq seems to be slightly faster than vmlsq.

         }

 private:

         float32x4_t z1;

         float32x4_t z2;

         float32x4_t a0;

         float32x4_t a1;

         float32x4_t a2;

         float32x4_t b1;

         float32x4_t b2;

 };

 extern template class BiquadCoeffT<float>;

QuadBiquad::setup
int setup(const BiquadCoeff::Settings &settings)
Definition: Biquad.cpp:122

BiquadCoeff::Settings
Definition: Biquad.h:34

BiquadCoeffT
Definition: Biquad.h:47

QuadBiquad::update
void update()
Definition: Biquad.cpp:132

QuadBiquad::QuadBiquad
QuadBiquad()
Definition: QuadBiquad.h:36

QuadBiquad
Definition: QuadBiquad.h:15

QuadBiquad::process
void process(float data[kNumFilters])
Definition: QuadBiquad.h:79

QuadBiquad::filters
std::array< BiquadCoeffT< float >, kNumFilters > filters
Definition: QuadBiquad.h:26