次の SSSE 3 組み込み関数を乗算に使用します。
extern __m128i _mm_maddubs_epi16 (__m128i a, __m128i b);
符号付きバイトと符号なしバイトを乗算し、符号付きワードのペアを水平加算し、飽和された符号付きワードをパックします。
a を符号なし 8 ビット整数の配列、b を符号付き 8 ビット整数の配列、r を符号付き 16 ビット整数の配列として解釈します。
for (i = 0; i < 8; i++) {
r[i] = signed_saturate_to_word(a[2*i+1] * b[2*i+1] + a[2*i]*b[2*i]);
}
extern __m64 _mm_maddubs_pi16 (__m64 a, __m64 b);
符号付きバイトと符号なしバイトを乗算し、符号付きワードのペアを水平加算し、飽和された符号付きワードをパックします。
a を符号なし 8 ビット整数の配列、b を符号付き 8 ビット整数の配列、r を符号付き 16 ビット整数の配列として解釈します。
for (i = 0; i < 4; i++) {
r[i] = signed_saturate_to_word(a[2*i+1] * b[2*i+1] + a[2*i]*b[2*i]);
}
extern __m128i _mm_mulhrs_epi16 (__m128i a, __m128i b);
符号付きワードを乗算し、符号付きダブルワードをスケールして丸め、上位 16 ビットをパックします。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 8; i++) {
r[i] = (( (int32)((a[i] * b[i]) >> 14) + 1) >> 1) & 0xFFFF;
}
extern __m64 _mm_mulhrs_pi16 (__m64 a, __m64 b);
符号付きワードを乗算し、符号付きダブルワードをスケールして丸め、上位 16 ビットをパックします。
符号付き 16 ビット整数の配列として a、b、r を解釈します。
for (i = 0; i < 4; i++) {
r[i] = (( (int32)((a[i] * b[i]) >> 14) + 1) >> 1) & 0xFFFF;
}