25 #error "Never use <avx512vlintrin.h> directly; include <immintrin.h> instead."
28 #ifndef __AVX512VLINTRIN_H
29 #define __AVX512VLINTRIN_H
31 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl")))
32 #define __DEFAULT_FN_ATTRS_BOTH __attribute__((__always_inline__, __nodebug__, __target__("avx512vl, avx512bw")))
38 return (
__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
44 return (
__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
50 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
56 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
62 return (
__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
68 return (
__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
74 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
80 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
86 return (
__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
92 return (
__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
98 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
104 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
110 return (
__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
116 return (
__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
122 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
128 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
135 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
141 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
147 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
153 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
159 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
165 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
171 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
177 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
183 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
189 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
195 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
201 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
207 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
213 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
219 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
225 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
231 return (
__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
237 return (
__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
243 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
249 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
255 return (
__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
261 return (
__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
267 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
273 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
279 return (
__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
285 return (
__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
291 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
297 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
303 return (
__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
309 return (
__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
315 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
321 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
327 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
333 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
339 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
345 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
351 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
357 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
363 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
369 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
375 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
381 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
387 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
393 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
399 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
405 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
411 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
417 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
423 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
429 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
435 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
441 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
447 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
453 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
459 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
465 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
471 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
477 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
483 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
489 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
495 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
501 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
507 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
513 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
519 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
525 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
531 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
537 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
543 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
549 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
555 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
561 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
567 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
573 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
579 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
585 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
591 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
597 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
603 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
609 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
617 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
626 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
637 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
646 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
657 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
666 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
677 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
686 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
697 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
706 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
717 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
726 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
737 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
746 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
757 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
766 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
777 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
785 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
796 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
804 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
815 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
823 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
834 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
842 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
852 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
863 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
871 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
882 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
891 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
900 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
910 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
919 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
930 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
939 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
950 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
959 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
970 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
979 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
989 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
998 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
1009 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1018 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1029 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1038 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1049 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1057 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1068 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1076 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1087 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1095 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1106 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1114 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1125 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1134 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1144 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1153 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1164 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1173 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1184 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1193 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1200 #define _mm_cmp_epi32_mask(a, b, p) __extension__ ({ \
1201 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1202 (__v4si)(__m128i)(b), \
1203 (p), (__mmask8)-1); })
1205 #define _mm_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1206 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1207 (__v4si)(__m128i)(b), \
1208 (p), (__mmask8)(m)); })
1210 #define _mm_cmp_epu32_mask(a, b, p) __extension__ ({ \
1211 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1212 (__v4si)(__m128i)(b), \
1213 (p), (__mmask8)-1); })
1215 #define _mm_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1216 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1217 (__v4si)(__m128i)(b), \
1218 (p), (__mmask8)(m)); })
1220 #define _mm256_cmp_epi32_mask(a, b, p) __extension__ ({ \
1221 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1222 (__v8si)(__m256i)(b), \
1223 (p), (__mmask8)-1); })
1225 #define _mm256_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1226 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1227 (__v8si)(__m256i)(b), \
1228 (p), (__mmask8)(m)); })
1230 #define _mm256_cmp_epu32_mask(a, b, p) __extension__ ({ \
1231 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1232 (__v8si)(__m256i)(b), \
1233 (p), (__mmask8)-1); })
1235 #define _mm256_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1236 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1237 (__v8si)(__m256i)(b), \
1238 (p), (__mmask8)(m)); })
1240 #define _mm_cmp_epi64_mask(a, b, p) __extension__ ({ \
1241 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1242 (__v2di)(__m128i)(b), \
1243 (p), (__mmask8)-1); })
1245 #define _mm_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1246 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1247 (__v2di)(__m128i)(b), \
1248 (p), (__mmask8)(m)); })
1250 #define _mm_cmp_epu64_mask(a, b, p) __extension__ ({ \
1251 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1252 (__v2di)(__m128i)(b), \
1253 (p), (__mmask8)-1); })
1255 #define _mm_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1256 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1257 (__v2di)(__m128i)(b), \
1258 (p), (__mmask8)(m)); })
1260 #define _mm256_cmp_epi64_mask(a, b, p) __extension__ ({ \
1261 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1262 (__v4di)(__m256i)(b), \
1263 (p), (__mmask8)-1); })
1265 #define _mm256_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1266 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1267 (__v4di)(__m256i)(b), \
1268 (p), (__mmask8)(m)); })
1270 #define _mm256_cmp_epu64_mask(a, b, p) __extension__ ({ \
1271 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1272 (__v4di)(__m256i)(b), \
1273 (p), (__mmask8)-1); })
1275 #define _mm256_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1276 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1277 (__v4di)(__m256i)(b), \
1278 (p), (__mmask8)(m)); })
1280 #define _mm256_cmp_ps_mask(a, b, p) __extension__ ({ \
1281 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1282 (__v8sf)(__m256)(b), \
1283 (p), (__mmask8)-1); })
1285 #define _mm256_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1286 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1287 (__v8sf)(__m256)(b), \
1288 (p), (__mmask8)(m)); })
1290 #define _mm256_cmp_pd_mask(a, b, p) __extension__ ({ \
1291 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1292 (__v4df)(__m256)(b), \
1293 (p), (__mmask8)-1); })
1295 #define _mm256_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1296 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1297 (__v4df)(__m256)(b), \
1298 (p), (__mmask8)(m)); })
1300 #define _mm128_cmp_ps_mask(a, b, p) __extension__ ({ \
1301 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1302 (__v4sf)(__m128)(b), \
1303 (p), (__mmask8)-1); })
1305 #define _mm128_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1306 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1307 (__v4sf)(__m128)(b), \
1308 (p), (__mmask8)(m)); })
1310 #define _mm128_cmp_pd_mask(a, b, p) __extension__ ({ \
1311 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1312 (__v2df)(__m128)(b), \
1313 (p), (__mmask8)-1); })
1315 #define _mm128_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1316 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1317 (__v2df)(__m128)(b), \
1318 (p), (__mmask8)(m)); })
1323 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1332 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 ((__v2df) __A,
1341 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1350 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1359 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1368 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 (-(__v2df) __A,
1377 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1386 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1395 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1404 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 ((__v4df) __A,
1413 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1422 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1431 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1440 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 (-(__v4df) __A,
1449 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1458 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1467 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1476 return (__m128) __builtin_ia32_vfmaddps128_mask3 ((__v4sf) __A,
1485 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1494 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1503 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1512 return (__m128) __builtin_ia32_vfmaddps128_mask3 (-(__v4sf) __A,
1521 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1530 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1539 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1548 return (__m256) __builtin_ia32_vfmaddps256_mask3 ((__v8sf) __A,
1557 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1566 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1575 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1584 return (__m256) __builtin_ia32_vfmaddps256_mask3 (-(__v8sf) __A,
1593 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1602 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1611 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1620 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask3 ((__v2df) __A,
1630 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1640 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1649 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1659 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1668 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask3 ((__v4df) __A,
1678 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1688 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1697 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1707 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1716 return (__m128) __builtin_ia32_vfmaddsubps128_mask3 ((__v4sf) __A,
1725 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1734 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1743 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1753 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1762 return (__m256) __builtin_ia32_vfmaddsubps256_mask3 ((__v8sf) __A,
1771 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1780 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1789 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1798 return (__m128d) __builtin_ia32_vfmsubpd128_mask3 ((__v2df) __A,
1807 return (__m256d) __builtin_ia32_vfmsubpd256_mask3 ((__v4df) __A,
1816 return (__m128) __builtin_ia32_vfmsubps128_mask3 ((__v4sf) __A,
1825 return (__m256) __builtin_ia32_vfmsubps256_mask3 ((__v8sf) __A,
1834 return (__m128d) __builtin_ia32_vfmsubaddpd128_mask3 ((__v2df) __A,
1844 return (__m256d) __builtin_ia32_vfmsubaddpd256_mask3 ((__v4df) __A,
1854 return (__m128) __builtin_ia32_vfmsubaddps128_mask3 ((__v4sf) __A,
1863 return (__m256) __builtin_ia32_vfmsubaddps256_mask3 ((__v8sf) __A,
1872 return (__m128d) __builtin_ia32_vfnmaddpd128_mask ((__v2df) __A,
1881 return (__m256d) __builtin_ia32_vfnmaddpd256_mask ((__v4df) __A,
1890 return (__m128) __builtin_ia32_vfnmaddps128_mask ((__v4sf) __A,
1899 return (__m256) __builtin_ia32_vfnmaddps256_mask ((__v8sf) __A,
1908 return (__m128d) __builtin_ia32_vfnmsubpd128_mask ((__v2df) __A,
1917 return (__m128d) __builtin_ia32_vfnmsubpd128_mask3 ((__v2df) __A,
1926 return (__m256d) __builtin_ia32_vfnmsubpd256_mask ((__v4df) __A,
1935 return (__m256d) __builtin_ia32_vfnmsubpd256_mask3 ((__v4df) __A,
1944 return (__m128) __builtin_ia32_vfnmsubps128_mask ((__v4sf) __A,
1953 return (__m128) __builtin_ia32_vfnmsubps128_mask3 ((__v4sf) __A,
1962 return (__m256) __builtin_ia32_vfnmsubps256_mask ((__v8sf) __A,
1971 return (__m256) __builtin_ia32_vfnmsubps256_mask3 ((__v8sf) __A,
1979 return (__m128d) __builtin_ia32_addpd128_mask ((__v2df) __A,
1987 return (__m128d) __builtin_ia32_addpd128_mask ((__v2df) __A,
1996 return (__m256d) __builtin_ia32_addpd256_mask ((__v4df) __A,
2004 return (__m256d) __builtin_ia32_addpd256_mask ((__v4df) __A,
2013 return (__m128) __builtin_ia32_addps128_mask ((__v4sf) __A,
2021 return (__m128) __builtin_ia32_addps128_mask ((__v4sf) __A,
2030 return (__m256) __builtin_ia32_addps256_mask ((__v8sf) __A,
2038 return (__m256) __builtin_ia32_addps256_mask ((__v8sf) __A,
2047 return (__m128i) __builtin_ia32_blendmd_128_mask ((__v4si) __A,
2054 return (__m256i) __builtin_ia32_blendmd_256_mask ((__v8si) __A,
2061 return (__m128d) __builtin_ia32_blendmpd_128_mask ((__v2df) __A,
2068 return (__m256d) __builtin_ia32_blendmpd_256_mask ((__v4df) __A,
2075 return (__m128) __builtin_ia32_blendmps_128_mask ((__v4sf) __A,
2082 return (__m256) __builtin_ia32_blendmps_256_mask ((__v8sf) __A,
2089 return (__m128i) __builtin_ia32_blendmq_128_mask ((__v2di) __A,
2096 return (__m256i) __builtin_ia32_blendmq_256_mask ((__v4di) __A,
2103 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
2110 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
2118 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
2125 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
2133 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
2140 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
2148 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
2155 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
2163 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
2170 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
2178 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
2185 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
2193 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
2200 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
2208 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
2215 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
2223 __builtin_ia32_compressstoredf128_mask ((__v2df *) __P,
2230 __builtin_ia32_compressstoredf256_mask ((__v4df *) __P,
2237 __builtin_ia32_compressstoredi128_mask ((__v2di *) __P,
2244 __builtin_ia32_compressstoredi256_mask ((__v4di *) __P,
2251 __builtin_ia32_compressstoresf128_mask ((__v4sf *) __P,
2258 __builtin_ia32_compressstoresf256_mask ((__v8sf *) __P,
2265 __builtin_ia32_compressstoresi128_mask ((__v4si *) __P,
2272 __builtin_ia32_compressstoresi256_mask ((__v8si *) __P,
2279 return (__m128d) __builtin_ia32_cvtdq2pd128_mask ((__v4si) __A,
2286 return (__m128d) __builtin_ia32_cvtdq2pd128_mask ((__v4si) __A,
2294 return (__m256d) __builtin_ia32_cvtdq2pd256_mask ((__v4si) __A,
2301 return (__m256d) __builtin_ia32_cvtdq2pd256_mask ((__v4si) __A,
2309 return (__m128) __builtin_ia32_cvtdq2ps128_mask ((__v4si) __A,
2316 return (__m128) __builtin_ia32_cvtdq2ps128_mask ((__v4si) __A,
2324 return (__m256) __builtin_ia32_cvtdq2ps256_mask ((__v8si) __A,
2331 return (__m256) __builtin_ia32_cvtdq2ps256_mask ((__v8si) __A,
2339 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
2346 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
2354 return (__m128i) __builtin_ia32_cvtpd2dq256_mask ((__v4df) __A,
2361 return (__m128i) __builtin_ia32_cvtpd2dq256_mask ((__v4df) __A,
2369 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
2376 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
2384 return (__m128) __builtin_ia32_cvtpd2ps256_mask ((__v4df) __A,
2391 return (__m128) __builtin_ia32_cvtpd2ps256_mask ((__v4df) __A,
2399 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2407 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2414 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2422 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2430 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2437 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2445 return (__m128i) __builtin_ia32_cvtps2dq128_mask ((__v4sf) __A,
2452 return (__m128i) __builtin_ia32_cvtps2dq128_mask ((__v4sf) __A,
2460 return (__m256i) __builtin_ia32_cvtps2dq256_mask ((__v8sf) __A,
2467 return (__m256i) __builtin_ia32_cvtps2dq256_mask ((__v8sf) __A,
2475 return (__m128d) __builtin_ia32_cvtps2pd128_mask ((__v4sf) __A,
2482 return (__m128d) __builtin_ia32_cvtps2pd128_mask ((__v4sf) __A,
2490 return (__m256d) __builtin_ia32_cvtps2pd256_mask ((__v4sf) __A,
2497 return (__m256d) __builtin_ia32_cvtps2pd256_mask ((__v4sf) __A,
2505 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2513 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2520 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2528 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2536 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2543 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2551 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2558 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2566 return (__m128i) __builtin_ia32_cvttpd2dq256_mask ((__v4df) __A,
2573 return (__m128i) __builtin_ia32_cvttpd2dq256_mask ((__v4df) __A,
2581 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2589 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2596 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2604 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2612 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2619 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2627 return (__m128i) __builtin_ia32_cvttps2dq128_mask ((__v4sf) __A,
2634 return (__m128i) __builtin_ia32_cvttps2dq128_mask ((__v4sf) __A,
2642 return (__m256i) __builtin_ia32_cvttps2dq256_mask ((__v8sf) __A,
2649 return (__m256i) __builtin_ia32_cvttps2dq256_mask ((__v8sf) __A,
2657 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2665 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2672 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2680 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2688 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2695 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2703 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2711 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2718 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2726 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2734 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2741 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2749 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2757 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2764 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2772 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2780 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2787 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2795 return (__m128d) __builtin_ia32_divpd_mask ((__v2df) __A,
2803 return (__m128d) __builtin_ia32_divpd_mask ((__v2df) __A,
2813 return (__m256d) __builtin_ia32_divpd256_mask ((__v4df) __A,
2821 return (__m256d) __builtin_ia32_divpd256_mask ((__v4df) __A,
2830 return (__m128) __builtin_ia32_divps_mask ((__v4sf) __A,
2838 return (__m128) __builtin_ia32_divps_mask ((__v4sf) __A,
2847 return (__m256) __builtin_ia32_divps256_mask ((__v8sf) __A,
2855 return (__m256) __builtin_ia32_divps256_mask ((__v8sf) __A,
2864 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2871 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2879 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2886 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2894 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2901 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2909 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2916 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2924 return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
2932 return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
2941 return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
2949 return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
2958 return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
2966 return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
2976 return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
2984 return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
2993 return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
3000 return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
3009 return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
3016 return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
3025 return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
3033 return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
3042 return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
3050 return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
3059 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
3066 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
3074 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
3081 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
3089 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
3096 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
3104 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
3111 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
3119 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3127 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3134 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3142 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3150 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3157 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3165 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3173 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3180 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3188 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3196 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3203 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3211 return (__m128d) __builtin_ia32_maxpd_mask ((__v2df) __A,
3219 return (__m128d) __builtin_ia32_maxpd_mask ((__v2df) __A,
3229 return (__m256d) __builtin_ia32_maxpd256_mask ((__v4df) __A,
3237 return (__m256d) __builtin_ia32_maxpd256_mask ((__v4df) __A,
3246 return (__m128) __builtin_ia32_maxps_mask ((__v4sf) __A,
3254 return (__m128) __builtin_ia32_maxps_mask ((__v4sf) __A,
3263 return (__m256) __builtin_ia32_maxps256_mask ((__v8sf) __A,
3271 return (__m256) __builtin_ia32_maxps256_mask ((__v8sf) __A,
3280 return (__m128d) __builtin_ia32_minpd_mask ((__v2df) __A,
3288 return (__m128d) __builtin_ia32_minpd_mask ((__v2df) __A,
3298 return (__m256d) __builtin_ia32_minpd256_mask ((__v4df) __A,
3306 return (__m256d) __builtin_ia32_minpd256_mask ((__v4df) __A,
3315 return (__m128) __builtin_ia32_minps_mask ((__v4sf) __A,
3323 return (__m128) __builtin_ia32_minps_mask ((__v4sf) __A,
3332 return (__m256) __builtin_ia32_minps256_mask ((__v8sf) __A,
3340 return (__m256) __builtin_ia32_minps256_mask ((__v8sf) __A,
3349 return (__m128d) __builtin_ia32_mulpd_mask ((__v2df) __A,
3357 return (__m128d) __builtin_ia32_mulpd_mask ((__v2df) __A,
3367 return (__m256d) __builtin_ia32_mulpd256_mask ((__v4df) __A,
3375 return (__m256d) __builtin_ia32_mulpd256_mask ((__v4df) __A,
3384 return (__m128) __builtin_ia32_mulps_mask ((__v4sf) __A,
3392 return (__m128) __builtin_ia32_mulps_mask ((__v4sf) __A,
3401 return (__m256) __builtin_ia32_mulps256_mask ((__v8sf) __A,
3409 return (__m256) __builtin_ia32_mulps256_mask ((__v8sf) __A,
3418 return (__m128i) __builtin_ia32_pabsd128_mask ((__v4si) __A,
3425 return (__m128i) __builtin_ia32_pabsd128_mask ((__v4si) __A,
3433 return (__m256i) __builtin_ia32_pabsd256_mask ((__v8si) __A,
3440 return (__m256i) __builtin_ia32_pabsd256_mask ((__v8si) __A,
3448 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3456 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3463 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3471 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3479 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3486 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3494 return (__m128i) __builtin_ia32_pmaxsd128_mask ((__v4si) __A,
3504 return (__m128i) __builtin_ia32_pmaxsd128_mask ((__v4si) __A,
3511 return (__m256i) __builtin_ia32_pmaxsd256_mask ((__v8si) __A,
3521 return (__m256i) __builtin_ia32_pmaxsd256_mask ((__v8si) __A,
3528 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3538 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3545 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3554 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3564 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3571 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3580 return (__m128i) __builtin_ia32_pmaxud128_mask ((__v4si) __A,
3590 return (__m128i) __builtin_ia32_pmaxud128_mask ((__v4si) __A,
3597 return (__m256i) __builtin_ia32_pmaxud256_mask ((__v8si) __A,
3607 return (__m256i) __builtin_ia32_pmaxud256_mask ((__v8si) __A,
3614 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3623 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3633 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3640 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3649 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3659 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3666 return (__m128i) __builtin_ia32_pminsd128_mask ((__v4si) __A,
3676 return (__m128i) __builtin_ia32_pminsd128_mask ((__v4si) __A,
3683 return (__m256i) __builtin_ia32_pminsd256_mask ((__v8si) __A,
3693 return (__m256i) __builtin_ia32_pminsd256_mask ((__v8si) __A,
3700 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3710 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3717 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3726 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3736 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3743 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3752 return (__m128i) __builtin_ia32_pminud128_mask ((__v4si) __A,
3762 return (__m128i) __builtin_ia32_pminud128_mask ((__v4si) __A,
3769 return (__m256i) __builtin_ia32_pminud256_mask ((__v8si) __A,
3779 return (__m256i) __builtin_ia32_pminud256_mask ((__v8si) __A,
3786 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3796 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3803 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3812 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3822 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3829 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3836 #define _mm_roundscale_pd(__A, __imm) __extension__ ({ \
3837 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, \
3838 __imm, (__v2df) _mm_setzero_pd (), (__mmask8) -1); })
3841 #define _mm_mask_roundscale_pd(__W, __U, __A, __imm) __extension__ ({ \
3842 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, __imm, \
3843 (__v2df) __W, (__mmask8) __U); })
3846 #define _mm_maskz_roundscale_pd(__U, __A, __imm) __extension__ ({ \
3847 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, __imm, \
3848 (__v2df) _mm_setzero_pd (), (__mmask8) __U); })
3851 #define _mm256_roundscale_pd(__A, __imm) __extension__ ({ \
3852 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3853 (__v4df) _mm256_setzero_pd (), (__mmask8) -1); })
3856 #define _mm256_mask_roundscale_pd(__W, __U, __A, __imm) __extension__ ({ \
3857 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3858 (__v4df) __W, (__mmask8) __U); })
3861 #define _mm256_maskz_roundscale_pd(__U, __A, __imm) __extension__ ({ \
3862 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3863 (__v4df) _mm256_setzero_pd(), (__mmask8) __U); })
3865 #define _mm_roundscale_ps(__A, __imm) __extension__ ({ \
3866 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3867 (__v4sf) _mm_setzero_ps(), (__mmask8) -1); })
3870 #define _mm_mask_roundscale_ps(__W, __U, __A, __imm) __extension__ ({ \
3871 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3872 (__v4sf) __W, (__mmask8) __U); })
3875 #define _mm_maskz_roundscale_ps(__U, __A, __imm) __extension__ ({ \
3876 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3877 (__v4sf) _mm_setzero_ps(), (__mmask8) __U); })
3879 #define _mm256_roundscale_ps(__A, __imm) __extension__ ({ \
3880 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A,__imm, \
3881 (__v8sf) _mm256_setzero_ps(), (__mmask8) -1); })
3883 #define _mm256_mask_roundscale_ps(__W, __U, __A,__imm) __extension__ ({ \
3884 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A, __imm, \
3885 (__v8sf) __W, (__mmask8) __U); })
3888 #define _mm256_maskz_roundscale_ps(__U, __A, __imm) __extension__ ({ \
3889 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A, __imm, \
3890 (__v8sf) _mm256_setzero_ps(), (__mmask8) __U); })
3894 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3904 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3912 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3921 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3931 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3939 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3948 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3957 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3965 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3974 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3984 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3992 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3999 #define _mm_i64scatter_pd(__addr,__index, __v1, __scale) __extension__ ({ \
4000 __builtin_ia32_scatterdiv2df(__addr, (__mmask8) 0xFF, (__v2di) __index, \
4001 (__v2df) __v1, __scale); })
4003 #define _mm_mask_i64scatter_pd(__addr, __mask, __index, __v1, \
4004 __scale) __extension__ ({ \
4005 __builtin_ia32_scatterdiv2df (__addr, __mask, (__v2di) __index, \
4006 (__v2df) __v1, __scale); })
4009 #define _mm_i64scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4010 __builtin_ia32_scatterdiv2di (__addr, (__mmask8) 0xFF, \
4011 (__v2di) __index, (__v2di) __v1, __scale); })
4013 #define _mm_mask_i64scatter_epi64(__addr, __mask, __index, __v1,\
4014 __scale) __extension__ ({ \
4015 __builtin_ia32_scatterdiv2di (__addr, __mask, (__v2di) __index,\
4016 (__v2di) __v1, __scale); })
4018 #define _mm256_i64scatter_pd(__addr, __index, __v1, __scale) __extension__ ({ \
4019 __builtin_ia32_scatterdiv4df (__addr, (__mmask8) 0xFF,\
4020 (__v4di) __index, (__v4df) __v1, __scale); })
4022 #define _mm256_mask_i64scatter_pd(__addr, __mask, __index, __v1,\
4023 __scale) __extension__ ({ \
4024 __builtin_ia32_scatterdiv4df (__addr, __mask, (__v4di) __index,\
4025 (__v4df) __v1, __scale); })
4027 #define _mm256_i64scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4028 __builtin_ia32_scatterdiv4di (__addr, (__mmask8) 0xFF, (__v4di) __index,\
4029 (__v4di) __v1, __scale); })
4031 #define _mm256_mask_i64scatter_epi64(__addr, __mask, __index, __v1,\
4032 __scale) __extension__ ({ \
4033 __builtin_ia32_scatterdiv4di (__addr, __mask, (__v4di) __index,\
4034 (__v4di) __v1, __scale); })
4036 #define _mm_i64scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4037 __builtin_ia32_scatterdiv4sf (__addr, (__mmask8) 0xFF,\
4038 (__v2di) __index, (__v4sf) __v1, __scale); })
4040 #define _mm_mask_i64scatter_ps(__addr, __mask, __index, __v1, \
4041 __scale) __extension__ ({ \
4042 __builtin_ia32_scatterdiv4sf (__addr, __mask, (__v2di) __index,\
4043 (__v4sf) __v1, __scale); })
4045 #define _mm_i64scatter_epi32(__addr, __index, __v1, \
4046 __scale) __extension__ ({ \
4047 __builtin_ia32_scatterdiv4si (__addr, (__mmask8) 0xFF,\
4048 (__v2di) __index, (__v4si) __v1, __scale); })
4050 #define _mm_mask_i64scatter_epi32(__addr, __mask, __index, __v1,\
4051 __scale) __extension__ ({ \
4052 __builtin_ia32_scatterdiv4si (__addr, __mask, (__v2di) __index,\
4053 (__v4si) __v1, __scale); })
4055 #define _mm256_i64scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4056 __builtin_ia32_scatterdiv8sf (__addr, (__mmask8) 0xFF, (__v4di) __index, \
4057 (__v4sf) __v1, __scale); })
4059 #define _mm256_mask_i64scatter_ps(__addr, __mask, __index, __v1, \
4060 __scale) __extension__ ({ \
4061 __builtin_ia32_scatterdiv8sf (__addr, __mask, (__v4di) __index, \
4062 (__v4sf) __v1, __scale); })
4064 #define _mm256_i64scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4065 __builtin_ia32_scatterdiv8si (__addr, (__mmask8) 0xFF, \
4066 (__v4di) __index, (__v4si) __v1, __scale); })
4068 #define _mm256_mask_i64scatter_epi32(__addr, __mask, __index, __v1, \
4069 __scale) __extension__ ({ \
4070 __builtin_ia32_scatterdiv8si(__addr, __mask, (__v4di) __index, \
4071 (__v4si) __v1, __scale); })
4073 #define _mm_i32scatter_pd(__addr, __index, __v1, \
4074 __scale) __extension__ ({ \
4075 __builtin_ia32_scattersiv2df (__addr, (__mmask8) 0xFF, \
4076 (__v4si) __index, (__v2df) __v1, __scale); })
4078 #define _mm_mask_i32scatter_pd(__addr, __mask, __index, __v1, \
4079 __scale) __extension__ ({ \
4080 __builtin_ia32_scattersiv2df (__addr, __mask, (__v4si) __index,\
4081 (__v2df) __v1, __scale); })
4083 #define _mm_i32scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4084 __builtin_ia32_scattersiv2di (__addr, (__mmask8) 0xFF, \
4085 (__v4si) __index, (__v2di) __v1, __scale); })
4087 #define _mm_mask_i32scatter_epi64(__addr, __mask, __index, __v1, \
4088 __scale) __extension__ ({ \
4089 __builtin_ia32_scattersiv2di (__addr, __mask, (__v4si) __index, \
4090 (__v2di) __v1, __scale); })
4092 #define _mm256_i32scatter_pd(__addr, __index, __v1, __scale) __extension__ ({ \
4093 __builtin_ia32_scattersiv4df (__addr, (__mmask8) 0xFF, \
4094 (__v4si) __index, (__v4df) __v1, __scale); })
4096 #define _mm256_mask_i32scatter_pd(__addr, __mask, __index, __v1, \
4097 __scale) __extension__ ({ \
4098 __builtin_ia32_scattersiv4df (__addr, __mask, (__v4si) __index, \
4099 (__v4df) __v1, __scale); })
4101 #define _mm256_i32scatter_epi64(__addr, __index, __v1, \
4102 __scale) __extension__ ({ \
4103 __builtin_ia32_scattersiv4di (__addr, (__mmask8) 0xFF, \
4104 (__v4si) __index, (__v4di) __v1, __scale); })
4106 #define _mm256_mask_i32scatter_epi64(__addr, __mask, __index, __v1, \
4107 __scale) __extension__ ({ \
4108 __builtin_ia32_scattersiv4di (__addr, __mask, (__v4si) __index, \
4109 (__v4di) __v1, __scale); })
4111 #define _mm_i32scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4112 __builtin_ia32_scattersiv4sf (__addr, (__mmask8) 0xFF, \
4113 (__v4si) __index, (__v4sf) __v1, __scale); })
4115 #define _mm_mask_i32scatter_ps(__addr, __mask, __index, __v1, \
4116 __scale) __extension__ ({ \
4117 __builtin_ia32_scattersiv4sf (__addr, __mask, (__v4si) __index, \
4118 (__v4sf) __v1, __scale); })
4120 #define _mm_i32scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4121 __builtin_ia32_scattersiv4si (__addr, (__mmask8) 0xFF, \
4122 (__v4si) __index, (__v4si) __v1, __scale); })
4124 #define _mm_mask_i32scatter_epi32(__addr, __mask, __index, __v1, \
4125 __scale) __extension__ ({ \
4126 __builtin_ia32_scattersiv4si (__addr, __mask, (__v4si) __index,\
4127 (__v4si) __v1, __scale); })
4129 #define _mm256_i32scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4130 __builtin_ia32_scattersiv8sf (__addr, (__mmask8) 0xFF, \
4131 (__v8si) __index, (__v8sf) __v1, __scale); })
4133 #define _mm256_mask_i32scatter_ps(__addr, __mask, __index, __v1, \
4134 __scale) __extension__ ({ \
4135 __builtin_ia32_scattersiv8sf (__addr, __mask, (__v8si) __index,\
4136 (__v8sf) __v1, __scale); })
4138 #define _mm256_i32scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4139 __builtin_ia32_scattersiv8si (__addr, (__mmask8) 0xFF, \
4140 (__v8si) __index, (__v8si) __v1, __scale); })
4142 #define _mm256_mask_i32scatter_epi32(__addr, __mask, __index, __v1, \
4143 __scale) __extension__ ({ \
4144 __builtin_ia32_scattersiv8si (__addr, __mask, (__v8si) __index, \
4145 (__v8si) __v1, __scale); })
4149 return (__m128d) __builtin_ia32_sqrtpd128_mask ((__v2df) __A,
4156 return (__m128d) __builtin_ia32_sqrtpd128_mask ((__v2df) __A,
4164 return (__m256d) __builtin_ia32_sqrtpd256_mask ((__v4df) __A,
4171 return (__m256d) __builtin_ia32_sqrtpd256_mask ((__v4df) __A,
4179 return (__m128) __builtin_ia32_sqrtps128_mask ((__v4sf) __A,
4186 return (__m128) __builtin_ia32_sqrtps128_mask ((__v4sf) __A,
4194 return (__m256) __builtin_ia32_sqrtps256_mask ((__v8sf) __A,
4201 return (__m256) __builtin_ia32_sqrtps256_mask ((__v8sf) __A,
4209 return (__m128d) __builtin_ia32_subpd128_mask ((__v2df) __A,
4217 return (__m128d) __builtin_ia32_subpd128_mask ((__v2df) __A,
4227 return (__m256d) __builtin_ia32_subpd256_mask ((__v4df) __A,
4235 return (__m256d) __builtin_ia32_subpd256_mask ((__v4df) __A,
4244 return (__m128) __builtin_ia32_subps128_mask ((__v4sf) __A,
4252 return (__m128) __builtin_ia32_subps128_mask ((__v4sf) __A,
4261 return (__m256) __builtin_ia32_subps256_mask ((__v8sf) __A,
4269 return (__m256) __builtin_ia32_subps256_mask ((__v8sf) __A,
4279 return (__m128i) __builtin_ia32_vpermi2vard128_mask ((__v4si) __A,
4289 return (__m256i) __builtin_ia32_vpermi2vard256_mask ((__v8si) __A,
4299 return (__m128d) __builtin_ia32_vpermi2varpd128_mask ((__v2df) __A,
4310 return (__m256d) __builtin_ia32_vpermi2varpd256_mask ((__v4df) __A,
4321 return (__m128) __builtin_ia32_vpermi2varps128_mask ((__v4sf) __A,
4331 return (__m256) __builtin_ia32_vpermi2varps256_mask ((__v8sf) __A,
4341 return (__m128i) __builtin_ia32_vpermi2varq128_mask ((__v2di) __A,
4351 return (__m256i) __builtin_ia32_vpermi2varq256_mask ((__v4di) __A,
4360 return (__m128i) __builtin_ia32_vpermt2vard128_mask ((__v4si) __I
4370 return (__m128i) __builtin_ia32_vpermt2vard128_mask ((__v4si) __I
4380 return (__m128i) __builtin_ia32_vpermt2vard128_maskz ((__v4si) __I
4390 return (__m256i) __builtin_ia32_vpermt2vard256_mask ((__v8si) __I
4400 return (__m256i) __builtin_ia32_vpermt2vard256_mask ((__v8si) __I
4409 __m256i __I, __m256i __B) {
4410 return (__m256i) __builtin_ia32_vpermt2vard256_maskz ((__v8si) __I
4420 return (__m128d) __builtin_ia32_vpermt2varpd128_mask ((__v2di) __I
4431 return (__m128d) __builtin_ia32_vpermt2varpd128_mask ((__v2di) __I
4442 return (__m128d) __builtin_ia32_vpermt2varpd128_maskz ((__v2di) __I
4452 return (__m256d) __builtin_ia32_vpermt2varpd256_mask ((__v4di) __I
4463 return (__m256d) __builtin_ia32_vpermt2varpd256_mask ((__v4di) __I
4474 return (__m256d) __builtin_ia32_vpermt2varpd256_maskz ((__v4di) __I
4484 return (__m128) __builtin_ia32_vpermt2varps128_mask ((__v4si) __I
4494 return (__m128) __builtin_ia32_vpermt2varps128_mask ((__v4si) __I
4504 return (__m128) __builtin_ia32_vpermt2varps128_maskz ((__v4si) __I
4514 return (__m256) __builtin_ia32_vpermt2varps256_mask ((__v8si) __I
4524 return (__m256) __builtin_ia32_vpermt2varps256_mask ((__v8si) __I
4534 return (__m256) __builtin_ia32_vpermt2varps256_maskz ((__v8si) __I
4544 return (__m128i) __builtin_ia32_vpermt2varq128_mask ((__v2di) __I
4554 return (__m128i) __builtin_ia32_vpermt2varq128_mask ((__v2di) __I
4564 return (__m128i) __builtin_ia32_vpermt2varq128_maskz ((__v2di) __I
4575 return (__m256i) __builtin_ia32_vpermt2varq256_mask ((__v4di) __I
4585 return (__m256i) __builtin_ia32_vpermt2varq256_mask ((__v4di) __I
4594 __m256i __I, __m256i __B) {
4595 return (__m256i) __builtin_ia32_vpermt2varq256_maskz ((__v4di) __I
4603 #undef __DEFAULT_FN_ATTRS
4604 #undef __DEFAULT_FN_ATTRS_BOTH
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_scalef_pd(__m256d __A, __m256d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_expandloadu_pd(__m128d __W, __mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_abs_epi64(__mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_mask_cmpeq_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpneq_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmplt_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_blend_pd(__mmask8 __U, __m128d __A, __m128d __W)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmple_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmplt_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_expand_epi64(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmple_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_expand_epi32(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_sub_ps(__m128 __W, __mmask16 __U, __m128 __A, __m128 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmple_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_expand_epi32(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_abs_epi64(__m256i __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline __m256 __DEFAULT_FN_ATTRS _mm256_setzero_ps(void)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpeq_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_scalef_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmple_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpeq_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_expand_epi64(__mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_mul_epu32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_mul_epu32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpgt_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_cvtps_pd(__m256d __W, __mmask8 __U, __m128 __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_cvttps_epu32(__mmask8 __U, __m256 __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_scalef_ps(__mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_cvttps_epu32(__m256i __W, __mmask8 __U, __m256 __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m128d __A)
#define __DEFAULT_FN_ATTRS_BOTH
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_getexp_ps(__mmask8 __U, __m128 __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpneq_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_min_epu64(__m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_mask_cmpgt_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpgt_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmplt_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_getexp_pd(__m128d __W, __mmask8 __U, __m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_expandloadu_pd(__mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_compress_epi32(__mmask8 __U, __m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmplt_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpge_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_mask_cmpeq_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_max_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpge_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_cvtepi32_ps(__mmask16 __U, __m128i __A)
static __inline__ void __DEFAULT_FN_ATTRS _mm256_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m256i __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_cvtps_pd(__mmask8 __U, __m128 __A)
static __inline__ void __DEFAULT_FN_ATTRS _mm256_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_cvtps_epu32(__mmask8 __U, __m256 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpge_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_cvtepi32_pd(__m128d __W, __mmask8 __U, __m128i __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmplt_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm256_maskz_cvtpd_ps(__mmask8 __U, __m256d __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_getexp_pd(__mmask8 __U, __m128d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpneq_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_max_epu64(__m256i __A, __m256i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_cmpgt_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_max_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_cvttpd_epu32(__m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_min_epu64(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_add_ps(__mmask16 __U, __m256 __A, __m256 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_maskz_cvtpd_epi32(__mmask8 __U, __m256d __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_expandloadu_ps(__m128 __W, __mmask8 __U, void const *__P)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpneq_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmplt_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_min_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_compress_ps(__mmask8 __U, __m256 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvttpd_epu32(__mmask8 __U, __m128d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_cvtps_epu32(__m128 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_min_epu64(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_cvttps_epu32(__m256 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpge_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpgt_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpeq_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_getexp_pd(__m256d __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_max_epi64(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmple_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_maskz_cvttpd_epi32(__mmask8 __U, __m256d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmplt_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvttps_epu32(__m128i __W, __mmask8 __U, __m128 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_add_ps(__mmask16 __U, __m128 __A, __m128 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpeq_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_blend_ps(__mmask8 __U, __m256 __A, __m256 __W)
static __inline__ void __DEFAULT_FN_ATTRS _mm256_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m256 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_cmpeq_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_cvtepi32_ps(__mmask16 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmple_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_scalef_ps(__m128 __A, __m128 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_or_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_cvtepu32_pd(__m128d __W, __mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m256d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_add_ps(__m128 __W, __mmask16 __U, __m128 __A, __m128 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_andnot_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_mullo_epi32(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpneq_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_expandloadu_epi64(__m128i __W, __mmask8 __U, void const *__P)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_expand_ps(__m128 __W, __mmask8 __U, __m128 __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_getexp_pd(__mmask8 __U, __m256d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpneq_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_max_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpneq_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ void __DEFAULT_FN_ATTRS _mm_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m128 __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_min_epi64(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_mul_epi32(__mmask8 __M, __m128i __X, __m128i __Y)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_cvtepu32_ps(__m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_compress_ps(__m256 __W, __mmask8 __U, __m256 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_getexp_ps(__mmask8 __U, __m256 __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_expand_ps(__mmask8 __U, __m256 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmple_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmple_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpneq_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_abs_epi64(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpgt_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_max_epu64(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_min_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_compress_epi32(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_cvtps_epu32(__m256 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_max_epi64(__m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpeq_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_scalef_pd(__m128d __A, __m128d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_blend_epi64(__mmask8 __U, __m128i __A, __m128i __W)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_cmpeq_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_cvtepu32_pd(__m128i __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_getexp_pd(__m256d __W, __mmask8 __U, __m256d __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m128d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_cvtpd_ps(__mmask8 __U, __m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_setzero_ps(void)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ void __DEFAULT_FN_ATTRS _mm_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m256d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_cvttps_epi32(__m256i __W, __mmask8 __U, __m256 __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvtpd_epu32(__mmask8 __U, __m128d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_setzero_pd(void)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_cmpeq_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_cvttpd_epu32(__m128d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpeq_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmplt_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m128d __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_mask_cmpgt_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_maskz_cvttpd_epu32(__mmask8 __U, __m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_expandloadu_epi32(__mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_expand_epi64(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_expandloadu_epi32(__m256i __W, __mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_expandloadu_epi64(__m256i __W, __mmask8 __U, void const *__P)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_sub_ps(__mmask16 __U, __m128 __A, __m128 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_expandloadu_epi64(__mmask8 __U, void const *__P)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_compress_pd(__mmask8 __U, __m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m128d __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_compress_ps(__m128 __W, __mmask8 __U, __m128 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvttps_epi32(__m128i __W, __mmask8 __U, __m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpneq_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_abs_epi64(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_mul_epu32(__mmask8 __M, __m256i __X, __m256i __Y)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvtps_epi32(__m128i __W, __mmask8 __U, __m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpneq_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_sub_ps(__m256 __W, __mmask16 __U, __m256 __A, __m256 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmplt_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_expand_ps(__m256 __W, __mmask8 __U, __m256 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_scalef_ps(__mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpge_epi32_mask(__m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_cvtps_pd(__mmask8 __U, __m128 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmplt_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpge_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmple_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_max_epu64(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_cvtpd_epu32(__m256d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpge_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvtps_epu32(__mmask8 __U, __m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpneq_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpge_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvttpd_epi32(__mmask8 __U, __m128d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmplt_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_cvtpd_epu32(__m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static vector float vector float __b
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_blend_epi32(__mmask8 __U, __m256i __A, __m256i __W)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_mask_cmpeq_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_blend_pd(__mmask8 __U, __m256d __A, __m256d __W)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvtpd_epi32(__mmask8 __U, __m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_scalef_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_cmpeq_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_min_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_compress_epi64(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_cmpgt_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_abs_epi32(__mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_abs_epi64(__mmask8 __U, __m128i __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_cvtepi32_pd(__m256d __W, __mmask8 __U, __m128i __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmplt_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_expandloadu_pd(__m256d __W, __mmask8 __U, void const *__P)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpneq_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_expand_pd(__m128d __W, __mmask8 __U, __m128d __A)
#define __DEFAULT_FN_ATTRS
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_add_ps(__m256 __W, __mmask16 __U, __m256 __A, __m256 __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_min_epi64(__m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_expandloadu_epi64(__mmask8 __U, void const *__P)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_min_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_mask_cmpgt_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_abs_epi64(__m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmple_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_max_epu64(__m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m256d __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_scalef_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_cvtps_epi32(__m256i __W, __mmask8 __U, __m256 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_expandloadu_pd(__mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_getexp_ps(__m256 __W, __mmask8 __U, __m256 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_mul_epu32(__mmask8 __M, __m128i __X, __m128i __Y)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_cvtepu32_pd(__m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpeq_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_scalef_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_min_epi64(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_compress_pd(__m128d __W, __mmask8 __U, __m128d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm256_cmpgt_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_blend_ps(__mmask8 __U, __m128 __A, __m128 __W)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm256_maskz_cvtpd_epu32(__mmask8 __U, __m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_cvtps_epu32(__m128i __W, __mmask8 __U, __m128 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_compress_ps(__mmask8 __U, __m128 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_expandloadu_epi32(__m128i __W, __mmask8 __U, void const *__P)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_cmpgt_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmple_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpneq_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpge_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmple_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpge_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_scalef_ps(__m256 __A, __m256 __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_mul_epi32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_mul_epi32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_setzero_si128(void)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_cvttps_epu32(__m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_mask_cmpgt_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_min_epi64(__m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvtps_epi32(__mmask8 __U, __m128 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_expand_epi32(__mmask8 __U, __m128i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_expand_pd(__mmask8 __U, __m128d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmplt_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_cvtepu32_ps(__m256i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_cvtps_pd(__m128d __W, __mmask8 __U, __m128 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpge_epi32_mask(__m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_expand_ps(__mmask8 __U, __m128 __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_sub_ps(__mmask16 __U, __m256 __A, __m256 __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_compress_epi64(__mmask8 __U, __m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpge_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpge_epu64_mask(__m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_expand_epi32(__mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvttps_epu32(__mmask8 __U, __m128 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpneq_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_expandloadu_ps(__m256 __W, __mmask8 __U, void const *__P)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS_BOTH _mm_mask_cmpeq_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ void __DEFAULT_FN_ATTRS _mm_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m128d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_compress_epi64(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmple_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmplt_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_cvtps_epi32(__mmask8 __U, __m256 __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpge_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpge_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_compress_epi32(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpgt_epu64_mask(__m256i __a, __m256i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmplt_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_scalef_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_expand_pd(__m256d __W, __mmask8 __U, __m256d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_cvtps_epu32(__m256i __W, __mmask8 __U, __m256 __A)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_getexp_ps(__m128 __W, __mmask8 __U, __m128 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpgt_epu32_mask(__m128i __a, __m128i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A)
static __inline__ void __DEFAULT_FN_ATTRS _mm256_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m256i __A)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_min_epu64(__m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_compress_epi32(__mmask8 __U, __m256i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_expandloadu_epi32(__mmask8 __U, void const *__P)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_mul_epi32(__mmask8 __M, __m256i __X, __m256i __Y)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_compress_pd(__m256d __W, __mmask8 __U, __m256d __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmple_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_cvttps_epi32(__mmask8 __U, __m256 __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline __m256d __DEFAULT_FN_ATTRS _mm256_setzero_pd(void)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_blend_epi32(__mmask8 __U, __m128i __A, __m128i __W)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_maskz_expandloadu_ps(__mmask8 __U, void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_max_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_expandloadu_ps(__mmask8 __U, void const *__P)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_compress_pd(__mmask8 __U, __m256d __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpgt_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_expand_epi64(__mmask8 __U, __m128i __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_getexp_ps(__m128 __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_maskz_expand_pd(__mmask8 __U, __m256d __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmple_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpeq_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_max_epi64(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_blend_epi64(__mmask8 __U, __m256i __A, __m256i __W)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_getexp_ps(__m256 __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmpneq_epu32_mask(__m256i __a, __m256i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_max_epi64(__m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_compress_epi64(__mmask8 __U, __m256i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmpgt_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_mask_cmpneq_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_scalef_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_mask_cmplt_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_getexp_pd(__m128d __A)
static __inline__ __m256d __DEFAULT_FN_ATTRS _mm256_mask_cvtepu32_pd(__m256d __W, __mmask8 __U, __m128i __A)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm_cmpge_epi64_mask(__m128i __a, __m128i __b)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
static __inline__ __m128 __DEFAULT_FN_ATTRS _mm256_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m256d __A)
static __inline__ __m256 __DEFAULT_FN_ATTRS _mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
static __inline__ __mmask8 __DEFAULT_FN_ATTRS _mm256_cmple_epi64_mask(__m256i __a, __m256i __b)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_cvttps_epi32(__mmask8 __U, __m128 __A)