OSDN Git Service

2007-05-22 H.J. Lu <hongjiu.lu@intel.com>
[pf3gnuchains/gcc-fork.git] / gcc / testsuite / gcc.target / i386 / sse4_1-dpps-1.c
1 /* { dg-do run { target i?86-*-* x86_64-*-* } } */
2 /* { dg-require-effective-target sse4 } */
3 /* { dg-options "-O2 -msse4.1" } */
4
5 #include "sse4_1-check.h"
6
7 #include <smmintrin.h>
8
9 #define lmskN  0x00
10 #define lmsk0  0x01
11 #define lmsk1  0x02
12 #define lmsk2  0x04
13 #define lmsk3  0x08
14 #define lmsk01 0x03
15 #define lmsk02 0x05
16 #define lmsk03 0x09
17 #define lmsk12 0x06
18 #define lmsk13 0x0A
19 #define lmsk23 0x0C
20 #define lmskA  0x0F
21
22 #define hmskN  0x00
23 #define hmskA  0xF0
24 #define hmsk0  0x10
25 #define hmsk1  0x20
26 #define hmsk2  0x40
27 #define hmsk3  0x80
28 #define hmsk01 0x30
29 #define hmsk02 0x50
30 #define hmsk03 0x90
31 #define hmsk12 0x60
32 #define hmsk13 0xA0
33 #define hmsk23 0xC0
34
35 #ifndef HIMASK
36 #define HIMASK hmskA
37 #endif
38
39 static void
40 sse4_1_test (void)
41 {
42   union
43     {
44       __m128 x;
45       float f[4];
46     } val1, val2, res[16];
47   int masks[16];
48   int i, j;
49
50   val1.f[0] = 2.;
51   val1.f[1] = 3.;
52   val1.f[2] = 4.;
53   val1.f[3] = 5.;
54
55   val2.f[0] = 10.;
56   val2.f[1] = 100.;
57   val2.f[2] = 1000.;
58   val2.f[3] = 10000.;
59
60   res[0].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk0); 
61   res[1].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk1); 
62   res[2].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk2); 
63   res[3].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk3); 
64   res[4].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk01); 
65   res[5].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk02); 
66   res[6].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk03); 
67   res[7].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk12); 
68   res[8].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk13); 
69   res[9].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmsk23); 
70   res[10].x = _mm_dp_ps (val1.x, val2.x, HIMASK | (0x0F & ~lmsk0)); 
71   res[11].x = _mm_dp_ps (val1.x, val2.x, HIMASK | (0x0F & ~lmsk1)); 
72   res[12].x = _mm_dp_ps (val1.x, val2.x, HIMASK | (0x0F & ~lmsk2)); 
73   res[13].x = _mm_dp_ps (val1.x, val2.x, HIMASK | (0x0F & ~lmsk3)); 
74   res[14].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmskN); 
75   res[15].x = _mm_dp_ps (val1.x, val2.x, HIMASK | lmskA); 
76
77   masks[0] = HIMASK | lmsk0; 
78   masks[1] = HIMASK | lmsk1; 
79   masks[2] = HIMASK | lmsk2; 
80   masks[3] = HIMASK | lmsk3; 
81   masks[4] = HIMASK | lmsk01; 
82   masks[5] = HIMASK | lmsk02; 
83   masks[6] = HIMASK | lmsk03; 
84   masks[7] = HIMASK | lmsk12; 
85   masks[8] = HIMASK | lmsk13; 
86   masks[9] = HIMASK | lmsk23; 
87   masks[10] = HIMASK | (0x0F & ~lmsk0); 
88   masks[11] = HIMASK | (0x0F & ~lmsk1); 
89   masks[12] = HIMASK | (0x0F & ~lmsk2); 
90   masks[13] = HIMASK | (0x0F & ~lmsk3); 
91   masks[14] = HIMASK | lmskN; 
92   masks[15] = HIMASK | lmskA; 
93
94   for (i = 0; i <= 15; i++)
95     {
96       float tmp = 0.;
97
98       for (j = 0; j < 4; j++)
99         if ((HIMASK & (0x10 << j)))
100           tmp += val1.f[j] * val2.f[j];
101
102       for (j = 0; j < 4; j++)
103         if ((masks[i] & (1 << j)) && res[i].f[j] != tmp)
104           abort ();
105    }
106