@@ -200,19 +200,17 @@ define <64 x i8> @combine_vpermi2var_constant_v64i8_with_mask_commute(<64 x i8>
200
200
; X86-LABEL: combine_vpermi2var_constant_v64i8_with_mask_commute:
201
201
; X86: # %bb.0:
202
202
; X86-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63]
203
- ; X86-NEXT: vpermt2b {{\.?LCPI[0-9]+_[0-9]+}}, %zmm0, %zmm1
204
203
; X86-NEXT: vpmovb2m %zmm0, %k0
205
204
; X86-NEXT: knotq %k0, %k1
206
- ; X86-NEXT: vmovdqu8 %zmm1, %zmm0 {%k1} {z}
205
+ ; X86-NEXT: vpermi2b {{\.?LCPI[0-9]+_[0-9]+}}, %zmm1, %zmm0 {%k1} {z}
207
206
; X86-NEXT: retl
208
207
;
209
208
; X64-LABEL: combine_vpermi2var_constant_v64i8_with_mask_commute:
210
209
; X64: # %bb.0:
211
210
; X64-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63]
212
- ; X64-NEXT: vpermt2b {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %zmm0, %zmm1
213
211
; X64-NEXT: vpmovb2m %zmm0, %k0
214
212
; X64-NEXT: knotq %k0, %k1
215
- ; X64-NEXT: vmovdqu8 %zmm1, %zmm0 {%k1} {z}
213
+ ; X64-NEXT: vpermi2b {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %zmm1, %zmm0 {%k1} {z}
216
214
; X64-NEXT: retq
217
215
%perm = tail call <64 x i8 > @llvm.x86.avx512.vpermi2var.qi.512 (<64 x i8 > <i8 0 , i8 1 , i8 2 , i8 3 , i8 4 , i8 5 , i8 6 , i8 7 , i8 8 , i8 9 , i8 10 , i8 11 , i8 12 , i8 13 , i8 14 , i8 15 , i8 16 , i8 17 , i8 18 , i8 19 , i8 20 , i8 21 , i8 22 , i8 23 , i8 24 , i8 25 , i8 26 , i8 27 , i8 28 , i8 29 , i8 30 , i8 31 , i8 32 , i8 33 , i8 34 , i8 35 , i8 36 , i8 37 , i8 38 , i8 39 , i8 40 , i8 41 , i8 42 , i8 43 , i8 44 , i8 45 , i8 46 , i8 47 , i8 48 , i8 49 , i8 50 , i8 51 , i8 52 , i8 53 , i8 54 , i8 55 , i8 56 , i8 57 , i8 58 , i8 59 , i8 60 , i8 61 , i8 62 , i8 63 >, <64 x i8 > %a0 , <64 x i8 > <i8 64 , i8 65 , i8 66 , i8 67 , i8 68 , i8 69 , i8 70 , i8 71 , i8 72 , i8 73 , i8 74 , i8 75 , i8 76 , i8 77 , i8 78 , i8 79 , i8 80 , i8 81 , i8 82 , i8 83 , i8 84 , i8 85 , i8 86 , i8 87 , i8 88 , i8 89 , i8 90 , i8 91 , i8 92 , i8 93 , i8 94 , i8 95 , i8 96 , i8 97 , i8 98 , i8 99 , i8 100 , i8 101 , i8 102 , i8 103 , i8 104 , i8 105 , i8 106 , i8 107 , i8 108 , i8 109 , i8 110 , i8 111 , i8 112 , i8 113 , i8 114 , i8 115 , i8 116 , i8 117 , i8 118 , i8 119 , i8 120 , i8 121 , i8 122 , i8 123 , i8 124 , i8 125 , i8 126 , i8 127 >)
218
216
%cmp = icmp slt <64 x i8 > %a0 , zeroinitializer
0 commit comments