File tree Expand file tree Collapse file tree 1 file changed +5
-1
lines changed Expand file tree Collapse file tree 1 file changed +5
-1
lines changed Original file line number Diff line number Diff line change @@ -16,6 +16,7 @@ http://www.bealto.com/gpu-sorting_parallel-bitonic-1.html
16
16
を参考にしました。
17
17
18
18
19
+
19
20
### Only B2
20
21
21
22
1threadあたり2箇所Load,Storeを行います。
@@ -40,6 +41,7 @@ http://www.bealto.com/gpu-sorting_parallel-bitonic-1.html
40
41
| 134217728| 1744|
41
42
42
43
44
+
43
45
### B2C2
44
46
45
47
Shared Memoryを使った高速化版です。
@@ -65,11 +67,13 @@ Shared Memoryを使った高速化版です。
65
67
| 134217728| 1744| 1095|
66
68
67
69
70
+
68
71
### B2B4B8B16C2C4
69
72
70
73
1threadあたり4箇所Load,Storeを行うことでグローバルメモリのアクセス回数を減らします。
71
74
![ gpuimpliment2] ( https://user-images.githubusercontent.com/44022497/87314155-c66ec500-c55d-11ea-9bd9-a8227274e079.png )
72
- これを8,16と増やすことでさらなる高速化ができました。
75
+
76
+ これを8,16と増やすことでさらなる高速化ができます。
73
77
Shared memory内も1threadあたり4箇所Load,Storeを行うことでShared memoryへのアクセス回数を減らします。
74
78
75
79
| 要素数/カーネル名| B2| B2C2| B2B4B8B16C2C4|
You can’t perform that action at this time.
0 commit comments