Skip to content

Commit 93d620c

Browse files
committed
修正
1 parent 9405487 commit 93d620c

File tree

1 file changed

+5
-1
lines changed

1 file changed

+5
-1
lines changed

README.md

Lines changed: 5 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -16,6 +16,7 @@ http://www.bealto.com/gpu-sorting_parallel-bitonic-1.html
1616
を参考にしました。
1717

1818

19+
1920
### Only B2
2021

2122
1threadあたり2箇所Load,Storeを行います。
@@ -40,6 +41,7 @@ http://www.bealto.com/gpu-sorting_parallel-bitonic-1.html
4041
|134217728|1744|
4142

4243

44+
4345
### B2C2
4446

4547
Shared Memoryを使った高速化版です。
@@ -65,11 +67,13 @@ Shared Memoryを使った高速化版です。
6567
|134217728|1744|1095|
6668

6769

70+
6871
### B2B4B8B16C2C4
6972

7073
1threadあたり4箇所Load,Storeを行うことでグローバルメモリのアクセス回数を減らします。
7174
![gpuimpliment2](https://user-images.githubusercontent.com/44022497/87314155-c66ec500-c55d-11ea-9bd9-a8227274e079.png)
72-
これを8,16と増やすことでさらなる高速化ができました。
75+
76+
これを8,16と増やすことでさらなる高速化ができます。
7377
Shared memory内も1threadあたり4箇所Load,Storeを行うことでShared memoryへのアクセス回数を減らします。
7478

7579
|要素数/カーネル名|B2|B2C2|B2B4B8B16C2C4|

0 commit comments

Comments
 (0)