Skip to content

Commit eed14f4

Browse files
authored
Rename src/CUDA/p3-5.txt to src/CUDA/notes/p3-5.txt
1 parent 073692f commit eed14f4

File tree

1 file changed

+15
-15
lines changed

1 file changed

+15
-15
lines changed
Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
$export CUDA_LAUNCH_BLOCKING=1
2-
��������֮�����к˺����ĵ��ö��������첽�ģ� ����ͬ���ġ�
3-
��Ӱ��������ܣ�
2+
这样设置之后,所有核函数的调用都不再是异步的, 而是同步的。
3+
会影响程序性能,
44

55
error.cuh:
66

@@ -21,29 +21,29 @@ do\
2121
}\
2222
}while(0);
2323

24-
CUDA�Դ���鹤�߼� CUDA-MEMCHECK
24+
CUDA自带检查工具集 CUDA-MEMCHECK
2525
$ cuda-memcheck --tool memcheck [options] app_name [options]
2626
$ cuda-memcheck --tool racecheck [options] app_name [options]
2727
$ cuda-memcheck --tool initcheck [options] app_name [options]
2828
$ cuda-memcheck --tool synccheck [options] app_name [options]
2929

30-
memcheck���߿���ʡ�� --tool memcheck
31-
��Ϊ:
30+
memcheck工具可以省略 --tool memcheck
31+
变为:
3232
$ cuda-memcheck [options] app_name [options]
3333

34-
�� $ cuda-memcheck ./a.out
34+
$ cuda-memcheck ./a.out
3535

3636
$ nvprof ./a.out
37-
�������������ʱ�������������µĴ�����ʾ��
38-
54 CUDA ��̣�������ʵ��
37+
如果用上述命令时遇到了类似如下的错误提示:
38+
54 CUDA 编程:基础与实践
3939
Unable to profile application. Unified Memory profiling failed
40-
����Գ��Խ��������Ϊ��
40+
则可以尝试将运行命令换为:
4141
$ nvprof --unified-memory-profiling off ./a.out
4242

43-
���GPU���ٱȵİ취��
44-
�����������豸֮������ݴ��䣻
45-
��ߺ˺���������ǿ�ȣ�
46-
����˺����IJ��й�ģ��
43+
提高GPU加速比的办法:
44+
减少主机与设备之间的数据传输;
45+
提高核函数的算术强度;
46+
增大核函数的并行规模。
4747

48-
һ�� GPU һ������פ�����򵽼�ʮ����̡߳����һ���˺����ж�����߳���ĿԶС��������Ļ����Ͳ�����
49-
�õ��ܸߵļ��ٱȡ�
48+
一块 GPU 一共可以驻留几万到几十万个线程。如果一个核函数中定义的线程数目远小于这个数的话,就不可能
49+
得到很高的加速比。

0 commit comments

Comments
 (0)