Skip to content

Commit 58419e7

Browse files
authored
Merge pull request #3734 from qingqing01/write_new_op
Update doc about how to write new operators.
2 parents 75e16bd + 751d853 commit 58419e7

File tree

2 files changed

+41
-17
lines changed

2 files changed

+41
-17
lines changed

doc/howto/dev/new_op_cn.md

Lines changed: 40 additions & 16 deletions
Original file line numberDiff line numberDiff line change
@@ -5,12 +5,13 @@
55
- [定义ProtoMaker类](#定义ProtoMaker类)
66
- [定义Operator类](#定义Operator类)
77
- [定义OpKernel类](#定义OpKernel类)
8-
- [注册类](#注册类)
8+
- [注册Operator](#注册Operator)
99
- [编译](#编译)
1010
- [绑定Python](#绑定Python)
1111
- [实现单元测试](#实现单元测试)
1212
- [前向Operator单测](#前向Operator单测)
1313
- [反向Operator单测](#反向Operator单测)
14+
- [编译和执行](#编译和执行)
1415

1516

1617
## 概念简介
@@ -22,19 +23,17 @@
2223
- `framework::OperatorWithKernel`:继承自OperatorBase,Op有计算函数,称作有Kernel。
2324
- `class OpProtoAndCheckerMaker`:描述该Op的输入、输出、属性、注释,主要用于Python API接口生成
2425

25-
依据是否包含kernel,将Op分为两种:包含Kernel的Op和不包含kernel的Op,前者Op的定义继承自`OperatorBase`,后者继承自`OperatorWithKernel`。本教程主要介绍带Kernel的Op如何写,简单总结如下
26+
依据是否包含kernel,将Op分为两种:包含Kernel的Op和不包含kernel的Op,前者Op的定义继承自`OperatorBase`,后者继承自`OperatorWithKernel`。本教程主要介绍带Kernel的Op如何写,简单总结Op需要包含的内容如下
2627

27-
Forward Op需要包含:
28-
29-
- OpProtoMake定义
30-
- Op定义
31-
- Kernel实现
28+
29+
内容 | 定义位置
30+
-------------- | :----------------------
31+
OpProtoMake定义 | `.cc`文件,Backward Op不需要定义OpProtoMake
32+
Op定义 | `.cc`文件
33+
Kernel实现 | CPU、GPU共享Kernel在`.h`文件,否则,CPU可以在`.cc`文件,GPU可在`.cu`文件。
34+
注册Op | Op注册在`.cc`文件;Kernel注册CPU在`.cc`文件,GPU在`.cu`文件
35+
3236

33-
与之对应的Backward Op包含:
34-
35-
- Op定义
36-
- Kernel实现
37-
3837
下面以矩阵乘操作,即[MulOp](https://github.com/PaddlePaddle/Paddle/blob/develop/paddle/operators/mul_op.cc)为例来介绍如何写带Kernel的Operator。
3938

4039

@@ -137,8 +136,9 @@ MulOp(const std::string &type, const framework::VariableNameMap &inputs,
137136
```
138137
139138
还需要重写`InferShape`接口。`InferShape`为const函数,不能修改Op的成员变量,参数为`const framework::InferShapeContext &ctx`,通过该参数可获取到输入输出以及属性。它的功能是:
140-
- 1). 做检查, 尽早报错:检查输入数据维度、类型等是否合法
141-
- 2). 设置输出Tensor的形状
139+
140+
- 1). 做检查, 尽早报错:检查输入数据维度、类型等是否合法。
141+
- 2). 设置输出Tensor的形状。
142142
143143
通常`OpProtoMaker`和`Op`类的定义写在`.cc`文件中,和要讲到的注册函数一起放在`.cc`中
144144
@@ -172,7 +172,7 @@ class MulKernel : public framework::OpKernel {
172172

173173
到此前向Op实现完成,需要在`.cc`文件中注册该op和kernel。反向Op类的定义和Kernel定义与前向Op类似,这里不再重复。但注意,反向Op没有`ProtoMaker`
174174

175-
### 4. 注册类
175+
### 4. 注册Operator
176176

177177
`.cc`文件中注册前向、反向Op类,注册CPU Kernel。
178178

@@ -297,4 +297,28 @@ class TestMulOp(unittest.TestCase):
297297
- 调用`create_op("mul")`创建反向Op对应的前向Op。
298298
- 定义输入`inputs`
299299
- 调用`compare_grad`函数对比CPU、GPU计算结果。
300-
- 调用`check_grad`检查梯度稳定性。
300+
- 调用`check_grad`检查梯度稳定性,这里采用数值法检测梯度正确性。
301+
- 第一个参数`op` : 前向op。
302+
- 第二个参数`inputs` : 输入词典,词典的Key和`ProtoMaker`定义保持一致。
303+
- 第三个参数`set(["X", "Y"])` : 指定对输入变量`X``Y`做梯度检测。
304+
- 第四个参数`"Out"` : 指定前向网络最终的输出目标变量`Out`
305+
306+
307+
### 编译和执行
308+
309+
单测完成之后,在[`python/paddle/v2/framework/tests/CMakeLists.txt`](https://github.com/PaddlePaddle/Paddle/blob/develop/python/paddle/v2/framework/tests/CMakeLists.txt)里添加编译:
310+
311+
```
312+
py_test(test_mul_op SRCS test_mul_op.py)
313+
```
314+
315+
编译时需要打开`WITH_TESTING`, 即 `cmake paddle_dir -DWITH_TESTING=ON`,编译成功之后执行单测命令为:
316+
317+
```
318+
make test ARGS="-R test_mul_op -V"
319+
```
320+
或者:
321+
322+
```
323+
ctest -R test_mul_op
324+
```

python/paddle/v2/framework/tests/gradient_checker.py

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -268,7 +268,7 @@ def check_grad(self,
268268
:param input_vars: numpy value of input variable. The following
269269
computation will use these variables.
270270
:param inputs_to_check: inputs var names that should check gradient.
271-
:param output_name: output name that used to
271+
:param output_name: the output variable name of forward network.
272272
:param max_relative_error: The relative tolerance parameter.
273273
:param no_grad_set: used when create backward ops
274274
:param only_cpu: only compute and check gradient on cpu kernel.

0 commit comments

Comments
 (0)