Transformer decoding support fuse qkv #1455

FrostML · 2021-12-13T12:57:01Z

PR types

Performance optimization

PR changes

Models

Description

Transformer decoding support fuse qkv. Performance comes later.

…nto fuse-qkv

guoshengCS

fuse_qkv 如果多了对size的限制的话也加上分支来支持更多size吧

FrostML · 2021-12-15T07:58:50Z

fuse_qkv 如果多了对size的限制的话也加上分支来支持更多size吧

Done. Thanks.

…nto fuse-qkv

guoshengCS · 2021-12-15T11:33:09Z

paddlenlp/ops/faster_transformer/src/fusion_decoding_op.cc

@@ -65,7 +65,8 @@ std::vector<paddle::Tensor> DecodingForward(
    const int64_t& max_len,
    const float& beam_search_diversity_rate,
    const bool& rel_len,
-    const float& alpha) {
+    const float& alpha,
+    const bool& fuse_qkv) {


不另外加这个fuse_qkv的attr了吧，直接根据size来判断吧，也保证对之前模型的兼容性

Done. Thanks.

…nto fuse-qkv

guoshengCS · 2021-12-16T10:34:20Z

paddlenlp/ops/faster_transformer/transformer/faster_transformer.py

+                param_type = item.split(".")[-1]
+
+                model_dict[
+                    "decoding.slf_q_" + param_type + "_" +


load和export是否也判断下self._fuse_qkv呢

目前不会报 warning 也不影响使用。
已优化代码。Thanks.

ZeyuChen · 2021-12-16T15:56:17Z

paddlenlp/ops/faster_transformer/src/fusion_force_decoding_op.h

-    float alpha);
+    const std::string& decoding_strategy,
+    const int& beam_size,
+    const int& topk,


理论上int值的参数，是不需要加const和引用的。因为没有任何加速意义。
string的话通过引用，是会将copy从string降低到指针（32bit）的拷贝。
但是int呢，你不管加不加引用，拷贝的指针地址和拷贝int值是一样的。
正因为如此，所以你加不加const都一样了。

Truth. 这里加 const 单纯是不需要修改的形参都习惯性加上 const，加上引用是想让形参列表看起来统一。我新的修改删除了引用，不过对于这样不需要修改的形参，还是建议保留 const。

…fuse-qkv

ZeyuChen

LGTM

FrostML added 3 commits December 13, 2021 12:53

decoding support fuseqkv ! ! !

bbfe3a9

update force version

4c888f0

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

0a2a5d9

…nto fuse-qkv

FrostML requested a review from guoshengCS December 13, 2021 13:04

fp16

71dd70f

guoshengCS previously approved these changes Dec 15, 2021

View reviewed changes

alternative

3fe3437

FrostML dismissed guoshengCS’s stale review via 3fe3437 December 15, 2021 07:58

FrostML added 3 commits December 15, 2021 07:59

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

a57fc66

…nto fuse-qkv

force decoding support global cublashandle and cublaslthandle

8fb6739

update

c213ea4

FrostML requested a review from guoshengCS December 15, 2021 09:13

guoshengCS reviewed Dec 15, 2021

View reviewed changes

FrostML added 2 commits December 16, 2021 02:30

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

46392f2

…nto fuse-qkv

update

384e23a

guoshengCS reviewed Dec 16, 2021

View reviewed changes

update

262fe27

guoshengCS previously approved these changes Dec 16, 2021

View reviewed changes

Merge branch 'develop' into fuse-qkv

f301919

ZeyuChen requested changes Dec 16, 2021

View reviewed changes

FrostML added 2 commits December 17, 2021 02:45

rm ref

1b6b70a

Merge branch 'fuse-qkv' of https://github.com/FrostML/PaddleNLP into …

9bef786

…fuse-qkv

FrostML dismissed guoshengCS’s stale review via 9bef786 December 17, 2021 02:46

ZeyuChen approved these changes Dec 17, 2021

View reviewed changes

Merge branch 'develop' into fuse-qkv

f807a6c

guoshengCS merged commit fa1fa75 into PaddlePaddle:develop Dec 17, 2021

FrostML mentioned this pull request Dec 17, 2021

PaddleNLP 2.2.1 Release Note Candidate #1467

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Transformer decoding support fuse qkv #1455

Transformer decoding support fuse qkv #1455

FrostML commented Dec 13, 2021 •

edited

Loading

guoshengCS left a comment

FrostML commented Dec 15, 2021

guoshengCS Dec 15, 2021

FrostML Dec 16, 2021 •

edited

Loading

guoshengCS Dec 16, 2021

FrostML Dec 16, 2021

ZeyuChen Dec 16, 2021

FrostML Dec 17, 2021

ZeyuChen left a comment

Transformer decoding support fuse qkv #1455

Transformer decoding support fuse qkv #1455

Conversation

FrostML commented Dec 13, 2021 • edited Loading

PR types

PR changes

Description

guoshengCS left a comment

Choose a reason for hiding this comment

FrostML commented Dec 15, 2021

guoshengCS Dec 15, 2021

Choose a reason for hiding this comment

FrostML Dec 16, 2021 • edited Loading

Choose a reason for hiding this comment

guoshengCS Dec 16, 2021

Choose a reason for hiding this comment

FrostML Dec 16, 2021

Choose a reason for hiding this comment

ZeyuChen Dec 16, 2021

Choose a reason for hiding this comment

FrostML Dec 17, 2021

Choose a reason for hiding this comment

ZeyuChen left a comment

Choose a reason for hiding this comment

FrostML commented Dec 13, 2021 •

edited

Loading

FrostML Dec 16, 2021 •

edited

Loading