[Track 1-B] Add relu6_backward operator by AdamPlatin123 · Pull Request #3577 · flagos-ai/FlagGems

AdamPlatin123 · 2026-05-28T11:10:44Z

Summary

Implement relu6_backward operator for Track 1-B (Operator Coverage).

Implementation

Uses @pointwise_dynamic decorator for automatic type promotion and non-contiguous tensor support.

Formula

relu6(x) = min(max(x, 0), 6)
backward: grad_input = grad_output if 0 < x < 6, else 0

The gradient only flows through values in the active range (0, 6).

Files Added

src/flag_gems/ops/relu6_backward.py - Operator implementation (16 lines)
tests/test_relu6_backward.py - Accuracy tests
benchmark/test_relu6_backward.py - Performance benchmark

Registration

Registered in ops/init.py
Registered in flag_gems/init.py

Testing

Pointwise shapes coverage
All floating point dtypes (float32/bfloat16/float16)

FlagGems Operator Development Competition

…kward operator Triton kernel using atomic_add for gradient accumulation at pad boundaries. Simpler than reflection_pad (clamp indexing instead of modulo).

Uses @pointwise_dynamic pattern for automatic type promotion and non-contiguous support. Formula: grad * (1 if x > 0 else exp(x/alpha)) Changes: - src/flag_gems/ops/celu.py: Add celu_backward_kernel and celu_backward function - Register in ops/__init__.py and flag_gems/__init__.py - Add test_celu_backward.py with POINTWISE_SHAPES and FLOAT_DTYPES - Add benchmark/test_celu_backward.py

PReLU backward with support for both scalar and per-channel weights. Formulas: - grad_input = grad_output * (1 if x >= 0 else weight) - grad_weight = sum(grad_output * x for x < 0) per channel Uses Triton kernels with atomic_add for grad_weight accumulation. Changes: - src/flag_gems/ops/prelu_backward.py: New file with prelu_backward function - Register in ops/__init__.py and flag_gems/__init__.py - Add test_prelu_backward.py with scalar and per-channel tests - Add benchmark/test_prelu_backward.py

…kward operator 3D replication padding backward with clamp indexing and atomic_add accumulation. Formula: For each output position (d,h,w), map to input position using clamp: - id = clamp(od - pad_f, 0, D_in - 1) - ih = clamp(oh - pad_t, 0, H_in - 1) - iw = clamp(ow - pad_l, 0, W_in - 1) - atomic_add(grad_input[id, ih, iw], grad_output) Supports both 5D (N,C,D,H,W) and 4D (C,D,H,W) inputs. Changes: - src/flag_gems/ops/replication_pad3d_backward.py: New file (220 lines) - Register in ops/__init__.py and flag_gems/__init__.py - Add test_replication_pad3d_backward.py with multiple padding configs - Add benchmark/test_replication_pad3d_backward.py

…perator Uses @pointwise_dynamic pattern for automatic type promotion and non-contiguous support. Formula: grad_input = grad_output * (1 if |x| > lambd else 0) Softshrink forward: f(x) = x - lambd if x > lambd, x + lambd if x < -lambd, 0 otherwise. Changes: - src/flag_gems/ops/softshrink_backward.py: New file (@pointwise_dynamic, 18 lines) - Register in ops/__init__.py and flag_gems/__init__.py - Add test_softshrink_backward.py with POINTWISE_SHAPES and FLOAT_DTYPES - Add benchmark/test_softshrink_backward.py

…rink_backward operators - hardshrink: forward operator using @pointwise_dynamic - hardshrink_backward: backward operator using @pointwise_dynamic - Tests and benchmarks for both operators Formula: - forward: y = x if |x| > lambd else 0 - backward: grad_input = grad_output if |x| > lambd else 0

…operator - hardsigmoid_backward using @pointwise_dynamic - Test and benchmark files Formula: - hardsigmoid: y = clamp(x/6 + 0.5, 0, 1) - backward: grad_input = grad_output * (1/6) when -3 < x < 3, else 0

…rator

AdamPlatin123 added 11 commits May 28, 2026 00:38

[FlagGems Operator Development Competition] Add replication_pad1d_bac…

8ded1fa

…kward operator Triton kernel using atomic_add for gradient accumulation at pad boundaries. Simpler than reflection_pad (clamp indexing instead of modulo).

[FlagGems Operator Development Competition] Add hardsigmoid_backward …

4a0d8b0

…operator - hardsigmoid_backward using @pointwise_dynamic - Test and benchmark files Formula: - hardsigmoid: y = clamp(x/6 + 0.5, 0, 1) - backward: grad_input = grad_output * (1/6) when -3 < x < 3, else 0

[FlagGems Operator Development Competition] Add selu_backward operator

ef100f4

[FlagGems Operator Development Competition] Add logit_backward operator

5f11d65

[FlagGems Operator Development Competition] Add softplus_backward ope…

4c4c19e

…rator

[FlagGems Operator Development Competition] Add relu6_backward operator

5c8aa77

AdamPlatin123 requested review from 0x45f, bin913, douxetpur, huangyiqun and w1120029931-bit as code owners May 28, 2026 11:10

github-actions Bot added benchmark ops/aten core tests size/XLarge labels May 28, 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Track 1-B] Add relu6_backward operator#3577

[Track 1-B] Add relu6_backward operator#3577
AdamPlatin123 wants to merge 11 commits into
flagos-ai:masterfrom
AdamPlatin123:competition/relu6-backward

AdamPlatin123 commented May 28, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

AdamPlatin123 commented May 28, 2026

Summary

Implementation

Formula

Files Added

Registration

Testing

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant