add rmsnorm kernels support for npu #42106

zheliuyu · 2025-11-08T03:24:13Z

What does this PR do?

As title.

Test script

from transformers import AutoModelForCausalLM, AutoTokenizer
import logging
import time


# Set the level to `DEBUG` to see which kernels are being called.
# logging.basicConfig(level=logging.DEBUG)

model_name = "Qwen/Qwen3-0.6B"

# load the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto",
    use_kernels=True,
)

# prepare the model input
prompt = "Output the first 20 digits of pi."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=False,
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# Print Runtime
start_time = time.time()
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
print("runtime: ", time.time()-start_time)

output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
content = tokenizer.decode(output_ids, skip_special_tokens=True).strip("\n")

print("content:", content)

add rmsnorm kernels support for npu

bb0a221

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

add rmsnorm kernels support for npu #42106

add rmsnorm kernels support for npu #42106

Uh oh!

zheliuyu commented Nov 8, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

add rmsnorm kernels support for npu #42106

Are you sure you want to change the base?

add rmsnorm kernels support for npu #42106

Uh oh!

Conversation

zheliuyu commented Nov 8, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

What does this PR do?

Test script

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

zheliuyu commented Nov 8, 2025 •

edited

Loading