Behind RoPE: How Does Causal Mask Encode Positional Information?

An official implementation of the paper Behind RoPE: How Does Causal Mask Encode Positional Information?

Requirements

$pip install -r requirements.txt
FYI: tested with transformers==4.52.4

Usage

Each Jupyter notebook in the concept directory corresponds to a subsection of the paper:
- concept/math.ipynb: Figure 1
- concept/simulation.ipynb: Section 4.1
- concept/with_params.ipynb: Section 4.2
- concept/simulation_rope.ipynb: Section 5.1
- concept/rope_llms.ipynb: Section 5.2
The outputs of each notebook are saved in the figures directory.
The model checkpoint is provided on huggingface.

Citation

@misc{kim2025ropedoescausalmask,
      title={Behind RoPE: How Does Causal Mask Encode Positional Information?}, 
      author={Junu Kim and Xiao Liu and Zhenghao Lin and Lei Ji and Yeyun Gong and Edward Choi},
      year={2025},
      eprint={2509.21042},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2509.21042}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
concept		concept
data		data
figures		figures
LICENSE		LICENSE
README.md		README.md
main.png		main.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Behind RoPE: How Does Causal Mask Encode Positional Information?

Requirements

Usage

Citation

About

Uh oh!

Releases

Packages

Languages

License

starmpcc/causal_mask_encodes_positional

Folders and files

Latest commit

History

Repository files navigation

Behind RoPE: How Does Causal Mask Encode Positional Information?

Requirements

Usage

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages