Knowledge Tracing: LSTM vs. Transformer Models

Overview

This project explores Deep Knowledge Tracing (DKT) using LSTM-based and Transformer-based models on the ASSISTments 2017 dataset. The study evaluates the impact of interaction encoding strategies, sequence lengths, and sliding window strides on model performance.

Key Findings

LSTMs outperform Transformers on shorter sequences due to better temporal modeling.
Transformers require longer sequences to leverage self-attention effectively.
Dense overlapping sequences (stride = 1) improve learning by increasing effective training data.
Combined encoding (single integer) slightly outperforms separate encoding, reducing redundancy.

Features

✔ LSTM-based DKT model implementation
✔ Transformer-based Knowledge Tracing model
✔ Sequence generation using sliding window approach
✔ Early stopping and AUC-based evaluation
✔ Visualization: Prediction heatmaps and AUROC curves

Dataset

We use the ASSISTments 2017 dataset, a widely used benchmark for Knowledge Tracing research. It includes:

Student response records
Skill ID mappings
Timestamps and correctness labels

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
2016_reimplementation		2016_reimplementation
notebooks		notebooks
preprocessed_data		preprocessed_data
saved_models		saved_models
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Knowledge Tracing: LSTM vs. Transformer Models

Overview

Key Findings

Features

Dataset

About

Uh oh!

Releases

Packages

Languages

arshdeepsp/CS468_KT_Project

Folders and files

Latest commit

History

Repository files navigation

Knowledge Tracing: LSTM vs. Transformer Models

Overview

Key Findings

Features

Dataset

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages