Refactor/torch datasets improvement #2798

dennisbader · 2025-04-28T11:21:02Z

Checklist before merging this PR:

Mentioned all issues that this PR fixes or addresses.
Summarized the updates of this PR under Summary.
Added an entry under Unreleased in the Changelog.

Fixes #2686.

Summary

simplifies training and inference datasets for TorchForecastingModel
all training datasets now have uniform output: Tuple[past target, past cov, historic future cov, future cov, static cov, sample weight, future target]
all ineference datasets now have uniform output: Tuple[past target, past cov, future past cov, historic future cov, future cov, static cov, target TimeSeries, pred start time]
instead of having covariates specific datasets, the base datasets can now handle of covariates together. The remaining datasets are:
- Training:
  - ShiftedTrainingDataset (old GenericShiftedDataset adapted to handle all covariates)
  - SequentialTrainingDataset (replaces old *CovariatesSequantialDataset)
  - HorizonBasedTrainingDataset (replaces old HorizonBasedDataset)
- Prediction:
  - SequentialInfereceDataset (replaces old *CovariatesInferenceDataset)
simplified HorizonBasedDataset to use ShiftedTrainingDataset as parent
I observed a 10-15% performance boost for prediction with a model that uses all covariates

review-notebook-app · 2025-04-28T11:21:07Z

Check out this pull request on

See visual diffs & provide feedback on Jupyter Notebooks.

Powered by ReviewNB

codecov · 2025-04-28T11:38:05Z

Codecov Report

Attention: Patch coverage is 98.20467% with 10 lines in your changes missing coverage. Please review.

Project coverage is 95.13%. Comparing base (2309556) to head (34b3c21).
Report is 1 commits behind head on master.

Files with missing lines	Patch %	Lines
darts/utils/data/__init__.py	25.00%	6 Missing ⚠️
...arts/models/forecasting/torch_forecasting_model.py	94.80%	4 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##           master    #2798      +/-   ##
==========================================
+ Coverage   94.61%   95.13%   +0.51%     
==========================================
  Files         145      145              
  Lines       15458    15049     -409     
==========================================
- Hits        14626    14317     -309     
+ Misses        832      732     -100

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

darts/utils/data/__init__.py

darts/utils/data/training_dataset.py

darts/utils/data/inference_dataset.py

darts/utils/data/utils.py

darts/models/forecasting/pl_forecasting_module.py

darts/models/forecasting/global_baseline_models.py

darts/models/forecasting/torch_forecasting_model.py

…tasets_improvement

…ture

dennisbader added 15 commits April 21, 2025 22:06

refactor torch datasets

91a6081

rename to as everywhere else

304aa68

adapt TorchForecastingModel

f53f5e7

remove pl forecasting module covarites subclasses

793f333

remove redundant datasets

2666d05

fix tests

8ebfdf4

simplify horizon based dataset

3e5ff91

update dataset reference in example

2aa795c

update docs and changelog

92476ab

update docs

e795b30

remove noqa

f6f7112

make codecov ignore tests

becf913

Merge branch 'master' into refactor/uniform_dataset_output

49a39ca

fix some missing lines

d6bf145

Merge branch 'master' into refactor/uniform_dataset_output

4a476c2

dennisbader requested a review from madtoinou as a code owner April 28, 2025 11:21

update changelog

865d711

dennisbader added 4 commits April 29, 2025 11:55

further simplify training dataset

6f22445

improve traning set code coverage

6d471fc

improve tfm code coverage

c592bfa

improve inference dataset code coverage

d1fe38a

jonasblanc reviewed Apr 30, 2025

View reviewed changes

dennisbader added 6 commits April 30, 2025 11:50

unify memory indexer

c063fce

add output chunk shift test

792b12a

apply suggestions from pr review

7ec0725

Merge branch 'master' into refactor/uniform_dataset_output

412a865

Merge branch 'refactor/uniform_dataset_output' into refactor/torch_da…

772df75

…tasets_improvement

move tabularization and torch dataset modules for improved repo struc…

cb6e026

…ture

dennisbader added 2 commits May 1, 2025 13:17

improve code coverage

c9b892c

fix typo

34b3c21

dennisbader merged commit 06910d8 into master May 1, 2025
9 checks passed

dennisbader deleted the refactor/torch_datasets_improvement branch May 1, 2025 12:09

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Refactor/torch datasets improvement #2798

Refactor/torch datasets improvement #2798

dennisbader commented Apr 28, 2025 •

edited

Loading

review-notebook-app bot commented Apr 28, 2025

codecov bot commented Apr 28, 2025 •

edited

Loading

Refactor/torch datasets improvement #2798

Refactor/torch datasets improvement #2798

Conversation

dennisbader commented Apr 28, 2025 • edited Loading

Summary

review-notebook-app bot commented Apr 28, 2025

codecov bot commented Apr 28, 2025 • edited Loading

Codecov Report

dennisbader commented Apr 28, 2025 •

edited

Loading

codecov bot commented Apr 28, 2025 •

edited

Loading