ROIDICE: Offline Return on Investment Maximization for Efficient Decision Making

This is the official implementation of the paper "ROIDICE: Offline Return on Investment Maximization for Efficient Decision Making", NeurIPS 2024.

Requirements

python 3.9+
gym==0.17.3
mujoco==3.1.3
mujoco-py==1.50.1.68
jax==0.4.26
jaxlib==0.4.26+cuda12.cudnn89
d4rl @ git+https://github.com/Farama-Foundation/d4rl
neorl @ git+https://https://github.com/polixir/NeoRL

Offline dataset

We utilze D4RL dataset for locomotion tasks, and NeoRL dataset for financial task.

How to run

Train and evaluate tabular environment:

$ cd ROIDICE
$ python tabular/run_random_cmdp_roidice.py

Train and evaluate locomotion environment:

$ cd ROIDICE
$ ./scripts/run_mujoco.sh 0 ROIDICE hopper-expert-v2 SoftChi roidice

Train and evaluate finance environment:

$ cd ROIDICE
$ ./scripts/run_finance.sh 0 ROIDICE finance-high-100 SoftChi roidice

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
neural		neural
scripts		scripts
tabular		tabular
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ROIDICE: Offline Return on Investment Maximization for Efficient Decision Making

Requirements

Offline dataset

How to run

About

Releases

Packages

Languages

License

ku-dmlab/ROIDICE

Folders and files

Latest commit

History

Repository files navigation

ROIDICE: Offline Return on Investment Maximization for Efficient Decision Making

Requirements

Offline dataset

How to run

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages