Diverse_Adversaries_for_Mitigating_Bias_in_Training

Source codes for EACL 2021 paper "Diverse Adversaries for Mitigating Bias in Training"

Xudong Han, Timothy Baldwin and Trevor Cohn (to appear) Diverse Adversaries for Mitigating Bias in Training, In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021), virtual.

Environment

    python 3.7
    torch
    numpy
    scipy
    scikit-learn
    tqdm
    jupyter notebook

Data

To get the dataset, please follow the instruction from https://github.com/shauli-ravfogel/nullspace_projection

Download deepmoji data

mkdir -p data/deepmoji
wget https://storage.googleapis.com/ai2i/nullspace/deepmoji/pos_pos.npy -P data/deepmoji
wget https://storage.googleapis.com/ai2i/nullspace/deepmoji/pos_neg.npy -P data/deepmoji
wget https://storage.googleapis.com/ai2i/nullspace/deepmoji/neg_pos.npy -P data/deepmoji
wget https://storage.googleapis.com/ai2i/nullspace/deepmoji/neg_neg.npy -P data/deepmoji

See download_data.sh for more details.

Get train, dev, and test splits. $INPUT_DIR is where the downloaded files are saved.
```
 python deepmoji_split.py \
         --input_dir $INPUT_DIR \
         --output_dir $OUTPUT_DIR
```
Find the deepmoji_split.py file from the INLP repo.

Notebooks

Standard Model: nb_deepmoji.ipynb
INLP Debiasing: nb_INLP.ipynb
Adversarial Debiasing: nb_adv.ipynb
Adversarial Ensemble: nb_adv_ensemble.ipynb
Adversarial Diverse: nb_differentiated_adv.ipynb

Notice that in our paper, Table 1 results are averaged over 10 runs. Above notebooks are just one run rather than averaged scores.

Experiments

$data_path the the folder of splits.

Standard model

python script_deepmoji.py \
        --data_path $data_path

Adv model

python script_deepmoji.py \
        --data_path $data_path \
        --adv \
        --LAMBDA 0.8 \
        --n_discriminator 1

Ensemble model with $N sub-models

python script_deepmoji.py \
        --data_path $data_path \
        --adv \
        --LAMBDA 0.8 \
        --n_discriminator $N

Separation model

python script_deepmoji.py \
    --data_path $data_path \
    --adv \
    --LAMBDA 0.8 \
    --n_discriminator $N \
    --DL \
    --diff_LAMBDA 10000

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
INLP		INLP
dataloaders		dataloaders
models		models
networks		networks
.gitignore		.gitignore
README.md		README.md
nb_INLP.ipynb		nb_INLP.ipynb
nb_adv.ipynb		nb_adv.ipynb
nb_adv_ensemble.ipynb		nb_adv_ensemble.ipynb
nb_deepmoji.ipynb		nb_deepmoji.ipynb
nb_differentiated_adv.ipynb		nb_differentiated_adv.ipynb
scripts_deepmoji.py		scripts_deepmoji.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Diverse_Adversaries_for_Mitigating_Bias_in_Training

Environment

Data

Notebooks

Experiments

About

Releases

Packages

Languages

HanXudong/Diverse_Adversaries_for_Mitigating_Bias_in_Training

Folders and files

Latest commit

History

Repository files navigation

Diverse_Adversaries_for_Mitigating_Bias_in_Training

Environment

Data

Notebooks

Experiments

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages