Merge branch 'master' of github.com:mlciv/sgd

mlciv · Nov 19, 2020 · 3a1ff29 · 3a1ff29
2 parents bc6e305 + 1eb9c20
commit 3a1ff29
Show file tree

Hide file tree

Showing 6 changed files with 330 additions and 0 deletions.
diff --git a/Expt/sgd-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_name_only_squad2_desc_only.sh b/Expt/sgd-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_name_only_squad2_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_name_only
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-cased-squad2.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=3000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...sgd-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_question_rich_snli_desc_only.sh b/...sgd-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_question_rich_snli_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_question_rich
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased-snli.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=2000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_question_rich_uncased_desc_only.sh b/...-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_question_rich_uncased_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_question_rich
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=2000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...scripts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_snli.sh b/...scripts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_snli.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=multiwoz22_zero_question_nameonly
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased-snli.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$MULTIWOZ22_ZERO_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=6000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=x
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...ripts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_squad2.sh b/...ripts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_squad2.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=multiwoz22_zero_question_nameonly
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-cased-squad2.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$MULTIWOZ22_ZERO_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=6000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=x
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...ipts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_uncased.sh b/...ipts/configs/flat_noncat_slots_bert_snt_pair_multiwoz22_zero_question_nameonly_uncased.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=multiwoz22_zero_question_nameonly
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$MULTIWOZ22_ZERO_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=6000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=x
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x