add cat slot pretrained

mlciv · Nov 17, 2020 · 10f74db · 10f74db
1 parent 8ae502b
commit 10f74db
Show file tree

Hide file tree

Showing 6 changed files with 330 additions and 0 deletions.
diff --git a/Expt/sgd-scripts/configs/flat_active_intent_bert_snt_pair_dstc8_all_bert_squad2_desc_only.sh b/Expt/sgd-scripts/configs/flat_active_intent_bert_snt_pair_dstc8_all_bert_squad2_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_all
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_active_intent_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-cased-squad2.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_active_intent_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=12
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=12
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-6
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=3000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...-scripts/configs/flat_cat_slot_value_bert_snt_pair_dstc8_all_bert_squad2_desc_only_128.sh b/...-scripts/configs/flat_cat_slot_value_bert_snt_pair_dstc8_all_bert_squad2_desc_only_128.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_all
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_cat_slot_value_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-cased-squad2.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_cat_slot_value_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=3000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/Expt/sgd-scripts/configs/flat_cat_slot_value_bert_snt_pair_multiwoz22_zero_snli_desc_only.sh b/Expt/sgd-scripts/configs/flat_cat_slot_value_bert_snt_pair_multiwoz22_zero_snli_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=multiwoz22_zero
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_cat_slot_value_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased-snli.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_cat_slot_value_bert_snt_pair_match_desc_value.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$MULTIWOZ22_ZERO_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=8000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=x
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...sgd-scripts/configs/flat_cat_slot_value_bert_snt_pair_multiwoz22_zero_squad2_desc_only.sh b/...sgd-scripts/configs/flat_cat_slot_value_bert_snt_pair_multiwoz22_zero_squad2_desc_only.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=multiwoz22_zero
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_cat_slot_value_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-cased-squad2.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_cat_slot_value_bert_snt_pair_match_desc_value.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$MULTIWOZ22_ZERO_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=2e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=8000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=x
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...d-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_all_uncased_bert_desc_only_128.sh b/...d-scripts/configs/flat_noncat_slots_bert_snt_pair_dstc8_all_uncased_bert_desc_only_128.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_all
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=2000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x
diff --git a/...ipts/configs/flat_noncat_slots_bert_snt_pair_dstc8_all_uncased_snli_bert_desc_only_128.sh b/...ipts/configs/flat_noncat_slots_bert_snt_pair_dstc8_all_uncased_snli_bert_desc_only_128.sh
@@ -0,0 +1,55 @@
+# https://stackoverflow.com/questions/965053/extract-filename-and-extension-in-bash
+config_name=`basename "$1"`
+
+EXP_NAME="${config_name%.*}"
+echo $EXP_NAME
+TASK_NAME=dstc8_all
+EXP_DIR=$SGD_WORK_DIR/$TASK_NAME/$EXP_NAME/
+EXP_MODELS=$EXP_DIR/models/
+EXP_SUMMARY=$EXP_DIR/summary/
+EXP_RESULTS=$EXP_DIR/results/
+
+# model_type, some model name to initialize or load pretrained model
+MODEL_TYPE=flat_noncat_slots_bert_snt_pair_match
+# encoder config name for the task
+ENCODER_CONFIG_NAME=
+# encoder_model_name_path, whether a name or a path for the model
+ENCODER_MODEL_NAME_PATH=$SGD_JSON_CONFIG_DIR/encoders/bert-base-uncased-snli.json
+# config name for the task
+CONFIG_NAME=$SGD_JSON_CONFIG_DIR/models/flat_noncat_slots_bert_snt_pair_match_desc_only.json
+# model_name_path, whether a name or a path for the model
+MODEL_NAME_PATH=
+# cache_dir, the cache_dir for store the mebdding, exampls.
+CACHE_DIR=$SGD_CACHE_DIR
+# data_dir, the data_dir for the splits
+DATA_DIR=$DSTC8_DATA_DIR
+# train_file, the file for training
+TRAIN_FILE=train
+# dev_file, the file for eval
+DEV_FILE=dev
+# test_file, the file for eval
+TEST_FILE=test
+# per_gpu_eval_batch_size
+PER_GPU_EVAL_BATCH_SIZE=16
+# per_gpu_train_batch_size
+PER_GPU_TRAIN_BATCH_SIZE=16
+# num_train_epochs
+NUM_TRAIN_EPOCHS=10
+# learning_rate
+LEARNING_RATE=5e-5
+# gradient_accumulation_steps
+GRADIENT_ACCUMULATION_STEPS=8
+# logging_steps
+LOGGING_STEPS=2000
+# save_steps 
+SAVE_STEPS=1000000
+# JOINT_ACC_ACROSS_TURN
+JOINT_ACC_ACROSS_TURN=
+# USE_FUZZY_MATCH
+USE_FUZZY_MATCH=x
+# MAX_SEQ_LENGTH
+MAX_SEQ_LENGTH=512
+# warmup_step
+WARMUP_PORTION=0.1
+# whether finetuning the encoder
+ENCODER_FINETUNING=x