Name		Name	Last commit message	Last commit date
parent directory ..
coco		coco
somdst		somdst
sumbt_data		sumbt_data
trade_data		trade_data
README.md		README.md
data_utils.py		data_utils.py
eval_utils.py		eval_utils.py
evaluation.py		evaluation.py
inference.py		inference.py
model.py		model.py
predict_test.py		predict_test.py
preprocessor.py		preprocessor.py
requirements.txt		requirements.txt
sumbt_train.py		sumbt_train.py
test.py		test.py
test_train.py		test_train.py
trade_train.py		trade_train.py

README.md

T1061 민재원 폴더

Baseline model of BoostCamp2021 P-Stage DST

Open-vocab based DST model인 TRADE의 한국어 구현체입니다. (5강, 6강 내용 참고)

기존의 GloVe, Char Embedding 대신 monologg/koelectra-base-v3-discriminator의 token_embeddings을pretrained Subword Embedding으로 사용합니다.
메모리를 아끼기 위해 Token Embedding (768) => Hidden Dimension (400)으로의 Projection layer가 들어 있습니다.
빠른 학습을 위해 Parallel Decoding이 구현되어 있습니다.

1. 필요한 라이브러리 설치

pip install -r requirements.txt

2. 모델 학습

SM_CHANNEL_TRAIN=data/train_dataset SM_MODEL_DIR=[model saving dir] python train.py
학습된 모델은 epoch 별로 SM_MODEL_DIR/model-{epoch}.bin 으로 저장됩니다.
추론에 필요한 부가 정보인 configuration들도 같은 경로에 저장됩니다.
Best Checkpoint Path가 학습 마지막에 표기됩니다.

3. 추론하기

SM_CHANNEL_EVAL=data/eval_dataset/public SM_CHANNEL_MODEL=[Model Checkpoint Path] SM_OUTPUT_DATA_DIR=[Output path] python inference.py

4. 제출하기

3번 스텝 inference.py에서 SM_OUTPUT_DATA_DIR에 저장된 predictions.json을 제출합니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ekzm8523

ekzm8523

README.md

T1061 민재원 폴더

Baseline model of BoostCamp2021 P-Stage DST

1. 필요한 라이브러리 설치

2. 모델 학습

3. 추론하기

4. 제출하기

Files

ekzm8523

Directory actions

More options

Directory actions

More options

Latest commit

History

ekzm8523

Folders and files

parent directory

README.md

T1061 민재원 폴더

Baseline model of BoostCamp2021 P-Stage DST

1. 필요한 라이브러리 설치

2. 모델 학습

3. 추론하기

4. 제출하기