rlhf_korean_dataset

For the rlhf learning environment of Koreans 한국 사람들의 RLHF(Reinforcement Learning from Human Feedback) LLM 학습을 위해 성균관대학교 바이브컴퍼니 산학협력 과제 과정에서 일상대화 챗봇 개발을 목적으로 데이터 선별, 자연스러운 전처리 등의 과정을 거쳐서 만든 데이터셋입니다.

이 데이터셋은 DeepSpeedChat 라이브러리용으로 제작이 되었기에 prompt, chosen, rejected의 구조를 가지고 있습니다.

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
candidate data		candidate data
images		images
ppt		ppt
step1		step1
step2		step2
step3		step3
tools		tools
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rlhf_korean_dataset

About

Releases

Packages

Contributors 2

Languages

JoJo0217/rlhf_korean_dataset

Folders and files

Latest commit

History

Repository files navigation

rlhf_korean_dataset

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages