Huggingface TRL SFTTrainer

Creator

Creator

Seonglae Cho

Created

Created

2024 Feb 27 8:39

Editor

Editor

Seonglae Cho

Edited

Edited

2024 Mar 4 12:33

Refs

Refs

Huggingface Trainer

Reinforcement learning 아니지만 wrapper로 들어있다

max_seq_length - min(tokenizer.model_max_length, 1024)

packing -
Dataset Packing

formatting_func

Supervised Fine-tuning Trainer

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

https://huggingface.co/docs/trl/sft_trainer

Recommendations

////////