[Llama3 파인튜닝] 코드 업데이트 및 실험 2

728x90

0. 환경 및 변경사항

GPU : A6000 (VRAM 48GB)
데이터 프롬프트 코드 변경

def format_dataset(example):
    prompt = f"[INST] {example['instructions']}\n\n {example['inputs']} [/INST] {example['outputs']}"
    return {'text': prompt}

epoch 5, per_device_train_batch_size 2

1. Out Of Memory

"Shut Down Kernel" 로 GPU 메모리 Reset 후 해결 (라이브러리 및 모델 보존)
per_device_train_batch_size를 4에서 2로 변경
runpod 서버 활용 시, A6000으로 실험 (VRAM = 48GB)

2. cannot import name 'deprecated' from 'typing_extensions'

pip install 명령 실행시, bitsandbytes와 transformer 순으로 설치
초기 설치 후, 단독으로 업그레이드나 재설치 시 동일한 에러 발생
GPU 초기화를 이유로 코드 재실행이나 업그레이드 지양

3. SFTConfig

SFTrainer의 최신 버전에서는 dataset_text_field를 지원하지 않음
max_seq_length, packing, tokenizer 도 동일
TrainingArguments의 내용들이 to_dict 변환 후 SFTConfig로 들어가는 구조이기 때문에, SFTConfig로 변환하여 사용

trl/trl/trainer/sft_trainer.py at main · huggingface/trl

Train transformer language models with reinforcement learning. - huggingface/trl

github.com

4. 결과 확인

"문제: 답:" 과 유사한 형식 출력

[{'generated_text': '[INST] 당신은 퀴즈 전문가입니다. 주어진 문장을 바탕으로 퀴즈를 출제해주세요.\n\n 광화문(光化門)은 경복궁의 남문으로, 궁의 정문 기능을 하는 문이다. 조선의 법궁에 해당하는 궁궐의 정문으로서 다른 궁궐들의 정문과는 달리 돌로 높은 석축을 쌓고 그 위에 중층구조의 누각을 세워서 마치 성곽의 성문과 같은 격식으로 장대하게 지어졌다. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁�의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의 정문 기능을 하는 문이야, 검색어 : 정문 기능 하는 문은 광화문이지. [/INST] 출제 : 광화문은 조선의 법궁에 해당하는 궁궐의'}]

저작자표시 (새창열림)

'ML_DL > MUJAKJUNG (무작정 시리즈)' 카테고리의 다른 글

이미지 분류 모델 작성하기 (feat. wandb) (0)	2025.02.19
프로젝트 업그레이드 1탄 - 프로젝트 생성 (0)	2025.02.06
[Llama3 파인튜닝] 파인튜닝 코드 작성 및 실험 1 (3)	2024.12.18
[Streamlit] 앱 실행하기 (0)	2024.10.11
[OpenAI] OpenAI API 발급 및 request (0)	2024.08.21

0. 환경 및 변경사항

1. Out Of Memory

2. cannot import name 'deprecated' from 'typing_extensions'

3. SFTConfig

4. 결과 확인

'ML_DL > MUJAKJUNG (무작정 시리즈)' 카테고리의 다른 글

티스토리툴바