TechStudy/LLM
2024. 6. 4.
Llama3, 그리고 ORPO
4월 18일에 발매된 Meta Llama3 [MetaLlama3 주요 특징]: 새로운 아키텍처 없음. 학습 데이터 2T -> 15T 확장 토크나이저 크기 32k -> 128k 확장 종류: 8B(~2023.03), 70B(~2023.12), 400+B 모델 3가지 Llama 3 엑세스 및 사용: 올라마, docker, LM스튜디오 3 곳에서 Mac, Linux, Windows 사용자 접근 가능 LLM 파인튜닝 도구 여부: XTuner에서 Llama-3 기반의 LLaVA 모델 공개. > 라마 2는 한국어 튜닝시, 토크나이저에 한국어 토큰을 추가하는 복잡한 과정 필요 라마 3은 그냥 한국어 데이터만 추가로 학습시키면 라마 3 한국어 특화 모델 생성 가능 주의사항: 업무 활용시 llama3- 라고 꼭 앞에..