TechStudy/SyntheticData
2024. 6. 20.
Nemotron: LLM훈련을 위한 합성데이터 생성모델
발매날짜: 2024년 6월 14일Nemotron-4 340B Instruct: 현실세계의 다양한 합성 데이터 생성 모델Nemotron-4 340B Reward: Helpfulness, correctness, coherence, complexity, verbosity 5가지 기준 고품질 필터링 모델Nemotron-4 340B Base: 기초 모델 필터모델이 참조한 데이터셋(ShareGPT기반): https://huggingface.co/datasets/nvidia/HelpSteer2 nvidia/HelpSteer2 · Datasets at Hugging FaceSure! I can help you with data analysis in a variety of ways, depending on your sp..