문제 상황: RAG로 검색된 DB 조회시 유사도 점수가 코사인 기준이 아닌 L2 Norm으로 출력
원인: Chroma DB로 vector를 저장할 때 기본값이 L2 Norm임
db = Chroma.from_documents(
batch,
HuggingFaceBgeEmbeddings(model_name=embedding_model, model_kwargs={'device': 'cuda'}),
persist_directory='벡터DB 경로',
collection_metadata={"hnsw:space": "cosine"})
해결 방법: Vector 저장할 때 collection_matadata에서 cosine으로 명확히 지정하여 해결
728x90
반응형
'TechStudy > LLM' 카테고리의 다른 글
[펌] LLM 학습의 어려움 (1) | 2024.12.13 |
---|---|
[문제해결] 모델 사용시 model 이름이 겹친다는 경고문 해결하기 (0) | 2024.11.15 |
[펌] 사람처럼 생각하는 자체교정 프롬프트 (0) | 2024.09.09 |
[펌] 프롬프트 엔지니어링(?)의 중요성 (0) | 2024.07.15 |
트랜스포머 구조의 비밀 (1) | 2024.07.01 |