RAG는 왜 문제일까...

관심분야/생성형AI

RAG는 왜 문제일까...

알 수 없는 사용자 2024. 12. 18. 17:23

두가지 관점이 생겼다.

벡터 라이징을 통한 데이타관리 관점과 AI서비스 UseCase를 만들수있는 WorkFlow와는 분리해서
적용해야할거 같다.
자연어 질의와 비정형문서의 내용을 결합하여 문맥을 이해한 답변을 보장할까?
"벡터 임베팅은 단순한 쿼리에서도 결과가 관련성을 갖도록 보장하지 않는다."
쿼리 컨텍스트로 문제가 해결되지 않는다. 즉 유사도를 기반으로 하는 검색의 결과는 항상 정확하지 않기때문이다.
AI 어플리케이션은 사용자관점은 모든 만능이라고 생각하고 있지만 RAG연동은 구멍이 많이 있다.
벡터임베딩은 수백만개 문서를 저장할수 있고 상위3개의 청킹에서 답변을 찾을수 있다라고 하지만
실제는 마음속에는 불안한 마음만 있다.

다양한 개선점의 제안
1.Reranking
파인튜닝된 Reranking 모델이라고 하더라도 정확도가 확 높아지지 않고 오히려 더 낮아진다는 연구결과 존재
2.GraphRAG와 KG-RAG(지식그래프)
일반 임베팅보다 낮은 점수도 나오고 더 뛰어난 결과를 보이지도 않는다는 발표사례 존재
3.BM25
키워드 하이브리드 검색의 경우도 정확도 측면에서 실용적이지 않다
4.Big LLM
파라미터 사이즈가 큰모델의 경우도 환각률이 여전히 높다(RAG연동기준), 많은 컨텍스트를 처리하는것은 더욱 느려지고
환각률을 높인다.

너무 비관적인가....^^

저작자표시 (새창열림)

'관심분야 > 생성형AI' 카테고리의 다른 글

시스템1과시스템2의 병합 모델 (1)	2025.01.06
Chain of thought (0)	2025.01.03
Ragas란? (2)	2024.12.16
RAG -VectorDB (3)	2024.11.21
LLM의 미래 (0)	2024.10.25

현재글RAG는 왜 문제일까...

정을용 IT이야기

다양한 IT이야기.. AI관점이 큽니다.

ragas, Docker, Kubernetes Base, aws, 타입스크립트, UX트렌드, 금융UX, Javafx, CKAD, rag, docker build, AWS DynamoDB, k8s, 쿠버네티스, kubernetes, java, ChatGPT, 형상관리, 신한DS, 자바,

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31