전체 글 162

시스템1과시스템2의 병합 모델

open ai o1이 나온후에 시스템1과 시스템2가 병합된 모델이 나와야 진정한 AI모델이지 않을까라는 생각을 했었다.근데 벌써 나오다니 충격적이고 자체 테스트를 해보니 MoE아키텍처 기반이라 응답속도가 거의 sLLM급에 RAG연동도 훌륭한 성능을 보여주었다. 현존하는 오픈모델중의 최고의 모델이다.AGI가 25년에 더빨리 다가올듯하다.

RAG는 왜 문제일까...

두가지 관점이 생겼다. 벡터 라이징을 통한 데이타관리 관점과 AI서비스 UseCase를 만들수있는 WorkFlow와는 분리해서  적용해야할거 같다. 자연어 질의와 비정형문서의 내용을 결합하여 문맥을 이해한 답변을 보장할까? "벡터 임베팅은 단순한 쿼리에서도 결과가 관련성을 갖도록 보장하지 않는다." 쿼리 컨텍스트로 문제가 해결되지 않는다. 즉 유사도를 기반으로 하는 검색의 결과는 항상 정확하지 않기때문이다. AI 어플리케이션은 사용자관점은 모든 만능이라고 생각하고 있지만 RAG연동은 구멍이 많이 있다. 벡터임베딩은 수백만개 문서를 저장할수 있고 상위3개의 청킹에서 답변을 찾을수 있다라고 하지만  실제는 마음속에는 불안한 마음만 있다.  다양한 개선점의 제안 1.Reranking  파인튜닝된 Reranki..