rag 4

RAG는 왜 문제일까...

두가지 관점이 생겼다. 벡터 라이징을 통한 데이타관리 관점과 AI서비스 UseCase를 만들수있는 WorkFlow와는 분리해서  적용해야할거 같다. 자연어 질의와 비정형문서의 내용을 결합하여 문맥을 이해한 답변을 보장할까? "벡터 임베팅은 단순한 쿼리에서도 결과가 관련성을 갖도록 보장하지 않는다." 쿼리 컨텍스트로 문제가 해결되지 않는다. 즉 유사도를 기반으로 하는 검색의 결과는 항상 정확하지 않기때문이다. AI 어플리케이션은 사용자관점은 모든 만능이라고 생각하고 있지만 RAG연동은 구멍이 많이 있다. 벡터임베딩은 수백만개 문서를 저장할수 있고 상위3개의 청킹에서 답변을 찾을수 있다라고 하지만  실제는 마음속에는 불안한 마음만 있다.  다양한 개선점의 제안 1.Reranking  파인튜닝된 Reranki..

RAG -VectorDB

금융권은 이제 생성형 AI 도입이 시작되는 느낌이다. 점차 다양한 유즈케이스가 생겨나고, 시스템화가 늘어날것으로 생각된다.그중에서 가장 중요한것이 회사별 지식베이스 구축이다. 대용량의 지식을 벡터화 하여 구축하는것이 시작점일 것이다.실제 실무에서 구축하다보면 대용량, 고가용성은 중요키워드이고 벡터DB에 대한 중요성이 강조되고 있다. 실무적관점에서 자료를 정리해보았으니 참고부탁드린다.

2024년 상반기 세미나 자료 공유

IT분야는 점점 AI에 대한 관심도가 커지고 있고 투자나 구축도 인공지능외는 앞으로 점점 없어질듯 하다.LLM 분야에서 상반기에 키워드는 도입기를 지나 하반기부터는 AI 플랫폼 구축이 확대 될것으로 보인다.금융의 환경이 망분리 규제 완화가 화두이긴 한테 조만간 정리될것으로 보이고, Saas기반 이던 온프라미스 기반이던 둘다 대응가능한 AI 전략이 필요할 것이다.LLM모델의 발전속도는 하루가 다르게 변화되고 있고, 국외에 다양한 오픈소스 모델이나 폐쇠형 모델 등의 추이를 잘 살펴보고있어야 한다. 국내에서는 업스테이지 솔라가 가장 우위를 보이고 있고, 가장 많은 고객을 확보할것이다.LLM 모델에 대한 연구보다는 모델에 대한 파인튜닝 기법에 대한 연구가 더 효율성이 있어보인다.AI 플랫폼은 LLM모델에 대한 ..

IT세미나자료 2024.07.05