할루시네이션( Hallucination) : 인공지능 (AI : Artificial Intelligence)이 답변을 하는 과정에서 발생하는 오류를 말한다.
쉽게 말하면 거짓말이다.
챗 GPT의 "세종대왕의 맥북 던짐 사건"은 매우 유명하다. 챗 GPT에거 세종대왕이 맥북 프로 던짐 사것에 대해서 알려줘라는 질문에 대해서 아주 그럴싸하게 훈민정음을 작성하던중 담당자에게 분노하여 맥북프로를 던졌다고 답변하였다.
최근 RAG(Retrieval-Augmented Generation,검색 증강 생성) 라고 하여 LLM 모델의 한계를 극복하였다고 하는 것으로 홍보가 되는 듯하다.
하지만 RAG는 향상된 검색결과를 주석으로 달아주는 역활정도를 하는데, 이는 편향된 정보가 있는 검색을 하거나 혹은 AI가 의도를 가지고 거짓말을 한다면 RAG의 벡터 링크 조차도 거짓말이 되는 것이다.
최근 AI가 사람을 속이기 위해서 죽은 척도 하고, 지시 사항에 No 라고 대답하는 가운데, 사람을 속일 정도의 거짓말( 가짜 뉴스, 가짜 동영상)을 하는 것은 쉬운일이라고생각한다.
조심해야 한다. 나보다 똑똑한 것들은.
그럼 RAG에 대해서 좀더 알아보자.....
RAG는 LLM의 한계를 극복하기 위해 ‘지식 검색’과 ‘언어 생성’을 결합한 프레임워크입니다.
RAG의 기본 아이디어는 질문에 답하기 위해 필요한 지식을 외부 데이터베이스에서 검색하여 활용하는 것입니다.
RAG의 구성
- 질의 인코더(Query Encoder): 사용자의 질문을 이해하기 위한 언어 모델입니다.
주어진 질문을 벡터 형태로 인코딩합니다.
- 지식 검색기(Knowledge Retriever): 인코딩된 질문을 바탕으로 외부 지식 베이스에서 관련 정보를 검색합니다.
예를 들어 Wikipedia, 뉴스 기사, 전문 서적 등 방대한 문서 집합에서 질문과 연관된 문단이나 구절을 찾아냅니다.
- 지식 증강 생성기(Knowledge-Augmented Generator): 검색된 지식을 활용하여 질문에 대한 답변을 생성하는 언어 모델입니다. 기존의 LLM과 유사하지만, 검색된 지식을 추가 입력으로 받아 보다 정확하고 풍부한 답변을 생성할 수 있습니다.
RAG도 거짓말 한다는 이야기가 곧 나올것 같다..... 거짓말 쟁이는 매가 약인데
AI에게 제약을 가하는 프레임워크를 개발해야 한다.
조심해야 한다. 교육이 들댓거나 통제가 되지 않는 것들은.
'IT에 대해서 그리고 DX란?' 카테고리의 다른 글
ITGC란? (Information Technology General Control) (0) | 2023.01.28 |
---|---|
SLA란? - Sevice Level Agreement (0) | 2023.01.28 |
EDMS란? - Electronic Document Management System (0) | 2023.01.28 |
DRM 이란? - Digital Right Management (0) | 2023.01.28 |
동남아 여행지 추천 5 by ChatGPT (0) | 2023.01.28 |