• 아이콘 별실시간 접속자 수
  • 사이트 내 전체검색

슬롯시대 커뮤니티!

슬롯시대 고객님들과 함께 소통하는 공간입니다.
슬롯시대 커뮤니티에서 다양한 의견을 나누고, 함께하세요.

"믿었던 챗GPT가 환각률 48%라니...", 챗GPT 어쩌나1

컨텐츠 정보

본문

20일 테크크런치는 오픈AI의 사내 벤치마크인 ‘퍼슨(Person) QA’ 평가 결과를 인용해, o3 모델이 33%의 질문에 대해 환각을 일으켰다고 보도했다. 이는 o1(16%)과 o3 미니(14.8%)보다 두 배 이상 높은 수치다. 더 심각한 것은 o4 미니다.
이 모델은 무려 48%의 환각률을 기록하며 GPT-4o를 포함한 기존 모델들보다도 더 불안정한 모습을 보였다.

오픈AI는 지난 16일, 이들 모델을 “이미지를 사고 과정에 통합할 수 있는 최초의 모델”이라고 소개하며 출시했다. 단순히 이미지를 인식하는 것을 넘어, 시각 정보 자체를 추론 과정에 활용할 수 있다는 설명이다. 실제로 o3와 o4 미니는 사용자가 올린 화이트보드 그림, 도표, 그래프 등을 분석하고, 흐릿하거나 회전된 이미지도 처리할 수 있는 능력을 갖췄다.

성능 측면에서도 코딩 관련 벤치마크인 SWE 테스트에서 o3는 69.1%, o4 미니는 68.1%를 기록해, 이전 모델인 o3 미니(49.3%)는 물론, 경쟁 모델인 클로드 3.7 소넷(62.3%)보다도 높은 수치를 보였다. 하지만 이러한 기술적 진보에도 불구하고, 환각률은 오히려 이전보다 증가했다. 그동안 새로운 모델이 출시될 때마다 환각 문제는 점진적으로 개선되어 왔다는 점에서, 이번 결과는 이례적이라는 지적이 나온다.


https://www.fnnews.com/news/202504201250325892

 

 

관련자료

댓글 0
등록된 댓글이 없습니다.

"믿었던 챗GPT가 환각률 48%라니...", 챗GPT 어쩌나1

전체 10,001 / 450 페이지
보증업체 off보증업체 커뮤니티 off커뮤니티 홈 off 정보 off정보 로그인 off로그인
알림 0