본문 바로가기
유머, 이슈, 일상

오늘 공개 된 GPT-4 성능

by 프레임 2023. 3. 15.
728x90
반응형

사람도 풀기 힘든 복잡한 문제를 풀 수 있음

a,b,c..순서대로 시작하는 단어를 이용해 신데렐라 한줄요약

 



이미지를 인식하고 관련된 질문에 대답할 수 있음 (기존 GPT-3.5와 가장 큰 차이점) 

 



이전버전보다 더 많은 양의 텍스트를 한번에 입력받을 수 있음. 긴 텍스트 요약에 유용

 

반응형











복잡한 문제 해결

 

 

이전 버전보다 시험 잘 봄

 

챗GPT는 미국 변호사 시험에서 하위 10%의 성적을 받았지만

GPT-4는 상위 10% 점수를 받음. 

MMLU 벤치마크에서  86.4점에 도달함. 

 



기존 챗GPT에 비해 거짓말이 줄어든  GPT-4

 




거짓말, 정확도, 윤리 개선


곧 사람을 대체할 논문 머신이 될지도

728x90
반응형

댓글