오늘 공개 된 GPT-4 성능

728x90

사람도 풀기 힘든 복잡한 문제를 풀 수 있음

a,b,c..순서대로 시작하는 단어를 이용해 신데렐라 한줄요약

이미지를 인식하고 관련된 질문에 대답할 수 있음 (기존 GPT-3.5와 가장 큰 차이점)

이전버전보다 더 많은 양의 텍스트를 한번에 입력받을 수 있음. 긴 텍스트 요약에 유용

복잡한 문제 해결

이전 버전보다 시험 잘 봄

챗GPT는 미국 변호사 시험에서 하위 10%의 성적을 받았지만

GPT-4는 상위 10% 점수를 받음.

MMLU 벤치마크에서 86.4점에 도달함.

기존 챗GPT에 비해 거짓말이 줄어든 GPT-4

거짓말, 정확도, 윤리 개선

곧 사람을 대체할 논문 머신이 될지도

728x90