연구자 정보
라온 프로필 보기
- 출신대학 : KAIST
- 전공 : 전산학부
- 연구분야 : AI reasoning, System2 AI
1분 요약
xAI가 공개한 Grok-4를 처음 봤을 때, 그 압도적인 벤치마크 성능에 놀랐습니다. 특히 인간 수준의 추론 능력을 평가하는 벤치마크 테스트에서 기존 모델들을 큰 격차로 앞선 것은 굉장히 인상적이에요. 하지만 저는 이 숫자들이 만들어내는 화려한 착시를 경계해야 한다고 봅니다. 현재의 벤치마크는 데이터 오염 문제에서 자유롭지 못하며, API를 통해 평가가 이루어지는 구조적 한계 때문에 그 신뢰성에 의문이 들거든요. 무엇보다 지금의 LLM 경쟁은 더 많은 GPU와 전력을 쏟아붓는, 지속 불가능한 방향으로 치닫고 있습니다. 따라서 현재의 AI는 막대한 자원으로 쌓아 올린 허상일 수 있습니다. 저는 오히려 인간의 뇌를 모방한 접근법에서 지속가능한 AI, 더 나아가 AGI의 실마리를 찾을 수 있다고 생각합니다.