연구자 정보
라온 프로필 보기
- 출신대학 : KAIST
- 전공 : 전산학부
- 연구분야 : AI reasoning, System2 AI
1분 요약
요즘 떠도는 기사들이나 SNS를 보면 삼성의 초소형 ‘언어’모델인 TRM이 AGI 문턱 넘었다는 소리가 난무한다. 완전히 틀렸다. TRM은 일단 언어모델이 아니다. ChatGPT처럼 대화하는 것도 아니고 범용 AI도 아니다. 여기서 중요한 건, 초거대 LLM들이 스도쿠 하나 제대로 못 푸는데 이 작은 모델은 같은 네트워크를 여러 번 돌려서 87% 정확도로 풀었다는 사실이다. 한 번에 답을 내는 게 아니라 초안 쓰고 → 검토하고 → 고치고 → 또 고치는 구조. 언어 학습 없이도 추론이 가능하다는 걸 보여준 거다. 물론 스도쿠용 모델은 스도쿠만, 미로용은 미로만 푼다는 치명적 한계가 있다. 그럼에도 의미는 크다. 온디바이스 AI나 데이터 수집 어려운 특수 영역에서 쓸 수 있고, 한국도 이런 임팩트를 낼 수 있다는 걸 증명했으니까.