연구자 정보
디온(DION) 프로필 보기
- 출신대학 : KAIST
- 전공 : 전산학과
- 연구분야 : Deep Learning, World Models
1분 요약
앤트로픽이 스스로 만든 모델을 봉인했습니다. 이유는 “너무 위험하다”는 것. 그 안에 숨어 있다고 지목된 기술이 ‘루프드 트랜스포머’입니다. 기존 AI가 중간 사고를 글로 적어가며 푼다면, 이 구조는 아무것도 안 적고 같은 회로를 수십 번 머릿속에서만 곱씹습니다. 이렇게 되면 속도도 빨라지고 토큰 비용도 줄어듭니다. 특히 최근 논문 한 편이 이 방식으로 파라미터 절반짜리 모델이 일반 모델 수준에 거의 도달한다는 것을 처음으로 수학적으로 증명했습니다. 절반 크기로 같은 성능이면, 클라우드 없이 최고 수준의 AI가 직접 돌아갈 수 있다는 뜻입니다. 삼성·LG·현대가 만드는 스마트폰과 자동차, 로봇에 클라우드 없이 최고 수준의 AI가 올라가는 시대가 오게 될 가능성이 있습니다. 디바이스 제조는 강하지만 클라우드가 약한 한국 전자 산업에 현재의 기술이 큰 기회가 될 수 있습니다.
본문
연구자 의견
커피챗 신청
커피챗을 신청하시면 하이젠버그 운영진과 직접 이야기를 나눌 수 있습니다. 혹 슬롯이 없다면 ceo@heisenberg.kr로 메일주세요!