AI | 2025.11.25

메타 차세대 월드모델 V-JEPA 2가 제시한 ‘신세계’

연구자 정보

디온 프로필 보기

  • 출신대학 : KAIST
  • 전공 : 전산학과
  • 연구분야 : World Models, AI Safety

1분 요약

지금까지 로봇은 처음 맞닥들이는 상황에선 거의 무조건 실패했습니다. 컵 모양이 조금만 다르거나, 조명이 좀 어둡거나, 책상 위치가 바뀌면 바로 멈춰 버렸죠. 왜냐하면 “이런 화면이 보이면 이렇게 움직여라”라는 외운 패턴밖에 없었기 때문입니다. 월드모델은 로봇이 행동하기 전에 ‘이렇게 움직이면 이렇게 되겠구나’ 하고 머릿속으로 먼저 결과를 그려보게 해 주는 기술입니다. 이렇게 하면 로봇이 보여준 적 없는 상황도 스스로 판단할 수 있게 됩니다. V-JEPA2는 로봇이 처음 보는 상황에서도 바로 판단하도록 만들기 위한 메타의 차세대 월드모델입니다. 메타는  먼저  인터넷 영상으로 사람들이 물건을 어떻게 잡고 움직이는지학습했습니다. 그 다음에는 로봇이 실제로 팔을 움직이는 짧은 영상을 보며, 자기 행동이 장면을 어떻게 바꾸는지 직접 연결해서 배웁니다. 이 둘이 합쳐지면 로봇은 처음 보는 컵이라도 손을 뻗기 전에 “이렇게 하면 잡히겠구나” 하고 예상할 수 있습니다. 로봇이 사람처럼 상황을 이해하는 방향으로 실제로 나아갈 수 있음을 보여준 첫 결과라는 점에서 중요합니다.

본문

Chapter 1: 나의 생각

새로운 AI시대의 열쇠?

로봇 팔 하나가 책상 위의 컵을 바라보고 있습니다. 처음 보는 컵입니다. 처음 와본 방입니다. 그런데 이 로봇은 컵을 집습니다. 어떻게 가능했을까요?

보통의 로봇이라면 불가능합니다. 기존 로봇들은 “이런 장면에서는 이렇게 움직여라”를 수천 번 학습해야 작동합니다. 하지만 메타가 2025년 6월에 공개한 V-…

스탠다드 등급 이상 멤버십 구독이 필요합니다.

로그인 멤버십 소개 보기

연구자 의견

메타와 엔비디아 중 어디가 더 미래 포텐셜이 있다고 보는가?

메타는 100점 만점에 78점, 엔비디아는 81점으로 대동소이하다.

그런 관점에서 봤을 때 글을 작성하는 시점 기준으로 메타의 주가는 기술력과 포텐셜에 비해 다소 과소평가 된 감은 있다.

메타와 엔비디아 두 기업은 월드모델과 관련된 주요 기업이지만 그 목적과 기여점이 꽤나 달라 흥미롭다.

메타는 얀 르쿤 교수의 주도하에 오랜기간 월드모델의 중요성과 관련된 연구를…

비즈니스 등급 이상 멤버십 구독이 필요합니다.

로그인 멤버십 소개 보기

문의하기

궁금한 점을 남겨주시면 리포트를 작성한 연구자가 직접 답변드립니다.

VIP 등급 이상 멤버십 구독이 필요합니다.

로그인 멤버십 소개 보기

커피챗 신청

커피챗을 신청하시면 하이젠버그 운영진과 직접 이야기를 나눌 수 있습니다.

VVIP 등급 이상 멤버십 구독이 필요합니다.

로그인 멤버십 소개 보기