원글 링크: https://heisenberg.kr/furiosaai/

1분 요약

AI가 발전하면 발전할 수록 전기요금과 비싼 GPU 비용이 기업을 짓누릅니다. 현재 AI 기업들 중 대부분이 이로 인해 손해를 보고 있습니다. 비용을 줄이고자 하는 강력한 시장의 원동력이 존재합니다. 퓨리오사 AI는 이 부분을 파고들어, 최고 효율의 AI 반도체 ‘레니게이드’로 엔비디아에 도전합니다. 이들은 메타의 인수 제안을 거절하고 최근엔 1,700억 원을 조달했으며, LG EXAONE과 실사용 협력을 시작했습니다. CUDA 생태계 의존을 벗어나 전세계에서 가장 앞선 AI 반도체 기업이 되고자 합니다.

퓨리오사AI는?

인공지능(AI) 시대, AI의 능력은 폭발적으로 성장하고 있지만 그 지능을 유지하는 데 필요한 에너지 소비와 인프라 비용 역시 천문학적으로 치솟고 있다. AI 혁명의 혜택 이면에 가려진 ‘지속가능성의 위기’다. 대부분의 기업들이 돈을 벌지 못하고 있다. 너무나 인프라가 비싸고 엔비디아에 치우쳐진 시장 상황 때문이다.

‘인공지능’의 대가가 감당하기 어려울 만큼 비싸지고 있는 상황에서, 메타의 인수를 거절하는 패기와 대통령이 찾아갈 정도의 기술력을 갖춘 반도체 유니콘 스타트업이 한국에 있다.

바로 퓨리오사AI다.

이재명 대통령은 퓨리오사AI에 방문하여 R&D 투자와 인재 육성 방안에 대해 논의했다.

퓨리오사AI는 AI 컴퓨팅을 위한 더 효율적이고 지속가능한 새로운 패러다임을 주창한다. 최근 1,700억 원 규모의 브릿지 투자 유치와 LG AI 연구원과 초거대 AI ‘엑사원(EXAONE)’에 자사 칩을 공급하는 계약은 맺은 것에서 퓨리오사AI가 엔비디아를 대체하겠다는 것이 단순한 허상이 아니라는 결정적 증거다.

우리 하이젠버그 팀은 백준호 대표를 만나 AI 반도체 시장의 판도를 바꿀 그들의 전략과 기술적 해자와 비전에 대해 물었다.

레니게이드 혁명

Q1) 퓨리오사의 2세대 칩의 성능은?

연산 능력은 거의 10배 이상, 메모리 성능은 무려 25배 정도 향상되었습니다. 단순히 성능만 높인 것이 아니라 근본적인 체급을 바꾼 것입니다.

공정 기술만 봐도 1세대 워보이가 14나노 공정이었다면, 이번 레니게이드는 세계 최첨단 기술인 5나노 공정으로 제작됐습니다. 칩의 크기, 즉 다이 사이즈(Die Size)도 180mm^2 수준에서 650mm^2 로 극적으로 커졌죠. 이는 단순히 기존 설계를 키운 것이 아니라, 완전히 새로운 차원의 문제에 도전하기 위한 설계 혁신이었습니다.

Q2) 칩 설계에 어떤 변화가 있었는가?

15층짜리 건물을 여러 개 쌓는다고 300층짜리 초고층 빌딩이 되지는 않습니다. 300층을 지으려면 바람의 저항을 견디는 물리 법칙부터, 건물의 하중을 버티는 기초 공법, 최상층까지 자재를 옮기는 물류 시스템까지 모든 것이 달라져야 합니다. 완전히 다른 학문 분야에 가깝죠. 5나노 공정에서 650mm^2라는 거대한 칩을 설계하는 것도 마찬가지입니다. 이 크기는 반도체를 만들 수 있는 기술적 한계에 근접한 사이즈로, 엔비디아의 최상급 GPU와 어깨를 나란히 하는 수준입니다.

단순히 회로를 더 넣는 것을 넘어, 이 넓은 면적에 어떻게 전력을 안정적으로 공급할지, 빽빽한 공간에서 발생하는 열을 어떻게 관리할지, 수십억 개의 트랜지스터가 오류 없이 통신하게 할지를 완전히 새롭게 구상해야 했습니다.

특히 HBM(고대역폭 메모리)을 2.5D 패키징 기술로 통합한 것은, 수백 층의 거대한 빌딩 지하에 초고속 지하철 시스템을 직접 연결한 다음, 도시의 데이터망과 동기화시킨 것과 비슷합니다. 한국 반도체 역사에서도 상당히 기념비적인 작업이라고 자부합니다.

이런 기술력이 퓨리오사AI가 틈새시장을 노리는 것이 아니라, 엔비디아가 장악한 고성능 컴퓨팅 시장의 심장부를 직접 겨냥하고 있음을 보여주는 증거라고 생각합니다.

GPT-4, GPT-5와 같은 초대형 모델은 엔비디아 GPU를 수만 장을 묶어서 처리하죠. 저희 칩(레니게이드)도 마찬가지로 여러 장을 병렬로 연결해 병렬 처리하면 GPT-5급 모델도 충분히 소화할 수 있습니다.

구분	워보이(1세대)	레니게이드(2세대)
공정	삼성 14나노	TSMC 5나노
다이사이즈 (mm^2)	180	650
연산 성능	–	약 10배 향상
메모리 대역폭	약 66 GB/s	약 1.5 TB/s
메모리 사양	LPDDR4X	HBM3
소비 전력	40~60W	약 150W
지원 데이터 타입	INT8	FP8, BF16, IN4

Q3) 퓨리오사AI 칩의 아키텍처의 특징은?

우리는 TCP(Tensor Contraction Processor)라는 것을 사용합니다.

쉽게 설명해보겠습니다. 딥러닝 연산의 기본 단위는 행렬 곱셈입니다. 엔비디아 GPU 같은 기존 프로세서는 거대한 행렬 곱셈을 수천 개의 작은 코어로 잘게 쪼개 나눠 처리합니다.

반면 저희 칩은 애초에 큰 연산을 한 덩어리로 처리하도록 만들어졌습니다. 저희 TCP 아키텍처는 거대한 텐서 연산 하나를 하나의 기본 명령으로 지원해요.

그 덕분에 연산을 쪼개고 다시 취합하는 과정의 오버헤드가 크게 줄고, 하드웨어가 전체 연산 흐름을 글로벌하게 최적화할 수 있습니다.

비유하자면 100명의 일꾼에게 각각 작업 지시를 내리는 대신, 큰 작업 단위로 묶어 한 번에 지휘하는 셈입니다. 적은 명령어로 더 많은 일을 시키니 효율과 속도 모두 유리하겠죠. 또 데이터 이동을 최소화하는 등 하드웨어 차원에서 전력 낭비를 줄이는 설계가 곳곳에 적용되어 있습니다.

이러한 고수준 추상화(abstraction) 덕분에 저희 컴파일러나 소프트웨어가 복잡한 AI 모델을 칩 위에서 효율적으로 실행하기가 더 쉬워집니다. 추상화는 복잡한 시스템을 단순화해서 본질적인 부분만 드러내는 과정을 말합니다. 불필요한 세부 사항을 가려내고, 핵심 기능이나 구조만을 남기는 겁니다.

엔비디아 CUDA는 개발자가 메모리 관리까지 신경 써야 하지만, 저희 칩은 내부에서 많은 것을 자동 관리해주기 때문에 개발자는 모델 로직에 집중하면 됩니다.

거대한 비행기를 조종할 때 수백 개 스위치로 일일이 제어하는 게 아니라, 필요한 몇 가지 조작만으로 운항할 수 있게 만든 느낌이라고 할까요?

하드웨어와 소프트웨어의 경계를 설계 단계부터 새롭게 정의해서 AI 작업에 특화된 구조를 만든 것이 저희의 강점입니다.

더 쉽게 예를 들면 엔비디아 GPU는 행렬 곱셈을 작은 단위로 쪼개서 처리합니다. 낱개의 벽돌을 일일이 옮기는 노동자처럼 말이죠. 반면 저희는 큰 텐서 연산을 한번의 덩어리로 처리할 수 있게 만들었습니다. 벽돌 100장을 한 번에 옮길 수 있는 크레인 같은 장비를 쓰는 것과 같습니다.

Q4) 하이닉스의 HBM을 쓴 이유는?

저희 칩은 추론용이라서, 앞으로 어떤 AI 서비스가 등장하고 어떤 모델이 많이 쓰일지를 내다보고 설계해야 합니다.

레니게이이드 칩 기획을 2021년경 시작할 때만 해도 GPT-3 정도가 연구용으로 나와 있던 수준이었어요. 그때 저희는 초거대 언어모델이 머지않아 상용화될 거라 예측했습니다.

LLM은 정말로 어려운 기술입니다. 오죽하면 엔비디아조차 LLM을 돌리는 것을 두고 “말도 안 되게 어려운 것(Insanely difficulty)’이라고 표현할 정도입니다.

GPT-3 같은 모델을 실서비스로 돌리려면 파라미터(매개변수) 양이 방대해서 감당이 안 됩니다. 그래서 고속 메모리인 HBM이 반드시 필요할 거라 판단했죠. 반면 GPT-3보다 훨씬 작은 모델들을 돌릴 거라면 HBM은 다소 과한 솔루션입니다. 너무 비싸고 복잡하거든요.

아무튼 저희는 2022년부터 HBM이 필요할 것으로 판단하고 칩 설계에 들어갔어요. 그리고 2024년 여름에 레니게이드 칩을 실제 받아봤는데, 당시 하이닉스 쪽에서 적극적으로 손을 내밀어 주셔서 개발 과정에서 기술 지원을 많이 받았습니다.

삼성전자 HBM도 훌륭하지만, 스타트업 입장에선 본인들 메모리를 밀어줄 의지가 강한 파트너와 손잡는 게 중요하거든요. 그런 이유로 하이닉스와 개발을 함께했습니다.

Q5) 팹리스 기업으로서 어떤 역할을 했나?

사람들은 종종 ‘팹리스’가 아이디어만 내고 생산은 다른 곳에 맡긴다고 생각하지만, 그렇진 않습니다. (웃음)

복잡한 건물을 설계하는 건축 설계 사무소에 비유할 수 있습니다. 건축가는 건물의 아름다운 조감도만 그리는 사람이 아닙니다.

모든 기둥에 어떤 종류의 철근을 써야 하는지, 모든 전선이 어떤 경로로 지나가야 하는지, 모든 창문의 정확한 위치는 어디인지 등을 명시한 수천 페이지의 완벽한 설계도를 만듭니다.

파운드리(생산공장)는 그 설계도대로 ‘정확하게’ 시공하는 역할을 맡죠. 최종적으로 건물이 완성됐을 때 불이 켜지고, 엘리베이터가 작동하고, 지진에도 견딜 수 있도록 보장하는 책임은 전적으로 저희 같은 건축가에게 있습니다.

반도체 세계에서 저희는 TSMC에 원자 단위까지 완벽한 청사진을 제공하고, 그 설계가 완벽하게 작동함을 책임지는 역할을 합니다.

Q6) 삼성이 아닌 TSMC를 택한 이유는?

팹리스 입장에서는 프로젝트별 최적의 파운드리를 그때그때 선택합니다. 엔비디아도 과거엔 삼성 파운드리를 이용하다가 최신 제품은 TSMC에서 생산하잖아요.

저희도 2세대 칩의 특성과 일정, 협력 여건 등을 종합 검토해 TSMC를 파트너로 결정했습니다. TSMC는 세계 1위 파운드리이고 삼성도 훌륭한 제조사지만, 이번에는 제품 완성도를 극대화하기에 TSMC가 적합하다고 판단했습니다. 삼성전자가 기분 나빠하지 않겠느냐는 시선도 있는데, 비즈니스 세계에서는 파트너 선택이 프로페셔널하게 이뤄집니다. 1세대 때 삼성과 성공적으로 협력했고, 앞으로도 상황에 따라 최고의 선택을 할 것입니다.”

빅테크와의 경쟁

Q7) 메타의 인수거절을 한 이유는?

특정 기업을 NDA로 인해 거론하긴 어렵지만, 저희가 추구하는 방향은 분명합니다. AI 컴퓨팅을 더 효율적이고 지속가능하게 만드는 혁신을 완수하고 싶습니다.

그리고 그 과정에서 글로벌 시장을 이끌어가는 회사가 되는 것이 꿈입니다. 아직 해내지 못한 일들이 많고, 충분히 해낼 수 있다고 믿어요.

지금 섣부르게 어딘가에 인수되기보다는 직접 승부를 보고 싶었습니다. 기업공개(IPO) 등도 장기적으로 검토는 하겠지만, 당장의 자금 확보보다는 저희 비전 실현이 더 중요합니다. 시장은 분명 커질 것이고, 우리는 이 시장의 리더가 되는 것이 목표입니다.

2세대 칩인 레니게이드의 상용화, 그리고 3세대 칩의 연구 개발까지 이어가며 AI 반도체 업계의 리더가 되는 것이 퓨리오사 AI의 목표다. 당장의 M&A보다 더 큰 무언가를 바라보고 있는 것이다.

우선 2세대 칩 레니게이이드의 상용화에 전념하고 있습니다.

이미 여러 고객사에 샘플을 제공해 시험 중이고, 국내에서는 LG AI연구원과 협력해 좋은 결과를 얻었습니다. 앞으로 레니게이드가 온프레미스(자체 서버 환경)에서 GPU를 대체하는 솔루션으로 자리 잡도록 하는 것이 단기 목표입니다.

동시에 이미 차기 3세대 칩 개발에도 착수한 상태입니다. AI 기술 경쟁이 워낙 빠르기 때문에 계속하여 R&D를 이어가고 있습니다.

또한 최근 1,700억원의 투자 유치는 저희 2세대 칩의 성과가 가시화된 덕분이라 생각합니다. 저희처럼 엔비디아 대항마를 자처한 글로벌 스타트업들이 많지만, 실제로 고객사에서 “GPU 대신 써보니 좋더라”는 평가를 받은 곳은 드뭅니다.

LG의 ‘엑사원’은 2025년 9월 기준으로 한국에 존재하는 가장 우수한 LLM이다.

저희는 LG AI연구원 사례처럼 의미 있는 레퍼런스를 확보했고, 이런 상용화 가능성을 높이 평가받아 대규모 자금을 끌어올 수 있었습니다. 아직 할 일이 많습니다.

올해 말부터 레니게이드 칩 양산에 들어갑니다. 수천, 수만 장 규모로 생산할 계획인데, 이를 위해 SK하이닉스(메모리 공급)뿐 아니라 보드 제작사, 서버 업체 등 여러 파트너와 협력하고 있습니다. 조만간 저희 칩을 8개씩 꽂은 완제품 서버도 선보일 거에요.

투자금의 상당 부분은 이처럼 생산과 공급을 확대하는 데 쓰입니다. 또한 해외 고객 지원과 마케팅 등 사업 확장에도 투입해 글로벌 시장 공략 속도를 높일 생각입니다. 남은 자금은 말씀드린 3세대 칩 등 미래 기술 개발에 투자해서, 계속 앞서는 기술을 확보하는 데 사용할 계획입니다.

내년 초부터는 일반 사용자분들도 구매해서 사용하실 수 있도록 할 계획입니다. 에스오디와 하이젠버그 구독자 분들께서도 많이 사주시고 직접 테스트해보시고, 피드백도 해주시면 더욱 큰 힘이 될 것 같습니다. (웃음)

반도체 칩이라는 것은 정직하기 때문에 꽂아서 테스트 해보면 바로 결과를 알 수 있습니다. 막연히 우리나라는 안 될 것이라는 생각이 있기에 동의를 안 하는 분들도 많겠지만, 기술적인 해자가 없다면 현재의 성과들은 이루어 내기 쉽지 않습니다.

Q8) 구글, 메타 등 경쟁자가 많은데 앞으로 시장 전망은?

가솔린차 시대에서 전기차 시대로 바뀌는 과정과 비슷합니다.

처음에는 충전소 등 인프라 부족으로 전기차가 불편했지만, 테슬라 같은 혁신 제품이 나오자 빠르게 인프라가 따라 갖춰졌습니다. AI 반도체 시장도 마찬가지일 겁니다.

처음엔 CUDA 같은 기존 생태계 때문에 진입장벽이 높지만, 결국 시장의 니즈가 변화를 이끕니다. 엔비디아 GPU만으로는 비싸고 전력 소모가 크니까 감당이 안 된다는 목소리가 커지고 있어요.

앞으로 10년 간 엔비디아가 독점을 하는 것이 다른 고객들이 모두 원하는 그림일까요? 전혀 아닙니다. 전혀 아니기 때문에 구글도 자체 칩을 만들고 있고 브로드컴의 ASIC이 떠오르고 있는 겁니다. 향후 10년 내내 엔비디아만 바라보고 있을 수는 없습니다.

실제로 전 세계 AI 서비스 기업들의 인프라 비용 상당 부분이 엔비디아에 지불되고 있고, 빅테크들도 한 업체에 종속되길 원치 않아요. 그 공백을 저희 같은 새로운 업체들이 메워야 합니다. 앞으로는 저희를 비롯해 여러 전문 AI 칩들이 하나의 생태계를 만들어갈 겁니다.

그리고 그 안에서 최고의 제품을 내놓는 업체가 승기를 잡겠지요. 저희는 누가 뭐래도 실제 성능과 효율 에서 앞선 칩을 만들 자신이 있습니다. 이미 국내에서 LG와 성과를 냈고, 해외 여러 파트너들과도 테스트를 진행 중입니다. 시장이 원하는 것(더 높은 성능/효율, 개방된 생태계)을 발 빠르게 구현하는 쪽이 두각을 나타낼 것이고 변화의 흐름은 이제 막 시작되었다고 봅니다.

그렇기에 AI가 거품이라거나 하입(일시적인 유행)이라는 말도 많지만, 저는 동의하진 않습니다. 이제 시작된 걸요. AI는 ‘생각하는 기계’를 만드는 근본적인 기술입니다. 이 기술의 확산은 멈추지 않을 겁니다.

특히 로봇과 같은 물리적 AI는 현재 데이터센터 AI의 자연스러운 확장입니다. 젠슨 황도 ‘피지컬AI’를 늘 강조하는데, 로봇에 들어가는 칩은 레니게이드 같은 고성능 칩의 ‘스케일다운’ 버전으로 볼 수 있습니다.

오히려 배터리로 구동되는 로봇 환경에서는 저전력, 고효율 추론 능력을 가진 저희 칩의 강점이 훨씬 더 중요해질 겁니다. 로봇은 오래 작동해야 하고 판단이 빨라야 합니다. 추론의 중요성은 갈 수록 커지게 될 겁니다.

엔비디아를 이길 방법은?

사실 엔비디아와 같은 공룡 기업이 장악한 시장에 스타트업이 도전하는 건 불가능해 보인다는 시각이 많습니다. 하지만 저희는 작은 팀과 제한된 자원으로도 충분히 해낼 수 있다는 증거를 만들어냈습니다. 변화를 만들어 냈습니다. LG AI연구원이 개발한 초거대 언어모델(LLM) ‘EXAONE’의 추론을 저희 2세대 칩 레니게이드로 구동됩니다. 엔비디아처럼 인력과 자본을 수만 배 투입한 곳과 정면 승부해도 밀리지 않는 결과가 나왔습니다.

이는 결국 설계 방식의 혁신 덕분인데요, F1 경주라고 가정해보자고요. 속도가 동일하다면 연료 효율이 월등히 좋은 전기차가 낫겠죠. 가솔린차(GPU)는 성능은 좋지만 연비가 낮고 한계가 있습니다. 저희는 처음부터 AI 워크로드에 최적화된 전기차를 만들었기에 훨씬 적은 에너지로 동일한 작업을 해냈습니다.

AI 서비스 기업들이 막대한 전기요금과 장비 비용 탓에 적자를 보는 현실에서, 에너지 효율이 높은 AI 반도체는 더 지속가능한(Sustainable) 해법이 될 것입니다. 저희 칩의 강점은 결국 필요 없는 범용 기능을 과감히 덜어내고 AI 추론에만 집중한 효율성이라고 말씀드릴 수 있겠습니다.

테슬라가 전기차라는 새로운 방식이 아니라 가솔린 차로 승부를 봤다면 기존의 토요타나 폭스바겐 그룹에게 이길 수 없었을 겁니다. 시장의 니즈가 존재하고, 거기에 혁신적인 제품이 등장하면 세상은 바뀌게 됩니다.

가솔린차와 전기차 모두 사람을 A에서 B로 이동시킨다는 목적은 같습니다. 하지만 그 방식은 근본적으로 다릅니다. 가솔린차는 100년 넘게 발전해 온 강력하고 다재다능한 기술이지만, 그 설계는 본질적으로 엔진 내부의 제어된 폭발에 묶여 있습니다.

반면 전기차는 조용하고 효율적인 모터라는 완전히 다른 원리를 중심으로 설계됐죠. 배기구나 복잡한 변속기, 오일 필터 같은 내연기관의 유산을 모두 버렸습니다. 저희 칩이 바로 AI의 ‘전기차’입니다. 엔비디아의 GPU는 그래픽 처리에서 시작된 역사로 인해 여러 작업을 두루 잘해야 하는 ‘만능’에 가까운 특성을 지닙니다.

저희는 백지상태에서 ‘AI 모델을 실행하는 가장 효율적인 방법은 무엇인가?’라는 단 하나의 질문으로 시작했습니다. 이를 통해 AI 연산에 가장 최적화된, 네이티브한 설계를 구현했고, 이는 전기 모터가 가솔린 엔진보다 본질적으로 에너지 효율이 높은 것처럼 엄청난 전력 효율성 향상으로 이어졌습니다.

CUDA는 엔비디아 하드웨어와 개발자를 이어주는 인터페이스입니다. 하지만 생각보다 낮은 수준(Low-level)의 언어라 사용하기 쉽지는 않아요. 요즘 AI 연구자·개발자들은 대부분 파이토치나 텐서플로 같은 고수준(High-level) 프레임워크를 쓰고, 그 내부에서 알아서 GPU 연산을 호출합니다.

즉, 우리가 상위 호환되는 소프트웨어 스택만 제공한다면 개발자가 일일이 CUDA로 프로그래밍할 필요가 없습니다. 특히 추론 작업에서는 모델이 이미 만들어져 있기 때문에 코드를 새로 짤 일도 많지 않아요. 저희 소프트웨어 스택의 목표는 이 프레임워크들을 완벽하게 지원하는 강력한 ‘백엔드’가 되는 것입니다. 특히 저희가 집중하는 ‘추론’ 영역에서는 AI 모델이 이미 학습을 마친 상태입니다. 목표는 완성된 모델을 그저 빠르고 효율적으로 실행하는 것이지, 쿠다를 이용해 새로운 것을 개발하는 단계가 아닙니다. 개념적으로 쿠다에 대한 의존성이 거의 없는 셈이죠.

물론 이게 쉽다는 건 아닙니다.하지만 불가능한 문제도 아닙니다. 이미 구글의 TPU 같은 사례도 있잖아요. 구글, 메타 같은 빅테크들이 자체 AI 칩을 개발해 내부 서비스에 쓰고 있습니다. 그분들은 쿠다 없이도 잘 활용하고 있죠. 중요한 건 최종 사용자들이 불편함 없이 우리 칩을 쓰도록 만드는 것이고, 저희가 거기에 집중하고 있습니다.

무엇보다 저희가 지금까지 받은 펀딩 총 금액이 약 3천 억 초반대입니다. 그리고 현재 우리 회사의 인원이 160~180명입니다. 엔비디아는 어느 정도의 금액을 투자하고 있고 몇 명이 일하고 있나요? 저희보다 적어도 100배는 많은 인원이 엔비디아에서 일을 하고 있습니다. 저희는 엔비디아보다 훨씬 적은 양의 리소스로 지금 이 정도의 성과를 거두었습니다. 여기서 리소스를 더 넣으면 어떻게 될까요? 엔비디아에게 굉장히 위협이 될 겁니다.

리벨리온&사피온과 달리 독자노선을 걷는 이유는?

리벨리온과 사피온은 2024년 8월, AI 인프라 경쟁력 제고를 위해 합병을 추진했다.

각 기업마다 최선의 전략이 있다고 봅니다.

어떤 곳은 규모를 키우기 위해 힘을 합칠 수 있고, 저희처럼 독자적으로 가는 길을 택할 수도 있죠. 저는 한 산업에 여러 경쟁자가 활발히 존재하는 게 오히려 건강하다고 생각합니다.

국내 인터넷 서비스만 봐도 네이버와 카카오가 각자 경쟁하며 동시에 성장했잖아요? 메모리 반도체도 삼성, 하이닉스 투톱 체제가 세계 1위를 지키는 원동력이 되었고요.

만약 모든 플레이어가 하나로 합쳐졌다가 그 한 곳에 문제가 생기면 산업 전체가 흔들릴 수 있습니다.

반면 다양성이 있으면 한쪽의 약점을 다른 쪽이 보완하고, 서로 선의의 경쟁 속에 더 혁신적인 제품들이 나오게 됩니다. AI 반도체 분야도 마찬가지입니다.

여러 접근 방식이 공존하며 생태계 전체의 파이를 키우는 게 중요합니다. 퓨리오사AI는 저희만의 강점을 극대화하면서 앞으로도 독자 행보로 승부를 볼 계획입니다.

앞으로의 목표는?

저희 목표는 세계에서 가장 앞선 AI 반도체 기업이 되는 겁니다. 5년 뒤면 전 세계 데이터센터와 기업들 곳곳에서 저희 칩이 엔비디아를 대체해 돌아가고 있기를 꿈꿉니다. 그러려면 최고의 제품을 만들고 신뢰를 얻어야 하겠지요.

차기 제품 개발에도 박차를 가할 것입니다. AI 기술은 순식간에 발전하니 지속적으로 도전해야 합니다.

AI 반도체는 결국 생각하는 기계(Thinking Machine)를 만드는 기술입니다.

미래 모든 산업의 기반이 될 거예요. 저희는 그 변화의 주인공이 되고자 합니다.

앞으로 10년이 승부처라는 각오로, 가진 모든 역량을 쏟아 부을 생각입니다.

유튜브 숏버전

혹시 영상이 보이지 않는다면 클릭해주세요.

유튜브 풀버전

혹시 영상이 보이지 않는다면 클릭해주세요.

연구자 의견

기술은 말로 증명하는 것이 아니라 레퍼런스로 증명되고, 시장은 구호가 아니라 납품으로 말한다고 생각합니다.

그 기준에서 냉정하게 바라보면 퓨리오사는 66/100, 엔비디아는 100/100입니다. 엔비디아가 완벽하다는 뜻이 아닙니다.

다만 지금 이 시점에 ‘데이터센터 AI’라는 경기장에서 누가 규칙을 만들고 있는 리더인가를 물으면 그 누가 엔비디아가 아니라고 답하겠습니까?

기술수준: 퓨리오사는 TCP라는 독자 아키텍처로 ‘큰 연산을 큰 덩어리로’ 밀어붙입니다. 메모리 병목을 줄이고, 전력 효율을 뽑아내려는 방향성 자체는 옳습니다. 5나노 공정과 HBM3 통합, 650mm²급 다이로 체급을 올린 것도 인정합니다. 다만 이것이 엔비디아가 따라오지 못할 ‘해자’가 되려면 무언가 더 필요하다고 느낍니다. 지금은 설계의 날카로움이 보이는 단계이지, 표준이라고 말할 수 있는 단계는 아니라고 생각합니다.엔비디아는 GPU 코어의 진화와 텐서코어, 커널 튜닝 기술이 CUDA와 cuDNN, Triton, NVLink, InfiniBand로 이어져 하나의 문법이 됐습니다. 연구실 논문, 엔터프라이즈 PoC, 대규모 프로덕션까지 동일 문법으로 관통합니다. 기술 수준에서 20점은 ‘독점적 지배력’이 붙을 때만 줍니다. 지금이 그렇습니다.
제품의 완성도: 퓨리오사의 레니게이드는 LG AI와의 협업을 통해 충분히 엔비디아를 대체하여 작동할 수 있다는 것을 증명했습니다. 이미 ‘Show and Prove’ 하였기에 반박의 여지가 없습니다. 특정 워크로드에서는 동급 성능 대비 더 나은 효율을 보이기도 합니다. 하지만 데이터센터는 1년 365일 주 7일 24시간 끊임없이 돌아갑니다. 이런 환경을 견딜 수 있고 얼마나 오류가 나는가, 고장나서 버려야 하는 건 몇대나 나오는가, 데이터는 얼마나 열화되는가 드라이버와 컴파일러 업데이트 주기는 어떻게되며 장기적으로 호환성 이슈 등은 어떤가? 이 모든 것이 더해져야 됩니다. 엔비디아는 이미 365일 돌아가며, 프레임워크 업데이트와 드라이버 안정성이 분기 단위로 일관되게 흘러갑니다. 대규모 고객사들이 안정성-성능-운영 자동화의 선순환을 이미 누리고 있습니다. 완성도는 격차가 큽니다.
R&D 투자: 퓨리오사는 브릿지 라운드로 연구개발을 길게 가져갈 수 있는 시간이 생겼습니다. 파운드리, HBM,보드, 시스템 파트너와의 동시 협업을 버틸 재원이 확보되었으니까요. 하지만 절대 규모 싸움에서는 답이 없습니다. 엔비디아는 연간 수조 원을 태워 하드웨어&소프트웨어&네트워킹을 동시 병행합니다. 중요한 건 돈의 크기만이 아니라 스택 통합의 깊이에서도 차이입니다. 칩—보드—시스템—네트워크—소프트웨어—툴체인이 한 회사의 로드맵 아래 같은 박자로 움직입니다. 그 박자가 산업의 박자가 됩니다. 투자에서 20점은 자본력과 스택 동시 진화가 맞물릴 때 주는 점수입니다. 엔비디아가 수십 년을 이 일을 했는데 스타트업보다 잘 해야 하는 것은 너무나 당연한 일이죠.
조직&인적 자원: 퓨리오사는 소수 정예로 엔비디아에 비견되는 칩을 만들어 냈습니다. 이건 인정해야 합니다. 특히 대형 다이와 HBM3를 묶어 실칩으로 뽑아낸 실행력은 일반적 스타트업 스케일을 넘어섭니다. 다만 퓨리오사처럼 인원이 적은 스타트업은 뛰어난 칩을 설계할 수는 있지만, 동시에 여러 과제를 다루기는 어렵습니다. 칩을 구동하는 커널과 컴파일러, 드라이버, 런타임 환경, 그리고 고객이 실제로 쓸 수 있도록 모델을 최적화하고 지원하는 일까지 한꺼번에 챙기려면 인력이 많이 필요합니다. 반대로 엔비디아는 세계 최고 수준의 인재들이 칩·시스템·소프트웨어 전반에 걸쳐 고르게 배치되어 있습니다. 서로 다른 팀들이 매트릭스처럼 연결돼 지식을 공유하고, 한 번 쌓인 노하우가 쉽게 사라지지 않습니다. 이런 조직적 깊이와 안정성이 엔비디아에 20점을 주는 이유입니다.
시장 영향력과 생태계: 이 부분은 조금 가혹하게 갑니다. 레퍼런스 고객이 늘고, 완제품 서버 카드가 유통되며, 주요 프레임워크가 원활히 돌아가는 것은 긍정적이죠. 하지만 지금은 엔비디아를 제치고 CUDA의 그늘에 있는 고객들을 빼왔다고 말하기 이릅니다. 시장은 보수적입니다. “된다”가 아니라 “언제나 된다”를 요구합니다. 엔비디아는 개발자 교육부터 샘플 코드, 프로파일러, 서드파티 라이브러리, 레퍼런스 아키텍처까지 풀세트를 제공하거든요. 생태계는 한 번 만들어지면 관성으로 굴러갑니다. 그 관성의 무게가 20점입니다.

그러면 퓨리오사의 66점은 의미가 없나? 그렇지는 않아요. 오히려 혹자는 스타트업에게 66점이라는 점수가 과하다고 생각하실 수도 있겠네요. 저희는 66점이 우리나라 반도체 팹리스가 엔비디아를 이렇게 뒤쫓아서 달려가고 있다는 굉장히 긍정적인 신호라고 생각해요.

앞으로 소프트웨어 스택이 성숙되고, 더 많은 대형 고객에서 장시간, 다중 워크로드로 재현 가능성을 증명한다면, 파트너사와의 레퍼런스를 공개 가능한 수준까지 끌어올리면, 충분히 한국에서도 엔비디아와 경쟁할 수 있는 기업이 나올 수 있다고 생각합니다. 세상에 불가능한 건 없거든요.

만약 저희한테 1억원을 누가 던져주고, 이 돈이 목숨 값이니까 잘 투자해보라고 한다면 솔직히 저는 미국 반도체 ETF(엔비디아 비중이 높은 종목으로)나 QQQ에 넣어둘 것 같습니다. 한국이라는 시장 자체가 기업의 기술력과 별개로 어느 정도 한계가 있다고 생각하기 때문입니다.

근거는 없지만 삼성전자가 나스닥에 상장된 기업이었으면 지금보다 주가가 2배는 더 높게 평가받았을 것이라 생각합니다. 삼성전자의 시가총액은 애플과 비교할 바가 안 되지만, 기술력과 시장에 미치는 영향력은 애플 못지 않습니다. 즉 한국이라는 시장의 한계 때문에 저는 같은 돈을 ‘지금’ 준다면 당연히 엔비디아에 투자를 합니다.

하지만 만약 퓨리오사도 상장하고, 리벨리온 같은 기업들도 상장해 있는 상태이며 이들을 같이 투자하는 ETF가 있다면 1억의 40% 정도인 4천 만원 정도는 그런 ETF에 투자할 의향은 있습니다.

Category

Tag

하이젠버그

[Free] 한국판 엔비디아, 퓨리오사AI