top of page

엔비디아 GTC 2026 기조연설CUDA를 넘어 풀스택으로 확장하는 NVIDIA의 해자

  • Chang Sun Park
  • 3월 18일
  • 4분 분량

올 해의 AI 기술과 시장 동향은 어디를 향할까? 언제부터인가 NVIDIA의 연례 행사인 GTC는 AI 기술과 시장의 변화를 예측하는 바로미터 역할을 하고 있습니다. 2026년 첫 행사에서 NVIDIA 젠슨 황 CEO는 매우 의미심장한 메시지를 던졌습니다. 그가 기조연설의 포문을 열며 한 말인 “우리는 지금 새로운 산업 혁명의 한복판에 서 있다"는 것은 무슨 뜻일까요. 산업화 시대 공장이 원자재를 가공해 물건을 만들었다면 우리가 곧 마주할 AGI 시대에는 전기로 지능이라는 고부가가치 상품인 토큰(Token)을 찍어낼 것이란 의미가 담겨 있습니다.

 

 

NVIDIA가 구축한 해자

NVIDIA가 AI 혁신을 상징하는 아이콘이라는 이견을 달 이는 없습니다. 관련해 업계에서는 넘볼 수 없는 NVIDIA의 해자를 소프트웨어에서 찾고 있습니다. 대표적인 것이 CUDA입니다. AI 가속기 시장은 2026년 현재 NPU, LPU, 맞춤형 ASIC 등 다양한 선택지가 존재합니다. 하지만 그 어떤 제품도 NVIDIA의 GPU의 위상을 넘보지 못합니다. 관련해 업계에서는 하드웨어 아키텍처보다 CUDA에 주목합니다.

 

 

이번 기조 연설에서도 젠슨 황 CEO는 지난 20년 간 CUDA에 투자하면서 플라이휠(Flywheel) 효과가 어떻게 생기게 되었는지 소개하였습니다. 관련해 젠슨 황은 "가장 달성하기 어려운 것은 인스톨 베이스(설치 기반) 확대이며 우리는 이를 위해 20년을 투자했다"고 강조했습니다. 20년 전 NVIDIA는 게이밍 GPU로 번 수익 대부분을 CUDA 플랫폼에 재투자하는 과감한 도박을 감행했습니다.


덕분에 딥러닝 선구자들이 GPU를 AI 연산에 활용할 수 있었고 AI 혁명이 도래했을 때 CUDA는 AI 시장의 폭발적인 성장을 뒷받침할 수 있는 사실상의 표준과 같은 소프트웨어 환경으로 자리 잡게 되었습니다.

이러한 해자는 에이전틱 AI까지 확장이 되고 있습니다. GTC 2026 기조연설 무대는 이를 구체적으로 보여주는 자리였습니다. 화려한 하드웨어 발표 이면에 깔린 NVIDIA의 진짜 저력이 무엇인지 살펴보겠습니다.

 

멈추지 않는 플라이휠

지금까지 NVIDIA가 보여준 폭발적인 성장의 이면에는 한 번 돌아가기 시작하면 멈추지 않는 플라이휠 메커니즘이 자리하고 있습니다. 전 세계 수억 대의 GPU 기반 장비에 설치된 CUDA는 단순한 소프트웨어 환경이 아닙니다. 새로운 AI 모델이 나올 때마다 즉시 가동할 수 있는 준비된 소프트웨어 환경입니다.

젠슨 황 CEO는 새로운 최적화 기술을 배포하면 전 세계 수백만 대의 GPU 기반 장비가 동시에 혜택을 본다고 설명했습니다. 이 때문에 NVIDIA 가속기는 새로운 아키텍처가 나와도 여전히 유용하게 쓰입니다. 6년 전 출시된 암페어(Ampere) GPU의 클라우드 임대 요금이 오히려 오르고 있다는 사실이 이를 잘 보여줍니다. 소프트웨어가 하드웨어의 가치를 지속적으로 끌어올리는 CUDA 플라이휠의 위력입니다.

NVIDIA는 이러한 선순환 구조를 추론(Inference) 시장까지 이어가 패권을 장악할 것으로 보입니다. 루빈 아키텍처 개발과 그록 인수는 NVIDIA의 전략을 잘 보여줍니다. 시장에서는 다음과 같은 이유로 NVIDIA가 추론 시장 지배력을 높일 것으로 보고 있습니다.

 

  • 추론의 경제학: 토큰을 더 낮은 비용으로 더 빠르게 처리하는 능력이 곧 기업의 수익과 직결되는 시대가 되었습니다. 관련해 젠슨 황 CEO는 올 해를 ‘추론 변곡점의 해’로 규정했습니다.

  • 메모리와 대역폭의 중요성: 연산 속도만큼 중요한 것이 데이터를 실어 나르는 길입니다. 베라 루빈(Vera Rubin) 아키텍처는 차세대 HBM4 메모리와 첨단 패키징 기술을 결합해 데이터 전송 속도를 혁신적으로 높였습니다. 이는 방대한 데이터를 실시간으로 처리해야 하는 고성능 추론의 핵심 기반입니다.

  • 그록(Groq)과의 초저지연 시너지: 추론은 지연 시간을 최소화하는 것이 생명입니다. 루빈 GPU와 그록의 LPU를 결합한 시스템은 처리 성능을 35배나 끌어올릴 수 있습니다.

 

NVIDIA의 새로운 플라이휠

NVIDIA는 CUDA의 뒤를 이을 혜자로 애플리케이션 부분, 특히 에이전틱 AI에 힘을 싣고 있습니다. 관련해 이번 행사에서 니모(Nemo)와 니모클로(NemoClaw)에 대한 관심이 높았습니다. 그 이유는 다음과 같이 정리할 수 있습니다.

 

  • CUDA의 성공 신화 재현: CUDA는 플랫폼 레이어에서 개발자를 중심으로 플라이휠을 돌렸습니다. 니모와 니모클로는 애플리케이션 레이어에서 같은 메커니즘으로 에이전틱 AI 시대의 플라이휠을 심으려는 시도입니다. 젠슨 황 CEO는 이를 'CUDA 플레이북의 재현'이라고 표현했습니다. 개발자들이 CUDA 위에 라이브러리와 프레임워크를 자발적으로 쌓아 올렸듯, 기업들이 스스로 생태계에 참여하도록 하겠다는 것입니다.

  • 디지털 두뇌와 장기 기억: 니모클로 기반 AI 에이전트는 장기적인 맥락 기억을 갖춘 에이전트를 구축할 수 있으며, 기업이 보유한 다양한 데이터를 실시간으로 추론에 활용합니다. 이 과정에서 정형 데이터(데이터 프레임) 처리를 가속하는 cuDF와 비정형 데이터(벡터 저장소)를 다루는 cuVS가 핵심 역할을 합니다. 이처럼 니모클로는 여러모로 루빈 아키텍처, CUDA와 시너지가 나올 수밖에 없습니다.


5레이어 케이크

 

젠슨 황 CEO는 AI 산업 전체를 단순한 모델이나 앱이 아닌 전 세계적 인프라 구축 사업으로 정의하며 5레이어 케이크 구조를 제시했습니다. 에너지를 입력받아 실시간으로 지능(토큰)을 제조하는 현대적 공장의 설계도입니다. "모든 성공적인 애플리케이션은 그 아래 모든 레이어를 끌어당긴다"는 그의 말처럼, 최상단의 앱이 시장에서 선택받을수록 더 정교한 모델이 요구되고, 이는 다시 거대한 인프라, 고성능 칩, 막대한 에너지 수요로 이어집니다. 케이크의 구조는 아래서부터 이렇게 쌓입니다.

 

  • 에너지(Energy): 모든 지능 생산의 기초는 에너지입니다. 토큰 하나가 만들어질 때마다 전력이 소비됩니다. 젠슨 황 CEO는 에너지를 지능 생산의 절대적 한계를 결정하는 층으로 규정하며 AI 인프라가 추상적인 소프트웨어가 아닌 철저히 물리적인 토대 위에 있음을 분명히 했습니다.

  • 칩(Chips): 에너지를 연산으로 전환하는 층입니다. 칩의 효율성은 곧 AI가 얼마나 빠르게 확장될 수 있고 지능의 가격을 얼마나 낮출 수 있는지를 결정하는 핵심 동력입니다.

  • 인프라(Infrastructure): 수만 개의 프로세서를 하나의 거대한 기계로 묶는 냉각, 네트워킹, 시스템 전체를 가리킵니다. 젠슨 황 CEO는 이곳을 단순히 정보를 저장하는 데이터센터가 아니라 지능을 제조하는 공장 즉 AI 팩토리로 정의했습니다.

  • 모델(Models): 단백질 AI, 물리 시뮬레이션, 로봇공학에 이르기까지 세상을 이해하고 추론하는 다양한 AI 모델들이 이 층에 위치하여 산업의 지능화를 이끕니다.

  • 애플리케이션(Applications): 케이크의 최상단에서 실제 경제적 가치가 창출됩니다. 신약 개발 플랫폼, 산업용 로봇, 자율주행차가 모두 이 층에 속합니다.

 

현실 세계로 걸어 나온 지능

NVIDIA가 그리는 새로운 산업 혁명의 종착지는 화면 속 AI 에이전트에 머물지 않습니다. 젠슨 황 CEO는 지능이 물리적 실체를 갖게 되는 피지컬 AI(Physical AI) 시대도 선언했습니다. 5레이어 케이크의 최상단, 애플리케이션 레이어가 로봇과 자율주행을 통해 현실 세계의 생산성을 바꾸는 단계로 이해할 수 있습니다. 이번 행사에서는 다음 내용이 청중의 관심을 끌었습니다.

 

  • 로보틱스와 자율주행: NVIDIA와 Disney가 공동 개발한 시뮬레이션 환경에서 학습한 올라프(Olaf) 로봇이 무대 위에서 실시간으로 대화하며 걷는 모습은 피지컬 AI가 도달한 현재를 상징적으로 보여줬습니다. 자율주행 분야도 시뮬레이션 플랫폼으로 훈련된 차량이 실제 도로에서 반응하는 수준에 이르렀음을 확인했습니다.

  • 우주를 향한 확장: 지능의 공장은 지구를 넘어 우주 궤도까지 뻗어 나갑니다. NVIDIA는 방사선 등 가혹한 환경을 견디며 H100 대비 최대 25배의 성능을 목표로 하는 우주 데이터센터 계획, 베라 루빈 스페이스-1(Vera Rubin Space-1)을 공개하며 기술적 지평을 넓혔습니다.

 

1조 달러 수주 잔고, 숫자 뒤에 있는 가능성

젠슨 황 CEO는 이번 기조연설에서 2027년까지 최소 1조 달러(약 1,300조 원) 규모의 수주 잔고가 예상된다는 파격적인 전망을 내놓았습니다. 이 숫자는 단순한 판매 예측치가 아닙니다. CUDA가 과거의 위대한 투자였다면, 5레이어 케이크는 현재의 강력한 구조이며, 에이전틱 AI와 피지컬 AI로 상징되는 애플리케이션 부문에서의 영향력 확대는 다음 20년을 위한 씨앗이라고 본 고객이 NVIDIA의 미래를 믿고 투자한 것입니다.


정리하자면 NVIDIA의 진짜 저력은 단순히 가장 빠른 칩을 만드는 데 있지 않습니다. 전 세계 모든 산업이 NVIDIA의 플라이휠 위에서 지능을 생산하고 소비하게 만드는 풀스택을 완성했다는 것 이것이 바로 이번 GTC 2026 기조연설이 우리에게 던진 가장 묵직한 메시지인 것 같습니다.

 
 
 

댓글

별점 5점 중 0점을 주었습니다.
등록된 평점 없음

평점 추가
bottom of page