top of page
검색

이더넷 표준 기반으로 AI 데이터센터를 구축해야 하는 이유

  • Chang Sun Park
  • 2024년 12월 28일
  • 4분 분량

오늘날 AI 인프라에서 네트워크의 중요성은 강조할 필요가 없을 정도입니다. 그 이유는 기존 네트워크 기술로는 AI 워크로드에서 요구하는 높은 성능과 안정성을 완벽하게 충족하기 어렵기 때문입니다.

 

AI 워크로드는 일반적인 데이터 전송 수준을 훨씬 뛰어넘는 대규모 연산과 데이터 교환을 동반합니다. 예를 들어 수백 수천 개의 GPU나 NPU가 동시에 수많은 모델 파라미터를 교환하고, 연산 결과를 다시 통합하며, 이 과정을 빠르게 반복합니다. 이러한 특성 때문에 AI 트래픽은 보통 ‘대역폭을 많이 쓰는 대형 흐름(Flow)’과 ‘갑작스럽게 확 늘어났다 줄어드는 짧은 흐름’이 혼재하게 됩니다.

 

조금 더 자세히 설명하자면 대형 흐름은 AI 워크로드에서 대량의 데이터가 지속적으로 전송되는 상황을 의미합니다. 대규모 모델의 파라미터를 여러 GPU가 공유할 때 발생하는 트래픽을 예로 들 수 있습니다. 짧은 흐름은 AI 워크로드에서 짧은 시간 동안 폭발적으로 발생하는 트래픽을 의미합니다. GPU 간의 중간 연산 결과를 주고받거나, 최종 결과를 통합하는 과정에서 발생하는 트래픽이 이에 해당합니다. 이처럼 AI 워크로드는 일반적인 네트워크 트래픽과 다릅니다. 따라서 이러한 특징을 고려하지 않은 네트워크 환경에서는 성능 저하가 발생할 수 있습니다.

 

이런 문제를 해결하기 위해 아리스타(Arista)는 Etherlink라는 통합 네트워킹 솔루션을 제안하고 있습니다. Etherlink는 AI 데이터센터를 구현하는 데 필요한 고성능 AI 네트워크 플랫폼입니다.

 

Etherlink가 특별한 이유

 

Etherlink는 개방형 이더넷 표준을 기반으로 AI 인프라의 주요 네트워크 요구 사항인 성능, 에너지 효율성, 그리고 유연한 확장성을 동시에 제공합니다. AI 데이터센터에서 이더넷 표준을 사용하면 여러 가지 이점을 누릴 수 있습니다. 첫째, 뛰어난 성능을 제공합니다. 이더넷은 빠른 데이터 전송 속도를 통해 AI 모델 학습에 필요한 정보를 신속하게 주고받을 수 있도록 지원하며, 대규모 데이터를 효율적으로 처리할 수 있는 높은 대역폭을 제공합니다. 또한, RDMA 기술을 활용하여 CPU의 부담을 줄이고 데이터 전송 속도를 높여 더욱 빠른 AI 학습을 가능하게 합니다.


다음으로 에너지 효율성이 높습니다. 이더넷은 상대적으로 전력 소비량이 낮아 AI 데이터센터의 운영 비용을 절감하는 데 도움을 줍니다. 최신 이더넷 기술은 전력 효율성을 더욱 향상시켜 친환경적인 데이터센터 구축에도 기여합니다. 낮은 전력 소비는 발열량 감소로 이어져 냉각 시스템의 부담을 줄이고, 냉각 비용 절감과 함께 데이터센터의 전반적인 에너지 효율을 높입니다.


세 번째로, 유연한 확장성을 제공합니다. 이더넷은 개방형 표준을 기반으로 하므로 다양한 제조사의 장비와 호환되어 자유로운 시스템 구성이 가능합니다. 또한, 네트워크 규모를 쉽게 확장할 수 있어 AI 데이터센터의 성장에 유연하게 대응할 수 있습니다. Etherlink는 이러한 이더넷의 장점을 기반으로 끊임없이 발전하고 새로운 기술을 수용하여 미래의 AI 워크로드에도 효과적으로 대응할 수 있는 미래 지향적인 솔루션입니다

Etherlink가 제공하는 이점들

 

Etherlink는 AI 데이터센터의 핵심 구성 요소들을 서로 연결하고, 전체 네트워크 인프라를 효율적으로 관리하는 솔루션입니다. 마치 도시의 교통 시스템처럼 AI 데이터센터 내의 다양한 장비들이 원활하게 통신하고 데이터를 주고받을 수 있도록 돕는 역할을 합니다. Etherlink는 서버와 네트워크를 연결하는 NIC, 데이터를 처리하는 컴퓨터, 그리고 AI 연산을 가속화하는 GPU/NPU를 효율적으로 연결하여 AI 워크로드를 최적화합니다. 이러한 연결을 통해 AI 모델 학습 속도를 높이고, AI 데이터센터의 전반적인 성능을 향상시킵니다. 구체적으로 어떤 이점을 제공하는지 알아보겠습니다.

 

최적화된 성능

 

Etherlink는 기존의 일반 이더넷 시스템보다 최대 65% 높은 성능을 제공합니다. 특히, 손실 없는(로스리스) 저지연 플랫폼에 RDMA 인지형 부하 분산(Load Balancing)과 혼잡 제어 기능을 결합하여 JCT(Job Completion Time)을 단축합니다.


가령 대규모 AI 클러스터는 케이블 장애나 물리적 문제로 인해 성능이 저하될 수 있습니다. Etherlink는 이러한 문제를 신속히 해결하며, 인피니밴드(InfiniBand)보다 최대 30배 빠른 복구 속도를 자랑합니다. 이는 클러스터의 안정성을 크게 향상시킵니다.

 

유연한 확장성

 

Etherlink는 특정 벤더에 종속되지 않고 자유롭게 하드웨어를 선택할 수 있도록 개방형 표준을 지원합니다. 이를 활용해 고정형 시스템부터 리프/스파인 구조, 평면형 설계, 그리고 최신 분산 이더링크 스위칭(DES)에 이르기까지, 원하는 방식으로 네트워크를 구성할 수 있습니다. 특히, Etherlink는 울트라 이더넷 컨소시엄(UEC)의 최신 표준을 반영할 수 있어, 미래의 변화에도 유연하게 대응할 수 있습니다.

 

네트워크 확장성

 

Etherlink는 마치 레고 블록처럼 필요에 따라 자유롭게 확장할 수 있는 네트워크 솔루션입니다. 작은 규모의 AI 시스템에는 7060X6 고정형 시스템처럼 컴팩트한 솔루션을 활용할 수 있습니다. 더 큰 규모의 시스템을 구축해야 한다면 7800R4 모듈러 시스템을 통해 수백 개의 포트를 연결하여 용량을 확장할 수 있습니다. 초대형 AI 클러스터를 위해서는 7700R4 DES 시스템을 통해 수만 개의 포트를 연결하는 단일 홉 네트워크를 구축하여 뛰어난 성능을 확보할 수 있습니다. 또한, 리프/스파인 설계를 통해 10만 개 이상의 GPU나 NPU를 지원하는 초대규모 AI 시스템까지 구축할 수 있는 뛰어난 확장성을 제공합니다.

 



최적의 전력 소비

 

AI 네트워크에서는 에너지 효율성 또한 매우 중요한 요소입니다. Etherlink는 최신 5nm 공정 실리콘을 활용하여, 이전 세대보다 최소 25% 적은 전력으로 더 높은 성능을 제공합니다. 또한, LPO(Linear-drive Passive Optics) 같은 기술을 통해 광학 전력을 최대 50%까지 추가로 절감할 수 있습니다. 결과적으로, 전반적인 에너지 소비를 줄이면서도 더 많은 컴퓨팅 자원을 활용할 수 있게 됩니다.

 

높은 안정성

 

Etherlink는 아리스타의 EOS 운영체제를 기반으로 하며, 이를 통해 기업은 새로운 AI 네트워크를 빠르게 도입할 수 있습니다. EOS는 공통 취약점 및 노출(CVE) 같은 보안 이슈와 결함 발생률이 낮아, 다른 네트워킹 운영체제 보다 안정성이 높습니다. 이와 관련해서는 별도 포스팅으로 자세히 소개해 보겠습니다.

 

엔드투엔드 가시성과 제어

 

Etherlink는 네트워크부터 서버 NIC까지, 엔드 투 엔드 상태를 한눈에 파악할 수 있는 기능을 제공합니다. 이는 네트워크 팀과 서버 팀이 각기 다른 도구와 관점을 사용하여 발생하는 설정 불일치 문제를 방지하고, QoS 설정을 자동으로 동기화하여 최적화된 성능을 유지하도록 돕습니다. Arista의 EOS 기반 AI 에이전트는 실시간으로 이를 조정하여 AI 클러스터 전반의 성능을 지속적으로 모니터링하고 제어합니다.

 

Etherlink와 함께하는 AI 데이터센터의 미래

 

AI 시대에서 네트워크는 단순히 데이터를 주고받는 망을 넘어 AI 클러스터, 더 나아가 AI 데이터센터의 성능과 효율성을 좌우하는 핵심 인프라로 자리 잡았습니다. Etherlink는 이러한 변화에 대응하기 위해 설계된 통합 네트워킹 솔루션입니다. 높은 성능, 에너지 효율성, 확장성을 겸비한 Etherlink는 AI 혁신의 중심에서 여러분의 네트워크를 지원할 것입니다. 더 자세한 내용이 궁금하다면 대원씨티에스가 도움을 드리겠습니다.

 

 
 
 

Comments


logo_dw.png

대원씨티에스 DIA Nexus

대표이사 : 하성원, 이상호, 김보경   ㅣ  사업자 등록번호 : 106-81-21127  ㅣ   이메일: AI_sales@computer.co.kr

주소: 본사 - 서울시 용산구 청파로 109 나진전자월드빌딩 2층   ㅣ   판교 - 경기도 성남시 분당구 판교역로 240

TEL : 02-2004-7700, 02-2004-7778(영업 문의)

  • Youtube
  • Facebook
  • LinkedIn
bottom of page