top of page


AI 시대의 새로운 인프라 경제학!'추론 워크로드' 중심의 차세대 데이터센터 전략
생성형 AI의 등장은 단순한 기술적 발전을 넘어 산업 경제의 구조를 근본적으로 바꾸는 거대한 흐름이 되었습니다. 초기에는 거대 언어 모델(LLM)의 훈련에 관심이 쏠렸지만, 이제는 AI의 진정한 가치가 드러나는 추론 워크로드로 시선이 옮겨가고...


4편: CPU, GPU, NPU, VPU 무엇이 다를까?
지난 3편에서 AI 가속기를 고르는 기준을 알아봤으니, 이제 실전에 나설 시간입니다. 시장에는 저마다의 강점을 내세우는 다양한 AI 가속기들이 있습니다. 그래픽과 AI 연산의 강자 'GPU', 추론을 위해 태어난 'NPU', 그리고 영상 처리에...


3편: AI 기반 지능형 관제의 심장을 고르는 법: AI 가속기 선택 가이드
AI 기반 지능형 관제 시스템의 구축의 큰 그림을 그렸다면, 이제 그 심장이 될 핵심 요소인 'AI 가속기'를 선택할 차례입니다. 자동차를 살 때 연비, 최고 속도, 안정성 등을 꼼꼼히 따져보듯이 AI 가속기 역시 다양한 성능 지표를 비교해야...


AI 워크로드 최적화 인프라 시리즈 - Part 3: 최적화 포인트 2 – 전력 및 냉각, 병렬 처리
Part 2에서는 AI 워크로드의 까다로운 요구사항을 만족시키기 위한 온프레미스 인프라 최적화 방안 중 프로세서(GPU/CPU), 네트워크 I/O, 스토리지에 대해 자세히 살펴보았습니다. Part 3에서는 지난 회에 이어 핵심 기술 요소 최적화의...


AI 워크로드 최적화 인프라 시리즈 - Part 2: 최적화 포인트1 - 프로세서, 네트워크 I/O, 스토리지
Part 1에서는 AI 개발과 배포 및 운영 과정에 포함된 데이터 전처리, 모델 훈련, 추론 등의 다양한 워크로드 특성을 이해하고, 각기 다른 요구 사항을 인프라 설계에 반영하는 것이 왜 중요한지 살펴보았습니다. Part 2와 Part 3에서는...


이더넷 표준 기반으로 AI 데이터센터를 구축해야 하는 이유
오늘날 AI 인프라에서 네트워크의 중요성은 강조할 필요가 없을 정도입니다. 그 이유는 기존 네트워크 기술로는 AI 워크로드에서 요구하는 높은 성능과 안정성을 완벽하게 충족하기 어렵기 때문입니다. AI 워크로드는 일반적인 데이터 전송 수준을...


성능부터 가성비, 전성비까지 GPGPU를 능가하는 NPU의 시대가 온다!
2024년 10월 30일(수)부터 11월 1일(금)까지 3일 간의 일정으로 ‘AIoT 국제 전시회 및 컨퍼런스’가 코엑스 3층 D홀과 컨퍼런스 룸에서 열립니다. 이번 행사에 대원씨티에스의 파트너인 딥엑스(DeepX)가 전시 부스(E101) 참여를 합니다. 지능형 엣지 시대 예고 이번 전시 부스에서 딥엑스는 서버용 제품인 DX-H1을 장착한 HP Z8 Fury G5 워크스테이션으로 100개의 CCTV 채널 데이터를 동시에 처리하는 데모를 시연합니다. 이번 부스 전시를 통해 알리고자 하는 메시지는 “엣지 장치에 GPU를 쓸 이유가 더 이상 없다!”는 것입니다. 흔히 AI 알고리즘을 성능 걱정 없이 원활하게 엣지 장치나 엣지 서버에서 운영하려면 GPU가 필요하다고 생각합니다. 하지만 이는 NPU에 대한 정확한 정보가 없어서 생긴 오해입니다. 딥엑스의 M.2 2280 형태의 AI 반도체 DX-M1과 고성능 데이터센터용 반도체 DX-H1은 엣지 장치와 엣지


성능부터 가성비, 전성비까지 GPGPU를 능가하는 NPU의 시대가 온다!
2024년 10월 30일(수)부터 11월 1일(금)까지 3일 간의 일정으로 ‘AIoT 국제 전시회 및 컨퍼런스’가 코엑스 3층 D홀과 컨퍼런스 룸에서 열립니다. 이번 행사에 대원씨티에스의 파트너인 딥엑스(DeepX)가 전시 부스(E101) 참여를...
bottom of page
.png)