데이터 사일로의 종말: VAST Global Namespace로 통합된 데이터 환경 구축
- Chang Sun Park
- 1월 23일
- 4분 분량
기업의 IT 환경이 점점 복잡해지면서 데이터가 자연스럽게 여기저기 흩어져 있는 시대가 되었습니다. 예를 들어 본사와 지사 그리고 공장이나 매장 등 데이터센터부터 현지 전산실 그리고 엣지 컴퓨팅 환경까지 여러 곳에서 데이터가 생성, 저장, 관리되고 있습니다. 예전처럼 데이터센터 스토리지에 모든 정보를 모아두던 시대가 지나간 것입니다.
데이터가 여러 곳에 흩어져 있다는 것은 단순히 관리가 불편하다는 의미를 넘어섭니다. 각 부서, 각 지사, 각 시스템마다 데이터가 고립되면 섬처럼 단절된 데이터 사일로 현상이 발생합니다. 이렇게 되면 데이터 분석이나 활용이 번거롭습니다. 특히 여러 위치에 분산된 데이터를 동기화하고 최신 버전을 유지하는 것은 매우 복잡하고 어려운 작업입니다. 데이터 일관성이 무너지면 업무 오류가 발생하고, 심각한 경우에는 비즈니스에 손실을 초래할 수도 있습니다. 그렇다면 이런 불편함에서 벗어나려면 어디서 해결책을 찾아야 할까요? VAST Data는 VAST Global Namespace라는 참신한 해법을 제시합니다. 개념부터 특징까지 훑어 보겠습니다.
VAST Global Namespace란 무엇인가?
VAST Global Namespace는 여러 지역에 분산된 클러스터를 하나의 논리적 폴더 또는 버킷 아래 묶어 관리하는 기술이자 기능입니다. 하나로 묶는다? 이게 무슨 말일까요. 예를 들어 할리우드 스튜디오가 ‘/media’ 폴더에 촬영 영상을 업로드하면 뉴욕에 있는 임원진과 클라우드의 후반 작업 팀, 그리고 다른 사무실의 팀원들도 거의 동시에 동일한 폴더를 통해 데이터에 접근할 수 있습니다.
클라우드 기반 파일 공유/동기화 서비스와 달리 VAST Global Namespace는 엄격한 일관성을 제공합니다. 이는 여러 사용자가 동시에 접근하고 수정하더라도 항상 최신 버전의 파일을 확인하고 수정 내용을 빠르게 반영할 수 있다는 뜻입니다.
엄격한 일관성이 왜 중요한가?
점진적으로 동기화를 하는 이벤트적(Eventual) 일관성 모델을 쓰는 기존 솔루션은 다른 위치 사용자가 파일을 업데이트해도 로컬 복사본이 동기화되기 전까지는 이전 버전을 계속 읽거나, 동시에 같은 파일을 편집하면 마지막에 저장한 사용자의 변경사항만 반영되는 문제가 발생합니다. 충돌이 생기면 별도의 충돌 파일이 생기다 보니 팀원들이 수작업으로 병합해야 하는 비효율도 따라옵니다.
반면 VAST Global Namespace는 폴더 단위로 읽기/쓰기 임대(Lease)를 설정해 한 시점에 하나의 클러스터만 쓰기 임대를 독점하여 충돌과 데이터 불일치 상황을 최소화합니다. 이런 특징으로 런던에서 업데이트한 파일을 시카고에서 즉시 최신 상태로 확인하며 동시에 작성하더라도 마지막 덮어쓰기 문제를 예방할 수 있습니다. 이게 가능한 이유는 VAST Global Namespace의 독특한 동작 메커니즘에서 찾을 수 있습니다.
내부 동작 원리, Origin과 Satellite
VAST Global Namespace의 동작 원리를 이해하려면 Origin과 Satellite의 역할을 먼저 알아야 합니다. VAST Global Namespace에 속한 폴더 중 하나의 클러스터가 그 폴더의 Origin이 됩니다. Origin은 해당 폴더를 권위 있는 사본(Authoritative Copy)으로 보관하며, 쓰기 임대를 담당합니다. 반면에 다른 위치의 클러스터들은 Satellite 역할을 하여 Origin에서 해당 폴더의 데이터 및 메타 데이터를 로컬로 캐시합니다.
예를 들어 볼까요. 할리우드 스튜디오가 ‘/media’ 폴더를 Origin으로 두고, 클라우드나 뉴욕 지사는 Satellite로 설정할 수 있습니다. 이렇게 하면 할리우드에선 원본 데이터를 곧바로 저장하고, 뉴욕 및 클라우드 측은 이 데이터를 Satellite 캐시를 통해 로컬 I/O 성능처럼 빠르게 사용할 수 있습니다.

읽기/쓰기 임대 메커니즘
Origin과 Satellite의 역할에 대한 이해를 바탕으로 읽기/쓰기 임대 메커니즘을 파악하면 VAST Global Namespace가 어떻게 엄격한 일관성을 유지하는 지 알 수 있습니다.
Satellite가 읽기 임대를 가지고 있을 때는 캐시된 데이터가 최신 버전임을 의미합니다. 사용자가 Satellite에서 파일을 수정하려 하면 Satellite는 동기식 프록시 방식으로 Origin에 쓰기 요청을 전달합니다. 그러고 나서 Satellite 내 읽기 임대를 무효화하여 구버전이 남아 있지 않도록 합니다. 이렇게 해야 여러 위치에서 수정이 일어나도 마지막에 저장된 변경 사항이 이전 버전을 덮어쓰지 않게끔 엄격한 일관성을 지킬 수 있습니다.
물론 이 구조는 원격 쓰기에 네트워크 왕복 시간이 추가될 수 있지만 관리자 입장에서는 여러 글로벌 폴더를 구성해 각 폴더의 Origin을 실제 쓰기가 많이 이뤄지는 지역 근처로 배치하여 지연을 최적화할 수 있습니다.
활용 시나리오
AI나 빅데이터, 일반 소프트웨어 개발 프로젝트를 추진할 때 여러 팀이 협업하는 경우가 많습니다. 이처럼 프로젝트를 추진할 때 VAST Global Namespace는 데이터 접근 편의를 보장하는 중요한 역할을 합니다. 본사에서 주요 코드를 개발하고, 해외 지사에서는 현지화를 진행하거나 지역별 고객 지원 내용을 업데이트 하는 경우를 가정해보겠습니다. 이전 같으면 Git이나 SVN 등의 버전 관리 툴에 의존하거나 별도의 동기화 스크립트를 짜야 했겠지만, VAST Global Namespace를 쓰면 동일한 폴더에 대한 접근·수정이 전 세계 지점에서 가능하므로, 파일 공유 과정이 단순해집니다.
또한, DevOps 체계에서 CI/CD 파이프라인을 운영할 때 빌드 아티팩트(Artifact)나 환경 구성 파일을 한 폴더로 통합 관리하면, 어느 위치의 배포 서버든 동일한 버전을 즉시 받아 사용할 수 있습니다. Docker 이미지, Helm 차트 등 컨테이너 관련 리소스도 빠르게 동기화되므로 생산성이 크게 향상됩니다.
다른 시나리오로 AI 기반 데이터 분석도 생각해볼 수 있습니다. 빅 데이터 분석이 필요한 프로젝트에서는 로그 데이터나 거대한 CSV 파일을 여러 지사에서 모아 하나의 VAST Global Namespace로 관리할 수 있습니다. 어떤 지점에서 데이터를 업로드하면, 본사의 분석 클러스터가 바로 해당 데이터를 받아 머신러닝 모델을 업데이트하고, 그 결과를 다시 같은 폴더에 기록합니다. Satellite 역할을 하는 다른 지점들은 즉시 최신 분석 결과를 참조해, 지역별 마케팅이나 운영 전략을 세울 수 있습니다. 데이터가 바뀌면 모든 지점이 자동으로 최신 상태를 확인하므로 별도의 복잡한 동기화 절차 없이 협업이 이뤄집니다.
분산 IT 환경의 미래, VAST Global Namespace
소개한 바와 같이 VAST Global Namespace는 전 세계에 퍼져 있는 VAST 클러스터들을 하나의 논리적 폴더로 묶어 엄격한 일관성과 로컬 수준의 I/O 성능을 동시에 제공하는 혁신적 솔루션입니다. 기존의 동기화 기반 협업 솔루션이 안고 있던 충돌과 구버전 문제, 이벤트적 일관성 모델 등에서 발생하는 번거로움을 대폭 해소해 줍니다.
정리하자면 ‘어디서나 하나의 폴더로 작업하듯 쉽고 빠른 협업’을 지원하려면 Origin과 Satellite라는 개념을 통해 WAN 지연 및 충돌 위험을 최소화하고, 미리 가져오기(Pre-fetch)와 같은 캐시 정책으로 유연한 데이터 접근을 가능케 하는 VAST Global Namespace가 현실적인 선택이 될 것입니다. AI/ML 프로젝트, 빅데이터 분석, 글로벌 DevOps 파이프라인 등을 위한 새로운 데이터 활용 전략을 구상 중이라면? 대원씨티에스가 도움을 드리겠습니다.
Comments