2월 06, 2025

엔비디아, 스펙트럼-X를 통한 AI 스토리지 성능 혁신

엔비디아는 AI 스토리지 성능을 대폭 향상시키기 위해 스펙트럼-X(Spectrum-X) 네트워킹 플랫폼을 데이터 스토리지 패브릭으로 확장한다고 발표했습니다. 이번 확장을 통해 AI 모델 학습과 추론 속도를 가속화하고, 데이터센터의 AI 워크로드 처리 효율을 높일 계획입니다. 본 블로그 글에서는 엔비디아의 스펙트럼-X 기술과 그 영향에 대해 자세히 알아보겠습니다.


스펙트럼-X, AI 스토리지 네트워크의 혁신

AI 컴퓨팅 성능을 최대로 확대하려면 GPU 간 네트워킹뿐만 아니라 고속 스토리지 시스템도 안정적으로 작동해야 합니다. AI 학습 과정에서는 대량의 데이터를 신속하게 저장하고 필요할 때 불러오는 것이 중요합니다. 이를 위해 엔비디아는 스펙트럼-X 플랫폼을 통해 스토리지 성능을 최적화하고자 네트워크 인프라를 강화하고 있습니다.

 

엔비디아는 스펙트럼-X가 기존 네트워크 대비 스토리지 읽기 속도를 최대 48%, 쓰기 속도를 최대 41% 향상시킬 수 있다고 밝혔습니다. 이를 통해 AI 모델 훈련 과정에서 데이터 저장 및 검색 시간이 단축되어, 더 빠른 학습과 추론 작업이 가능해질 것입니다.

 

체크포인트 과정과 스펙트럼-X의 역할

AI 학습에서 모델이 일정 주기마다 현재까지의 훈련 데이터를 저장하는 '체크포인트(checkpoint)' 과정은 필수적입니다. 그러나 데이터양이 테라바이트(TB) 급일 경우 네트워크 부하가 증가하여 저장 시간이 지연되고 시스템 병목현상이 발생할 수 있습니다. 스펙트럼-X는 이러한 문제를 해결하기 위해 실시간 트래픽 분산과 네트워크 최적화 기능을 적용하여 스토리지 성능 저하를 방지합니다.

 

협력 및 적용 사례

엔비디아는 AI 스토리지 최적화를 위해 다양한 스토리지 기업들과 협력을 강화하고 있습니다. 협력 기업으로는 DDN, 바스트 데이터(VAST Data), 웨카(WEKA) 등이 있으며, 이들은 스펙트럼-X 기반 솔루션을 도입해 AI 스토리지 환경을 최적화하는 작업을 진행 중입니다.

 

이스라엘에 구축된 AI 슈퍼컴퓨터 '이스라엘-1(Israel-1)'도 스펙트럼-X의 성능을 검증하는 역할을 하고 있습니다. 엔비디아는 해당 슈퍼컴퓨터에서 GPU 클러스터가 스토리지에 접근할 때 발생하는 네트워크 트래픽을 분석한 결과, 모든 테스트 환경에서 기존보다 높은 성능을 기록했다고 밝혔습니다.

 

기술적 성과와 기능 개선

스펙트럼-X를 통해 엔비디아는 AI 스토리지 네트워크 성능을 극대화하고 있습니다. 데이터 전송 경로를 실시간으로 분석해 최적의 흐름을 제공하는 기술을 적용하여 데이터 저장과 검색 속도를 크게 개선했습니다. 또한 AI 학습 과정에서 발생하는 네트워크 병목현상을 줄이기 위해 동적 트래픽 분산 기능을 강화하였습니다. 다수의 GPU가 동시에 스토리지에 접근하는 상황에서도 일정한 속도를 유지하며 안정적인 데이터 처리가 가능하도록 설계되었습니다.

 

스펙트럼-X의 미래 전망

엔비디아는 AI 모델이 대형화되고 데이터가 멀티모달(다양한 형태)로 증가함에 따라, 스토리지 네트워크 최적화가 AI 성능을 좌우하는 핵심 요소가 될 것으로 전망하고 있습니다. 이에 따라 스펙트럼-X를 기반으로 AI 인프라의 전반적인 성능을 끌어올리기에 집중할 계획입니다. 이러한 기술 혁신은 엔비디아의 AI 워크로드 처리 능력을 한층 강화하고, 나아가 AI 연구 및 개발의 새로운 기준을 제시할 것입니다.