검색어 '스토리지'에 대한 1 개의 검색 결과

  1. 2009/09/01 스토리지 가상화 1 by 젤라피

스토리지 가상화 1

2009/09/01 11:45 / IT 소식
스토리지 가상화(Storage Virtualization) 현재와 미래

스토리지 가상화 솔루션 시장 그토록 기다리던 봄날이 왔다

HDS·EMC 등 대형 벤더 진입으로 이목집중 … 고성능·가용성 등 기술적 진보 확연


갈수록 복잡하고 다양해지는 스토리지 시스템과 비례해 스토리지 관리 업무도 더 이상 인력만으로는 감당할 수 없는 지경에 이르렀다.
특히 IT 예산과 관리 인원의 제한적인 증가(혹은 또는 자주 발생하는 예산 및 인적 자원의 축소)는 스토리지 인프라와 이를 관리하는 책임을
가장 고된 IT 업무 가운데 하나로 만들어 버렸다.‘보다 적은 돈으로 보다 많은 것을 하라(Do more with Less)’는 말은
스토리지 관리에도 그대로 적용된다. 덕분에 스토리지 관리자들은 비용은 줄이되 복잡성을 개선할 수 있는 새로운 방법을 찾는데 혈안이 돼 있다.
스토리지 가상화(Storage Virtualization) 기술은 바로 이러한 스토리지 관리자들에게 새로운 해법을 제시한 셈이다.
그렇다면 여기에서 한 가지 궁금증이 생긴다. 이렇게 뚜렷한 목적을 갖고 등장한 스토리지 가상화 기술이 왜 빠르게 확산되지 못했을까?
전문가들은 기존 스토리지 가상화 솔루션들이 널리 채택되지 못한 결정적 이유는 하드웨어의 신뢰성 및 성능이
첫 번째 이유(ESG 보고서)이며, 가용성 및 확장성과 관련된 이슈를 해결하지 못한 것이
또 다른 이유(데이터 모빌리티 그룹 보고서)라고 지적한다.그러나 최근 등장한 스토리지 가상화 솔루션들은
이러한 문제점들을 대부분 개선했다는 점에서 차세대 솔루션으로 불려지곤 한다. 이 제품들은 기존 가상화 솔루션의 문제점 해결은 물론,
가상화된 스토리지 인프라 수준을 한 단계 더 끌어올릴 수 있는 스토리지 애플리케이션(ILM, 유틸리티 스토리지 등)과의 연동 및
확실한 ROI를 보장하며, 대부분의 이기종 스토리지 제품들과 호환성을 갖는다.
결론적으로 말하자면 스토리지 가상화 솔루션 시장에도 따사로운 봄날이 찾아온 것이다. 스토리지 가상화 솔루션은
낮은 스토리지 자산 이용률, 스토리지 관리의 복잡성, 비즈니스 민첩성의 부족, 그리고 스토리지의 고립과 같이
기존 스토리지 솔루션들이 제공하지 못한 문제들을 해결하며 비상을 위한 기지개를 켜고 있다. <편집자>


PART Ⅰ

“스토리지 가상화는 예측 가능한 스토리지 서비스를 위한 핵심 기술이다”

I/O 성능·스토리지 활용률·관리 효율성 제공 … 어레이·호스트·N/W 가상화 제품 상용화


스토리지 가상화라는 용어는 오래 전부터 사용해 왔지만, 실제로는 사용하는 사람들마다 혹은 이를 언급하는 벤더마다 다른 관점으로 혼용돼 사용되고 있다. 가상화에 대한 관심이 높아지는 현 시점에서, 이에 대해서 가상화라는 사전적 의미 해석부터 시작, 스토리지 가상화에 대한 정의를 수행하고, 이에 대한 필요성과 실제 구현되는 핵심 기술 및 변화의 추이를 언급한다.
| 신창희 한국베리타스 제품컨설팅본부 부장·christina.shin@veritas.com |


아메리칸 헤리티지 영어사전에 따르면 ‘가상화(Virtual)’라는 사전적 용어 해석은, 근본적인 사실, 형태로 존재하지 않으나, 마치 실질적으로 혹은 효과상으로 그러한 것으로 간주되는 것이라고 볼 수 있다.
이 정의에서 살펴볼 수 있는 것처럼, 개체의 가상화는 하단의 구성에 상관없이 핵심 속성을 유지한, 새로운 개체를 구성하는 것으로 볼 수 있다.
예를 들면, 가상 도서관은 읽을 수 있는 문서가 열람되거나 대여될 수 있는 ‘실제’ 도서관의 중요한 속성을 가지고 있지만 건물, 서가, 종이 책과 같은 도서관이 갖는 물리적이고 부수적인 특성은 가지고 있지 않다.
데이터 스토리지는 IT 영역으로서는 최초로 가상화의 개념을 도입한 분야다. 지난 10여 년 동안, 스토리지 시스템은 ‘가상 디스크 드라이브(virtual disk drive)’의 구현으로 설명되곤 했다. 특히 이 개념은 테이프 드라이브와 테이프 미디어(Virtual Tape)를 가상화한 시스템으로 확장돼 사용되기도 했다.
데이터 스토리지는 복잡한 첨단 기술의 총화라고 할 수 있지만, 개념적으로는 디스크 드라이브, 테이프 드라이브, 테이프와 같은 단순한 개념으로 구성된다. 여기에서 데이터 스토리지 장비의 핵심적인 속성은 데이터를 영구적(persistent)으로 저장하고 클라이언트가 요청하는 경우 전달할 수 있다는 것이다.
반면 비핵심적인 속성으로는 장비의 크기, 전력 소모량, 성능, 스토리지 용량과 같은 것들이 있다. 이러한 속성은 장비마다 서로 다르지만 스토리지 장비의 근본적인 성격에 영향을 주지는 않는다.
따라서 데이터를 영구적으로 저장하고 클라이언트의 요청에 의해 전달할 수 있는 개체라면 가상 스토리지 장비라고 부를 수 있을 것이다. 실제로 가상 스토리지 장비는 동일한 제어 구조를 갖는 여러 물리적 스토리지를 포함하는 경우가 많다.
가상 스토리지 장비는 실제로 존재하지 않으며, 같은 유형의 물리적 장비의 특성을 그대로 표현하고 있을 뿐이다. 이러한 표현은 클라이언트(애플리케이션 프로그램)의 I/O 요청에 의한 응답의 형태로 나타난다. 이러한 응답이 실제 장비와 충분히 유사한 형태로 나타난다면, 클라이언트는 장비가 실제로는 존재하지 않는다는 사실을 알 필요가 없다.
이렇게 간단하지만 강력한 개념이 스토리지 가상화를 효과적인 도구로 만들어 주는 것이며, 그 효과를 누리기 위해 애플리케이션을 굳이 변경하는 수고를 들일 필요도 없다. 디스크 드라이브, 테이프 드라이브, 라이브러리, 파일 시스템에 접근 가능한 애플리케이션 또는 시스템 소프트웨어라면 별도의 변경 작업 없이 그와 동등한 가상 장비에도 접근할 수 있다.

스토리지 가상화의 형태
유형에 무관하게, 모든 컴퓨터 스토리지 또는 데이터 개체는 가상화될 수 있다. <그림 1>은 SNIA(Storage Networking Industry Association)가 정의한 스토리지 및 데이터 개체 가상화의 분류법을 보여주고 있다.
<그림 1>의 가장 상단에 위치한 열은 가상화된 개체들을 나타내고, 두 번째 열은 가상화가 실제로 일어나는 시스템의 위치, 그리고 마지막 열은 가상화 기술에 따른 분류를 보여주고 있다. 스토리지 가상화에 대한 언급은, SNIA가 블록(block) 또는 디스크 가상화(Disk virtualization)라고 명명하는 영역을 다루고 있다. <그림 1>에서 음영 처리된 부분은 중점적으로 다뤄지게 될 가상화 유형을 나타낸다.

사용자 삽입 이미지
스토리지 가상화의 필요성
데이터 스토리지 장비의 품질 기준은 매우 단순하다. 스토리지 장비는 성능이 좋고 고장나지 않고(다시 말해 고가용성을 보장하고) 가격이 저렴하고 관리하기 쉬우면 좋은 장비라고 평가된다. 가상화는 이 4가지 기본적인 품질측정기준을 모두 향상시키는데 응용될 수 있다.
폭발적으로 증가하는 스토리지 사용량과 높은 서비스의 가용성에 대한 사용자의 요구 사항은 적정한 I/O 성능, 가용성, 활용률을 포함한 용량 대비 비용과 관리성을 제공하기 위해서 가상화 솔루션의 도입이 요구된다.

·I/O 성능(I/O Performance)
애플리케이션의 성능에 있어 데이터 액세스와 전송에 관련된 속도가 차지하는 비중은 점점 더 증가하고 있다. 예를 들어 데이터의 전송속도가 비디오 재생기의 처리속도를 따라잡지 못한다면 비디오 온디맨드 환경의 구현은 불가능하다고 할 수 있다.
또 신용카드 데이터베이스의 업데이트 속도가 충분히 빠르지 못하다면, 줄을 선 고객들의 불만은 그에 비례해 증가할 것이다. 여기에 가상화 기술을 적용한다면, 여러 스토리지 장비들을 병렬 배치해 애플리케이션 관점에서의 I/O 성능을 향상시키는 스트라이핑(striping)이 가능하다.
·가용성(Availability)
온라인 환경이 일반화되면서 컴퓨터 시스템의 가용성에 대한 요구는 더욱 더 증가하고 있다. 고객들은 단지 ‘컴퓨터가 다운됐다’는 이유로 음식을 살 수 없거나 자동차 연료를 넣지 못하게 됐다는 사실을 납득하지 못한다. 에너지 서비스, 운송 시스템, 공공 안전, 엔터테인먼트 서비스 등 대부분의 산업 분야는 데이터가 필요할 때 제공될 수 있다는 데이터 프로세싱 시스템의 안정성에 의존하고 있다. 데이터는 데이터 스토리지가 ‘가용’한 경우에만 역시 제공이 가능하다.
미러링(mirroring) 기술은 동일한 형태의 두 개 또는 그 이상의 디스크 드라이브를 사용해 디스크 장애에 대비하고 가용성을 향상시킨다. 미러링을 포함하는 데이터 가용성을 향상시키기 위한 기술들(패스 이중화, 미러링, 원격지 백업 등)이 제공된다.

·용량 대비 비용(Cost of Capacity)
디스크 스토리지의 가격이 급격하게 하락하고 있는 반면, 스토리지 사용량 역시 그만큼 빠르게 증가하고 있다. 가상화의 미러링, 원격 복제(remote replication)와 같은 기술은 디스크 사용량의 증가를 더욱 가속화하고 있으며, 이러한 이유 때문에 스토리지 용량에 따른 비용은 중요한 이슈로 떠오르고 있다. 기업은 스토리지 비용의 절감을 통해 IT 비용을 줄이거나 애플리케이션의 성능 향상에 꾸준히 투자하는 것이 가능하다.
가상화는 여러 장비의 스토리지 용량을 한데 모으거나(aggregate), 유휴 공간을 필요한 다른 서버에 할당(redeploy)하는 것을 가능하게 함으로써, 스토리지의 활용률을 극대화하는 기능을 제공한다.

·관리성(Manageability)
전체 IT 비용 중에서도 가장 빠른 속도로 증가하는 부분이 시스템 구성요소와 기능을 관리하는 데 수반되는 비용이라는 점은 오늘날 IT 업계에서는 상식처럼 받아들여지고 있다. IT 비용을 산정하는 방식은 전문가들마다 서로 다르지만, 스토리지를 구매하는 비용에 비해 5배에서 10배 가까운 비용이 관리에 소요된다는 계산이 일반적으로 통용되고 있는 것처럼 보인다. 때문에 관리 비용은 스토리지 품질의 중요한 측정기준이 된다. 스토리지를 구매하려는 고객은 1명의 관리자가 더욱 더 많은 용량을 관리할 수 있게 해 주는 솔루션을 찾고 있다.

스토리지 가상화 구현 기술
스토리지 가상화에 사용되는 기술은 그 대상이 무엇인가에 따라 또는 의도하는 효과가 무엇인가에 따라 다양하게 구분된다. 디스크 드라이브, 테이프 드라이브, 테이프, 데이터 파일, 파일 시스템 각각에 대해 가상화 기술의 구현이 가능하며 서로 다른 장점을 갖는다.

·디스크 가상화
디스크 드라이브는 고정 길이의 블록에 데이터를 저장하고, 모델 별로 서로 다른 물리 주소 구조(geometry)를 가지고 있다. 여기에는 실린더, 트랙, 섹터 등의 구성, 손상된 미디어를 위해 예비된 공간, 헤드의 위치 잡기, 블록의 위치 정보 확인 등에 관련된 정보들이 모두 포함된다.
디스크 드라이브는 내부 프로세서를 이용해서 이러한 물리 주소 구조를 평면적인 논리적 블록 어드레스(LBA) 형태로 가상화한다. 그 결과로 모든 디스크는 클라이언트 관점에서 거의 동일한 디바이스인 것처럼 보여지게 되며, 전혀 다른 기술을 사용한 새로운 디스크 모델이 나오더라도 기술적인 도입 장벽이 거의 없게 된다.

·RAID: 가상 스토리지의 성능 및 가용성
블록 스토리지 디바이스를 가상화하기 위한 모든 소프트웨어에 기본적으로 RAID(Redundant Array of Independent Disks) 기술이 구현돼 있다. RAID 기술은 모든 데이터 센터 환경에 보편적으로 적용된다.
모든 엔터프라이즈 스토리지 시스템은 I/O 성능, 데이터 가용성, 관리성의 향상을 위해 RAID 기술의 일부를 내부적으로 구현한다. 서버 기반으로 구현되는 RAID 역시 동일한 혜택을 제공하며, 때로는 2가지 이상의 스토리지 시스템을 하나의 볼륨으로 조합함으로써 추가적인 용량, I/O 성능, 가용성 향상 효과를 누릴 수 있다.
어떤 레벨의 RAID 기술을 구현했을 때 최대의 효과를 누릴 수 있는 지 고민하는 경우가 있다. 선택할 수 있는 기술의 종류가 그만큼 다양하며, 각각의 기술이 모두 일정 수준 이상의 I/O 성능을 향상시키고 데이터의 안정성을 확보해주는 기능을 제공하고 있기 때문이다.
이렇게 생성된 가상 디바이스를 이용해 파일 시스템은 포맷, 데이터 파일의 저장과 같은 작업을 수행한다. RAID 시스템에서 제공하는 가상 디바이스는 LUN(Logical Unit)이라는 용어로 불리는데, 가상화된 어레이는 단일 LUN으로 표시될 수도 있고, 컨트롤 소프트웨어에 의해 여러 개의 LUN으로 분리돼 제공될 수도 있다.

·가상 스토리지 가용성
미러 또는 RAID 구성이 전혀 돼 있지 않은 디스크 드라이브에 장애가 발생되는 경우, 데이터는 소실되며 복구가 불가능하다. 이러한 경우 백업된 데이터를 이용해 서비스를 복구하는 것 이외에는 다른 방법이 없다. 하지만 핫 스페어, 핫 스왑 등을 가진 미러 디스크와 같은 고가용성 시스템의 경우에는 복구 방법이 제공된다.
여기에 더해 데이터 센터 전체의 장애에 대비한 원격지에 데이터 복제를 위한 기술이 요구된다. 가상 스토리지의 다운 타임을 최소화하기 위해서는 이중화된 컴포넌트에 문제가 발생하는 경우 자동적으로 교체될 수 있어야 한다. RAID 시스템의 경우 디스크 드라이브, 내부 데이터 경로, 전원, 냉각 장치 등의 컴포넌트가 모두 이중화되며, 서버(그리고 볼륨 매니저)는 클러스터링 소프트웨어를 이용해 여러 개의 그룹으로 구성함으로써 이중화가 가능하다. 스토리지 네트워크는 서버와 스토리지가 서로 분리된 두 개의 네트워크를 통해 연결되도록 함으로써 이중화된다.
RAID 시스템에 의해 구성된 LUN을 서버 기반으로 다시 통합해 대용량의 단일 가상 디바이스를 생성하게 된다. 이렇게 생성된 가상 디바이스는 용량, 성능, 가용성 면에서 모두 뛰어나며, 로드 밸런싱이 가능하므로 개별적으로 구성된 하부의 RAID 시스템 기반 어레이의 성능을 압도한다. 이때 스트라이핑 대신 서버 또는 네트워크 기반 미러링을 적용하는 경우, RAID 시스템의 가용성 향상이 가능하다.

스토리지 가상화 기술의 실제 적용
가상화 컨트롤 소프트웨어가 설치돼 구현되는 실제 적용 상의 기술적 위치는 아래와 같이 구분한다.

사용자 삽입 이미지
RAID 시스템에서의 블록 스토리지 디바이스 가상화 구현
RAID 컨트롤러에 내장된 프로세서는 용도에 맞도록 최적화돼 있을 뿐 아니라 성능 향상을 위해 특별히 제작된 보조 장치와 함께 설계돼 있기 때문에 기능과 성능 면에서 매우 뛰어나다.
대부분의 엔터프라이즈 RAID 시스템은 복수의 병렬 SCSI 서버 포트 또는 스토리지 네트워크를 통해 하나 이상의 애플리케이션 서버에 스토리지 서비스를 제공할 수 있도록 설계돼 있다.
·애플리케이션 서버에서의 블록 스토리지 디바이스 가상화 구현
서버 기반 볼륨 관리자는 위에서 언급한 장점은 가지고 있지 않지만 RAID 시스템 스토리지에 비해 저렴한 비용으로 대부분의 컴퓨터 환경에서 구현 가능하다는 이점이 있다. 또 볼륨 관리자는 서로 다른 유형의 디바이스를 한 그룹으로 묶거나 가상화하는 것을 가능하게 한다.
이러한 장점 때문에 RAID 시스템에 의해 LUN으로 표현된 가상 디바이스를 다시 한 번 볼륨 관리자를 통해 가상화하는 경우가 많다. 볼륨 관리자는 I/O 성능과 데이터 가용성 향상을 위한 다양한 기능을 제공한다. 예를 들어 서로 다른 RAID 시스템간의 스트라이핑/미러링을 구성할 수도 있고 채널 장애에 대비해 2개 이상의 액세스 경로로 가상 디바이스에 연결되도록 설정하는 것도 가능하다.

·스토리지 네트워크에서의 블록 스토리지 디바이스 가상화 구현
스토리지 네트워크 기술이 대중화된 상황에서, 스토리지 네트워크 인프라스트럭처를 스토리지 시스템 또는 서버와 구분되는 하나의 독립적인 구성 요소로 생각하는 것이 보다 자연스러운 구분법이라 할 수 있다. 스토리지 네트워크는 스토리지 어플라이언스(Storage appliance)에 의해 구성되기도 하고, 좀 더 일반적인 방법으로 스토리지 네트워크를 통해 구성되기도 한다.
스토리지 네트워크 기반의 가상화 도구를 이용하는 경우 어떤 스토리지 디바이스, 어떤 서버든 그 유형에 관계없이 모두 가상화가 가능하다(물론, 실제 구현된 형태에 따라 그 지원범위는 달라질 수 있다).
네트워크 블록 스토리지 가상화 디바이스는 가상화 디바이스가 클라이언트와 물리적 스토리지를 연결하는 데이터 경로 안에 위치하는 인-밴드(In-Band) 방식, 그리고 클라이언트 기반의 가상화 컴포넌트가 스토리지 디바이스와 직접 커뮤니케이션을 수행하는 아웃-오브-밴드(Out-Of-Band) 방식의 두 가지로 구분된다.
다양한 스토리지 가상화 기술이 개발되고 활용돼 왔으며, 이제 가상 스토리지는 매우 유용하고 다채로운 기술 분야로 성장했다. 현재 스토리지 가상화의 구현 위치에 대한 장, 단점 분석에 대한 논의가 열기를 띠고 있다. 어레이 기반, 호스트 기반 가상화, 어플라이언스 기반의 가상화가 시장에 이미 출시돼 있다.
이미 언급했듯이, 전체의 통합 관리, 안정성, 성숙도, 가용성과 성능을 제공하는 데에는 고객 환경에 따라서 고려할 수 있는 솔루션이 장, 단점이 있고 상호 보완적인 측면의 활용이 가능한 측면도 존재한다.
지속적으로 표준화가 가속화되고, 대용량, 복잡한 이기종 플랫폼, 스토리지 네트워크 환경을 지원하기 위한 솔루션의 변화가 하루가 다르게 새로워지고 있으며, 가상화 기술은 궁극적으로 대용량 스토리지 서비스를 수용하는데 원하는 속도, 가용성, 스토리지 활용률 증대 기능과 관리성을 가진 예측 가능한 ‘스토리지 서비스’를 제공할 수 있는 기반을 제공하는 핵심 기술로 구현될 것이다.
 
PART Ⅱ

스토리지 가상화 솔루션 시장, “기나긴 겨울잠에서 깨어나다”

기술 검증 단계 넘어 실 구현 사례 급증 … HDS·EMC·넷앱 등 신규 진입 ‘대세’


스토리지 가상화 솔루션이 기술적 한계로 인해 널리 채택되지 못하고, 소규모 기업 환경에 간헐적으로 적용되던 시대는 지났다. 최근 새롭게 등장한 스토리지 가상화 솔루션들은 기존 가상화 솔루션의 문제점 해결은 물론, 다양한 스토리지 애플리케이션과의 연동 및 이기종 스토리지 제품과의 호환성을 보장하며 주류로 나아가기 위한 준비를 모두 마쳤다. 그토록 지루해하던 겨울잠에서 드디어 깨어난 것이다.
| 권혁범 기자·kino@datanet.co.kr |


폭발적인 데이터 증가를 위한 가장 효율적인 스토리지 구성 방식으로 각광받고 있는 SAN 시장은 올해에도 전 세계 기준 전년대비 40% 이상 고성장(인포-테크 리서치 그룹, 2005. 3)을 기록할 전망이다. 고가의 도입 비용에도 불구하고 이처럼 SAN에 대해 기업들의 호응이 뜨거운 것은 가용성, 확장성, 안정성과 같은 기업들의 요구 사항에 가장 부합하는 스토리지 구성 방식이 바로 SAN이기 때문이다.
하지만 SAN은 파이버 채널 스위치를 이용해 서버와 스토리지를 연결하기만 하면 완성되는 조립형 레고 상자가 아니다. 다양한 컴포넌트들의 조합이 짜임새 있게 설계되고, 운영을 위한 충분한 학습이 동반돼야만 그 효과를 모두 발휘할 수 있다. 예를 들어 SAN을 구성하면 스토리지 용량을 확장하는 일쯤이야 우스울 거라고 생각할 수 있지만, 막상 용량을 증설하게 되면 관리자는 특정 서버가 사용하는 데이터에 대한 볼륨을 일일이 설정해 줘야만 한다. 그리고 다시 특정 스토리지에 데이터가 집중되지 않도록 QoS(서비스 품질 관리), 즉 스토리지 공간의 효율적인 분배에도 계속 관심을 둬야 한다.

네트워크 스토리지 관리의 새로운 대안 ‘가상화’
최근 몇 년간 스토리지 업계의 최대 이슈로 대접받고 있는 ‘스토리지 가상화(Virtualization)’는 이와 같은 네트워크 스토리지(특히 SAN)를 보다 효율적으로 관리하자는 데 그 목적이 있다. 지금까지의 SAN이 단지 배선 문제만을 해결한 스토리지 통합 방식이었다면, 스토리지 가상화 기반의 SAN은 보다 강력한 관리 기능을 제공할 수 있는 차세대 스토리지 환경인 셈이다.
가상화 기능이 구현된 스토리지 시스템은 스토리지 관리자로 하여금 SAN 내의 저장 풀(pool)을 논리적 구조로 관리할 수 있도록 만든다. 논리적 저장 영역을 스토리지 풀에서 할당할 수 있기 때문에 물리적 장치의 구성과 용량의 배분이 서버와 애플리케이션에 대해 투명하다. 용량을 원하는 대로 추가하거나 제거할 수도 있으며, 이 작업은 서버 및 애플리케이션에 대해 자유롭다.
디스크 어레이와 같이 다른 성능이나 특성을 가진 장치를 애플리케이션에 적절한 성능 수준에 맞춰 동적으로 지정할 수 있으며, 리소스 할당 자동화가 가능해 최소한의 직접 조작으로 서비스 품질(QoS) 수준을 만족시킬 수도 있다. 이 밖에도 부서 등 기업의 사용자 그룹이 사용하는 저장 리소스를 쉽게 모니터할 수 있어, 각 그룹이 사용하는 용량에 따라 관리자가 쉽게 용량을 할당할 수 있다.

사용자 삽입 이미지
“가상화를 위한 가상화는 의미가 없다”
스토리지 가상화가 이처럼 네트워크 스토리지 관리에 새로운 방향을 제시하는 것이라면 왜 좀더 빠르게 보급되지 못하는 것인가? 미국 아이다호의 한 대형 은행에 근무하는 시스템 관리자의 말은 충분한 대답이 될 것이다.
그는 “스토리지 가상화란 물리적 디스크 드라이브를 논리적 볼륨으로 매핑(mapping)시키는 것을 의미한다. 이것은 대규모 디스크 어레이에서 수년 동안 해오던 것이다. 다만 문제는 관련 업체들의 과대선전으로 이 정의가 흐려지고 있다는 것이다. 최근 업체들이 말하는 스토리지 가상화란 마치 전혀 다른 것을 의미하는 것처럼 보인다”라고 말했다.
그의 말대로 스토리지 가상화를 단순히 ‘리소스 풀링(Resource Pooling)’ 정도로 해석한다면, 호스트 기반이나 디스크 어레이 기반 가상화는 이미 10년 전부터 존재해 온 기술이다. 그리고 가상화라는 개념만으로 본다면 파일 시스템이나 가상메모리 등에서 우리가 이미 익히 사용해 오고 있는 기술에 불과하다.
결국, 스토리지 가상화는 전혀 새로운 기술도 아닐 뿐더러 스토리지 관리의 새로운 대안은 더더욱 아니란 말인가? 몇 년 전까지만 해도 그 대답은 ‘글쎄’였겠지만, 지금은 확실히 ‘아니오’라고 말할 수 있다. 최근 대두되고 있는 스토리지 가상화는 단순히 ‘물리적 자원을 논리적 자원으로 변환’하는 기술만을 의미하지는 않기 때문이다.
지금 업계에서 말하는 스토리지 가상화는 이기종 스토리지 디바이스 구성을 논리적인 형태로 재구성한다는 기본 개념을 토대로, 가상 볼륨(Virtual Volume)을 통한 가용성 확보, DR(Disaster Recovery), 마이그레이션 기능 제공, 애플리케이션 성능 향상을 위한 작업량 분산 기능과 같은 개념까지 포함하고 있다.
업계의 관계자는 “스토리지 가상화라는 말이 최근에는 ‘가상화를 통한 스토리지 통합 운영 관리 솔루션’으로도 불린다. 벤더에 상관없이 모든 관리가 가능하고(통합적 측면), 볼륨을 어떻게 관리할 지, 백업 및 복구를 어떻게 구현할 지, 콘텐츠를 어떻게 보호하고, 유저가 원하는대로 스토리지 환경을 어떻게 구성할 지에 대한 대안을 제시하는(운영적 측면) 제품이 바로 ‘스토리지 가상화’ 솔루션이기 때문이다”라고 말했다.

스토리지 가상화 ‘시장 잠재력’ 최고조
결국 기존에 언급되던 ‘스토리지 가상화’와 최근 다시 회자되고 있는 ‘스토리지 가상화’는 비록 용어는 동일할지라도, 제공하는 기술면에서는 차이가 있는 셈이다. 이처럼 스토리지 가상화에 대한 정의가 업체마다 다를 수밖에 없었던 이유는 스토리지 가상화 기술이 기존 하드웨어나 소프트웨어 중심에서 최근 들어 네트워크 스토리지로 그 주도권이 빠르게 옮겨가고 있는 데 따른 것이다.
지금까지 스토리지 가상화 솔루션이라고 하면, 일부 스토리지 하드웨어 업체들이 제공하는 하드웨어 의존적 스토리지 가상화 솔루션이나 호스트 기반 스토리지 가상화 솔루션이 전부였다. 하지만 최근 등장하고 있는 네트워크 기반 스토리지 가상화 솔루션은 ‘스토리지 가상화 기술’에 대한 개념을 보다 구체화시켰다.
네트워크 스토리지(특히 SAN)의 효율적인 관리에 가상화 기술이 유용하다는 사실이 입증된 만큼, 단순한 논리적 볼륨 생성만을 스토리지 가상화라고 말해서는 안 된다는 것이다. 이들의 주장 역시 자사에 유리한 방향으로 개념을 정리한 것에 불과하지만, 업계는 물론 고객들 역시 이들의 주장이 전혀 근거 없다고 부정하지는 않는다. 시장이 이미 이들의 의도대로 움직이고 있기 때문이다.
실제로 스토리지 가상화 솔루션 시장은 매년 두드러진 성장세를 보이고 있다. IT 시장조사 전문기관인 가트너 데이터퀘스트에 따르면 전 세계 볼륨 매니지먼트 및 가상화 소프트웨어 시장은 최근 5년간 연평균 26.5%의 성장률을 기록중인 것으로 집계됐다. 물론 시장 규모로만 비교하면 여전히 전체 스토리지 소프트웨어 시장의 5%에도 못미치지만, 고객들의 높은 관심과 메이저 스토리지 벤더들의 잇따른 진입으로 성장 잠재력은 그 어느 때보다 높은 상태다.

베리타스, 검증된 호스트 기반 가상화로 승부
현재 전 세계 스토리지 가상화 솔루션 시장에서 가장 위력을 과시하고 있는 업체는 단연 베리타스소프트웨어다. 일반적으로 호스트 기반 스토리지 가상화 솔루션으로 구분되는 베리타스 볼륨 매니저(VVM)는 유닉스, 윈도 환경에서 10년 넘게 적용돼 온 대표적인 볼륨 매니지먼트 툴로써, 그 사용자 수만도 헤아릴 수 없을 정도다.
그러나 이 기능만으로는 최근 네트워크 스토리지 환경에서 요구하는 스토리지 가상화를 완벽하게 구현하기는 어렵다. 즉 1대 이상의 애플리케이션 서버와 이들의 SAN 연결 스토리지의 가상화를 구현하기 위한 토대로 VVM을 활용하는 것은 아무런 문제가 되지 않지만, 파일 공유나 데이터 복제와 같은 추가 기능 구현을 위해서는 또 다른 솔루션이 필요하다.
베리타스는 이를 위해 다양한 솔루션을 결합하는 방안을 제시한다. 베리타스 볼륨 매니저와 베리타스 파일 시스템을 결합한 ‘베리타스 스토리지 파운데이션(현재 4.1버전)’, 비즈니스 관점의 워크플로우 관리를 위한 ‘베리타스 커맨드 센트럴 스토리지(CCS)’는 베리타스가 제안하는 스토리지 가상화 구성의 핵심 솔루션이다. 이와 함께 다양한 고객들의 요구를 받아들여 지난해 상반기 시스코의 파이버 채널 스위치 번들형 제품인 ‘베리타스 스토리지 파운데이션 포 네트워크’ 제품을 선보인 데 이어, 올 하반기에는 보다 광범위한 스토리지 가상화 서비스 지원을 위한 ‘SAN 볼륨 매니저’ 베타 버전을 발표할 예정이다.
그럼에도 불구하고 다수의 업체들은 여전히 베리타스를 스토리지 가상화 솔루션 전문업체로 구분하는 것을 망설인다. 베리타스가 구분하는 스토리지 가상화 솔루션은 물리적 자원을 논리적 자원으로 변환시키는 볼륨 매니저와 파일 시스템을 결합한 것일 뿐, 여타 전용 스토리지 가상화 솔루션처럼 가상화된 볼륨을 활용해 다양한 부가 서비스를 제공하기 위해서는 베리타스의 모든 소프트웨어 제품군이 동원돼야 한다는 게 요지다.
베리타스는 오히려 이러한 점들이 베리타스만의 장점이라고 강변한다. 로우엔드 전산 환경에서 다수의 서버가 다수의 스토리지에 연결된 상황이라면 이와 같은 종합선물세트형 솔루션이 유용하겠지만, 미션 크리티컬한 환경에서는 그 동안 볼륨 매니지먼트, 파일 시스템, 백업/복구, 복제 등 스토리지 소프트웨어 분야별 시장에서 검증된 자사 솔루션이 경쟁력을 있다는 주장이다.
한국베리타스의 관계자는 “가상화 기술은 스토리지 시스템 전체에 적용되는 기술이라는 점에서 얼마나 많은 곳에 안정적으로 구축됐는지 기술적 성숙도를 살펴야 한다. 현재 시중에 출시된 인-밴드, 아웃-오브-밴드 방식의 네트워크 기반 스토리지 가상화 솔루션은 아직 충분히 검증됐다고 보기 어렵다. 이 두 기술의 단점을 보완하는 기술이 바로 호스트 기반 가상화 기술이며, 대표주자가 바로 베리타스다”라고 말했다.

“호스트는 가고 네트워크 시대가 왔다”
네트워크 기반 스토리지 가상화 기술이 차세대 SAN 구축의 핵심이라고 주장하는 이들은 호스트 기반 스토리지 가상화 기술의 경쟁적 우위를 강조하는 베리타스가 영 못마땅하다. 호스트 기반 가상화 솔루션과 달리 네트워크 기반 스토리지 가상화 솔루션에서 가상화 기술은 저렴한 비용으로 손쉽게 관리할 수 있는 다양한 스토리지 서비스 구현의 ‘전제 조건’에 불과하기 때문이다.
업계의 관계자는 “스토리지 가상화 솔루션을 단순히 스토리지 풀링(pooling)을 위해 도입한 사례는 없다. 물론 스토리지 가상화 구현만을 목적으로 프로젝트를 발주하는 기업들 역시 찾아보기 어렵다. 즉 다양한 부가 서비스 구현이 동반되지 않은 스토리지 가상화 기술은 고객들에게 아무런 의미도 제공할 수 없다”고 말했다.
네트워크 기반 스토리지 가상화 솔루션 시장을 선도하고 있는 팔콘스토어, 데이터코어, 스토어에이지의 솔루션은 바로 이러한 개념에 가장 충실한 제품들이다. 이들 제품은 논리적 볼륨을 통해 애플리케이션 서버와 물리적 디스크 리소스의 통합을 구현하는 기능 외에, 비즈니스 연속 운영, 재난 복구 솔루션, 데이터 마이그레이션 솔루션, 백업 통합 및 고속 백업, 보안 솔루션과 같은 다양한 기능을 제공한다.
베리타스가 가상화 툴을 비롯한 여러 포인트 솔루션들을 통합함으로써 관리 최적화를 도모하는 것과 달리, 이들 3사의 가상화 솔루션은 그 자체가 스토리지 통합 관리를 위한 일종의 프레임 역할을 하는 것이다. 따라서 이들의 영업 전략도 단순히 통일된 스토리지 풀을 제공하는 것보다는 재해 복구, 고속 백업과 같은 부가 서비스 부분에 초점이 맞춰져 있다.

팔콘스토어·데이터코어, 가상화 ‘신흥강호’ 입증
비슷한 시기에 국내 시장에 진출한 이들 3사 가운데 현재 가장 주목받고 있는 업체는 팔콘스토어다. 지난 2003년 국내 지사 설립 2개월만에 KT와 한미은행이라는 대형 고객을 확보하며 주위를 놀라게 만들었던 이 회사는 1년 사이에 매출액을 2배로 늘리며 고공행진을 거듭하는 중이다. 지난해 새롭게 확보한 고객들을 살펴보면 공공기관(통계청, 강원도청, 음성군청, 광주 북구청, 광주 동구청 등), 금융권(제일은행, 하나은행 등), 대학(충남대, 우성대, 관동대, 경운대 등), 일반 기업(현대오일뱅크, 신도리코 등) 등 전 산업에 골고루 분포돼 있다.
이러한 기세는 올해에도 계속되고 있다. 공공기관 및 일반 기업들의 관심이 크게 높아지면서 ‘IP스토어’는 올해 들어 1일 평균 1개씩 꾸준히 테스트가 진행중이다. 덕분에 올 1/4분기 성적도 벌써 지난해 성적을 뛰어넘었다. 이러한 속도라면 올해 국내 실적이 100억원을 넘을 전망이다.
이를 두고 일각에서는 가상 테이프 라이브러리(VTL) 매출액이 포함된 수치라거나 메이저 벤더의 부재로 인한 일시적 상승 효과라고 폄하하기도 하지만, 고객들의 목소리는 결코 그렇지 않다. 통계청은 ‘IP스토어’를 가장 잘 활용하고 있는 고객 중 하나다. 올 초 관리상 실수로 고객 데이터 로그 파일을 분실했을 때에도 통계청은 ‘IP스토어’의 타임마크 기능을 활용해 손쉽게 데이터를 복구할 수 있었다.
팔콘스토어와 거의 동시에 국내 지사를 설립하고 초기 시장을 선도해 온 데이터코어도 비록 폭발적인 반응은 아니지만 꾸준히 입지를 굳혀가고 있다. 금융결제원, 대구시청, 소방본부(이상 재해 복구), LG전자, 경기도청, 충남교육과학연구원(스토리지 이중화) 등에 ‘SAN심포니’를 공급하며 인지도를 넓혀 가는 중이다.
데이터코어 역시 올해 들어 출발은 좋다. 벌써 세 군데 이상에 제품이 공급됐으며 새롭게 진행중인 프로젝트도 적지 않다. 특히 지난해 선보인 SMB용 스토리지 가상화 솔루션인 ‘SAN멜로디’가 드디어 인제대학교에 처음으로 공급됐다. 데이터코어는 SRM 시장을 겨냥한 ‘SAN마에스트로’와 iSCSI 이중화를 지원하는 ‘SAN심포니 v6.0’가 합세되면 한층 가속도가 붙을 것으로 내다보고 있다.
데이터코어코리아의 관계자는 “지난해까지가 국내에서의 기틀을 닦는 기간이었다면, 올해부터는 그 결실을 거두는 해가 될 것이다. 다만 보다 알찬 수확을 위해 영업 인력을 확충하고, 서비스 지원을 개선해 나갈 계획이다. 특히 현재 추진중인 국내 서버 벤더와의 제휴는 데이터코어코리아의 입지를 크게 높여줄 것으로 기대된다”고 말했다.

스토어에이지·IBM, 알짜배기 고객 확보로 ‘건재’ 과시
반면 네트워크 스토리지 가상화 솔루션 가운데 유일한 아웃-오브-밴드 방식임을 강조하며 기술적 우위를 거론해 온 스토어에이지는 진입 시기나 그간의 노력을 감안하면 아직까지는 기대에 미치지 못하고 있다. 다만 지금껏 넷클립스 단일 총판을 유지해 온 이 회사가 지난해 2월 인포큐브와 추가로 파트너 계약을 체결한 후 서서히 상승세에 접어들었다는 점은 주목할 만한 변화다.
인포큐브가 포스코를 고객사로 확보한 것은 스토어에이지의 한국 시장 공략에 커다란 분수령이 될 전망이다. 넷클립스의 영업력이 주로 시·군·구에 집중돼 있어 스토리지 가상화 솔루션 ‘SVM’의 인지도 제고에 다소 어려움이 있었다면, 포스코의 구축 사례는 이와 같은 고민을 일시에 해결하는 효과를 제공하고 있다.
포스코의 ERP 시스템은 가동계와 개발계로 구성된다. 가동계는 HP 수퍼돔과 EMC 시메트릭스로, 개발계는 10여개의 이기종 서버와 EMC 클라릭스가 연결돼 있다. 하나의 ERP DB를 위해서는 최소 7개의 볼륨을 활용해 개발 및 테스트를 진행해야 현업에 문제가 없을 것이라는 오라클의 조언대로라면, 시메트릭스에 저장되는 1.4TB 가량의 DB를 개발계에서 이용하기 위해 무려 10TB의 용량을 증설해야 한다. 게다가 가동계 DB가 2TB로 늘어나면 개발계에서는 6TB를 추가로 늘려야 하는 것을 의미한다.
결국 포스코는 스토리지 가상화 솔루션을 이용해 이러한 문제를 해결하기로 결정했다. 다만 수퍼돔을 포함해 12대의 서버에서 나오는 데이터 쓰루풋을 감당하기에는 인-밴드 방식의 솔루션이 부적절하다는 판단 하에 아웃-오브-밴드 방식의 ‘SVM’을 적용했다. 현재 ‘SVM’은 무려 120여개의 포트를 연결해 포스코의 스토리지 통합 구성을 지원하고 있다.
지난 2003년 의욕적으로 네트워크 기반 스토리지 가상화 시장에 동참한 IBM도 아직 고객 숫자로만 보면 실망스러운 성적이다. 그러나 그 내용만으로 본다면 주시할 필요가 있다. 삼성전자의 경우 단지 스토리지 관리를 위해 사용중이지만, 음원 스토리밍 서비스 업체인 유리온과 대신증권은 실시간 복구 기능을 갖춘 미러링 스토리지 솔루션 환경을 구축해 놓은 상태다.
그 동안 EMC의 시메트릭스와 SRDF로 구성된 재해 복구 시스템을 운영 중이던 대신증권은 IBM의 스토리지 가상화 솔루션 ‘SVC(SAN Volume Controller)’를 이용해 이기종 장비간 동기 방식의 재해 복구 환경을 구축하는 데 성공했다. 특히 ‘SVC’는 가상화 기반 재해 복구 서비스 외에도 온라인 업무 시간 중 데이터 마이그레이션, 볼륨 확장 등 현업 업무에서의 운영 및 관리를 보다 용이하게 바꿔 놓았다는 평가다.
강신호 대신증권 과장은 “IBM의 가상화 솔루션을 통해 온라인 시스템의 가용성 확보는 물론, 특정 업체의 내부 복제/재해 복구 솔루션까지 통합 관리할 수 있게 돼 운영 및 관리가 한결 용이해졌다”며 “재해 복구 구축을 위해 특정 하드웨어에 종속되는 제약이 없어진 점도 만족스럽지만, 무엇보다 TCO 관점에서의 비용 절감이 가장 큰 소득이다”라고 말했다.

사용자 삽입 이미지
스위치 기반 스토리지 가상화가 대세(?)
이처럼 SAN 환경을 보다 최적화시키기 위해 스토리지 하드웨어 업체 및 소프트웨어 전문 업체들이 가상화 기술을 전면에 내세움에 따라, SAN 환경의 핵심 역할을 하는 파이버 채널 스위치 업체들도 이러한 흐름에 적극 동참하고 나섰다.
가장 적극적인 업체들은 스토리지 하드웨어 벤더들과 OEM 계약이 체결돼 있지 않아 이들의 눈치를 살피지 않아도 되는 니치 플레이어(Niche Player)들이다. 맥산시스템즈(MaXXan Systems)는 지난 2003년 팔콘스토어 ‘IP스토어’의 모든 기능(가상화, 내부 복제, 원격 복제, 서버-프리 백업, 이기종 스토리지간 미러링 등)을 제공하는 애플리케이션 카드(Server) ‘SA200f’와 통합된(integrated) 인텔리전트 애플리케이션 스위치 ‘MVX’ 제품군을 선보이며 본격적인 스위치 기반 네트워크 가상화 시대를 열었다.
MDS 9500 시리즈 출시 이후 줄곧 가상화 기술이 블레이드 형태로 스위치 안에 구성되는 인밴드 방식의 가상화 스위치 출시를 예고해 온 시스코는 지난 2003년 말 베리타스와 IBM의 가상화 솔루션을 탑재한 ‘VSF 포 네트워크(베리타스)’, ‘SVC+MDS 9000 번들 솔루션(IBM)’ 제품을 각각 선보였으며, 토이카네트웍스(Toika Networks)도 지난해 하반기에 스토어에이지의 ‘SVM’이 탑재된 인텔리전트 스위치 제품을 각각 출시했다.
그러나 이러한 제품들은 사실상 시장에서 크게 주목받지 못했다. 서버 의존적이지도 않고(애플리케이션 성능 저하 유발), 하드웨어 의존적이지도 않고(가상화 구현 한계), 어플라이언스 의존적이지도 않아(어플라이언스 성능에 따른 버틀랙 생성), 스토리지 가상화 기술의 현격한 발전을 이룰 수 있을 것이라는 원래 의도와는 달리, 어플라이언스와 파이버 채널 스위치를 동일한 박스에 집어넣은 것에 불과했기 때문이다.
결국 진정한 의미의 스위치 기반 스토리지 가상화는 최근 EMC가 선보인 ‘스토리지 라우터(코드명)’라고 볼 수 있다. EMC의 ‘스토리지 라우터’의 핵심은 데이터 경로와 스토리지 관리 경로의 완전한 분리를 책임지는 데이터 패스 컨트롤러(DPC)다. 각각의 포트마다 부착된 DPC(일종의 ASIC)는 가상화 엔진을 탑재해 데이터 패스를 관할하고, 나머지 부가 서비스들은 이 스위치에 모듈형으로 얹혀진다. 이로 인해 데이터 경로와 스토리지 관리 경로가 완전히 분리돼 단일경로를 사용하는 인-밴드 방식의 단점을 보완하며, SAN 레벨에서의 고성능 서비스, 고가용성, 안정성을 보장함으로써 네트워크 단에서의 다양한 이기종 스토리지 통합 구성을 지원한다.
이처럼 확연한 기술적 진보에 힘입어 기업들의 관심도 크게 증폭되고 있다. 신제품 런칭과 함께 진행한 EMC 고객 세미나에 참석한 기업들 가운데 대여섯개 기업이 기존 업무의 효율성을 위해 ‘스토리지 라우터’ 테스트를 요청했으며, 신규 업무를 위해 적용을 문의하는 기업도 있었다. 물론 이것만으로 스위치 기반 스토리지 가상화가 대세라고 단언할 수는 없지만, 어플라이언스 방식에 비해 초반부터 높은 관심을 얻고 있는 것만은 사실이다.

HDS·썬, 컨트롤러 기반 가상화 모델 제시
스위치 방식의 스토리지 가상화 방식을 대세라고 표현하는 것에 심한 거부감을 받는 기업들은 비단 어플라이언스 방식의 스토리지 가상화 솔루션 업체들만이 아니다. 컨트롤러 기반 스토리지 가상화(혹은 인박스 가상화)의 당위성을 주장하는 HDS와 썬마이크로시스템즈, SAN과 NAS를 동시에 아우르는 가상화 솔루션의 필요성을 강조하는 네트워크어플라이언스(이하 넷앱)와 어코피아네트웍스가 대표적이다.
HDS는 지난해 하반기에 선보인 ‘태그마스토어 USP’야 말로 가장 완성도가 높은 스토리지 가상화를 구현한다고 역설한다. 어플라이언스든, 스위치든 별도의 추가 장비 없이 32PB의 내외부 스토리지를 하나의 공동 풀로 통합해 단일 소프트웨어로 관리할 수 있고, 이기종 스토리지에 대한 복제 및 마이그레이션을 지원한다는 점에서 가장 효율적인 방식이라는 것이다. 일부에서 지적하는 원격 복제의 경우 DWDM 장비를 활용하면 원격지에 또 한 대의 태그마스토어를 구축할 필요 없이 DR 구성도 가능하다고 말한다.
HDS의 이러한 주장에 적극적인 지지 의사를 밝힌 업체가 바로 썬이다. 오는 6월 발표 예정인 썬의 ‘SE6920’ 업그레이드 버전은 태그마스토어의 미드레인지 버전이라고 봐도 무방할 정도로, 노선이 거의 동일하다. 이 제품은 스토리지 컨트롤러 단에서 스토리지 풀(pool) 매니저 기능은 물론이고, 가상화 레거시 볼륨(VLV), 볼륨 미러링, 데이터 리플레케이터 기능을 모두 지원한다. 특기할 만한 사실은 파이버 채널은 물론, iSCSI 프로토콜까지 지원해 제품 활용도를 대폭 향상시켰다는 점이다.

새롭게 떠오르는 NAS·파일 시스템 가상화 ‘눈길’
반면 넷앱은 NAS 시장의 강자답게 진정의 의미의 스토리지 가상화 솔루션이라면 SAN 뿐 아니라 NAS와 IP SAN 등 다양한 스토리지 환경에 모두 적용돼야 한다고 강조한다. 최근 넷앱이 선보인 ‘넷앱 V시리즈’는 이와 같은 다양한 블록 및 파일 환경에 걸쳐 동일한 가상화, 프로비져닝, 관리 모델을 지원한다. 동시에 디스크 기반 백업/복구, 바이러스 보호, 2배의 디스크 용량을 요구하지 않는 가상화 복제, 데이터베이스 변조(corruption)로부터 신속한 데이터 복구, 온라인 재해 복구를 위한 동기 및 비동기 미러링 기능을 제공한다.
다만 여기에서 주의할 점은 이 제품은 기존 NAS 장비까지 모두 아우르는 가상화 기능은 제공하지는 않는다. ‘넷앱 V시리즈’의 전신이 ‘g파일러’라는 사실만으로 충분히 짐작하겠지만, 만약 NAS가 필요하다면 연결돼 있는 스토리지 가운데 특정 볼륨을 할당해 사용할 수 있다.
어코피아의 ‘ARX(Adaptive Resource Switch)’ 제품군은 넷앱이 놓친(혹은 그다지 관심을 두고 있지 않는) NAS 스토리지 및 파일 서버를 위한 스위치 기반 파일 스토리지 가상화 솔루션이다. 이 제품은 서로 다른 OS를 사용하는 이기종 파일 스토리지라 할 지라도 하나의 거대한 파일 스토리지로 보여주는 가상화를 바탕으로, 데이터 마이그레이션, 로컬 복제, 그리고 원격지 복제 기능을 지원한다.
다수의 파일서버나 NAS 엔진을 운용하는 미디어 콘텐츠 서비스 업체, 인터넷 포털이나 웹하드 서비스 업체, 그리고 부서 단위의 소규모 스토리지의 통합 관리에 현실적인 어려움을 갖고 있는 기업들도 다수의 파일서버와 DAS, NAS 스토리지들을 저렴하고 손쉬운 방법으로 통합하고, 다양하고 지능적인 스토리지 관리기능을 부여할 수 있게 된 것이다. 어코피아의 국내 총판을 맡고 있는 인포큐브는 유관 파트너사들과의 긴밀한 협력체제를 바탕으로 니치 마켓(Niche Market)을 집중 공략할 계획이다.

2005년은 스토리지 가상화 시장 ‘전환점’
지난해에 이어 올해에도 D2D, SMB, ILM, IP SAN과 함께 전 세계 스토리지 시장의 키워드로 지목된 ‘스토리지 가상화’는 총소유비용(TCO) 절감과 빠른 투자회수율(ROI)이라는 시대적 요구에 정확히 부합하는 기술임에는 틀림없다. 그러나 아직까지 그 다음 단계에 대해서는 의견을 조율하지 못하고 있는 실정이다.
현재의 어플라이언스형 스토리지 가상화 솔루션에 스토리지 자원 관리(SRM) 기능을 추가해 관리적 이점을 더욱 부각시키는 게 나은지, EMC처럼 가상화 기능을 구현하는 인텔리전트 스위치에 그 역할을 넘기는 것이 나은지, HDS처럼 컨트롤러에서 가상화 기능까지 도맡아 처리하는 것이 나은지, 그것도 아니면 더 이상의 기능 추가보다는 현재 시중에 나와 있는 SMS(System Management System) 툴과의 연동을 시도하는 것이 차라리 적절한지 업체들마다 의견이 분분하다.
다만 한 가지 공통된 목소리는 스토리지 가상화 기술이 스토리지 환경을 복잡하게 만드는 또 다른 요인이 되어서는 안된다는 것이다. 각 업체 관계자마다 SRM 기능을 추가하든, 스위치 제품에 역할을 넘기든, 스토리지 컨트롤러에 병합되든, SMS 툴에 통합시키든 사용자 편의성을 우선 순위로 두고 발전 방향을 모색하겠다는 뜻을 전했다.
분명 올해는 ‘스토리지 가상화’ 시장의 새로운 전환점이 될 것이다. 이미 HDS, EMC와 같은 든든한 원군을 만났고, 파이버 채널 스위치 업체들의 전폭적인 지지도 얻은 데다가, 그 동안 소외돼 있던 NAS 및 파일 스토리지에 대한 가상화 솔루션도 시중에 모습을 드러냈다. 여기에 아직 시장에 진입하지 않은 나머지 대형 스토리지 벤더들도 올해 안에는 신제품을 선보일 예정이어서, 1∼2년 전처럼 신생 업체들이 시장을 모두 석권하는 일은 없을 것으로 보인다. 바야흐로 스토리지 가상화 시장에도 그토록 학수고대하던 ‘봄날’이 찾아온 것이다.
 
 
PART Ⅲ

시스템 운영·관리 비용 절감에 ‘탁월’ … 물리적 자원 넘어 모든 IT 자원 가상화로 발전

“스토리지 가상화로 역동적 비즈니스 요구에 탄력적으로 대응하자”


가상화는 컴퓨팅 파워, 스토리지 용량, 데이터 및 기타 IT 자원들에 대한 논리적인 뷰(View)를 제공하는 동시에, 이러한 자원들의 관리를 자동적으로 수행하는 것을 말한다. 이것은 복잡한 이기종 시스템들이 존재해도 하나의 단일한 시스템을 관리하는 것처럼, 전체 인프라가 하나의 관리 화면 안에서 마치 계기판을 통해 조정이 되는 것과 같은 관리 편의성을 제공해준다.
| 김상현 한국IBM 스토리지사업본부 과장·kshyeon@kr.ibm.com |


가상화 기능은 네트워크상에서 데이터가 어느 곳에 있더라도 가용한 자원에 대해 쉽게 접근할 수 있고 하나의 통합된 관점을 제공한다. 최근에는 하드웨어 자원의 가상화를 넘어서 데이터와 애플리케이션에 대한 가상화에 대한 요구가 더욱 높아지고 있다.
기업은 가상화를 통해 데이터의 접근을 단 한번에 수행하고 비즈니스의 수행에 필요한 역동적인 요구사항들에 빠르게 대응할 수 있는 애플리케이션을 제공할 수 있게 된다. 또한 시스템 운영 및 관리 비용은 물론 IT 인프라의 총소유비용(TCO)을 낮추면서도 동시에 필요한 시스템 용량을 유지할 수 있게 된다.
이를 위한 스토리지 가상화 솔루션의 경우, 여러 업체에서 다양한 솔루션들을 속속 출시하고 있는데, 기술적인 방향이나 구현 방식은 상이한 편이지만 ‘가상화의 대상’이라는 관점에서 보면 블록 레벨의 이기종 스토리지 장치를 논리적으로 가상화해 통합하는 방식과 파일 시스템 레벨에서 데이터를 가상화해 SAN 상에서 이기종 서버들이 동일한 데이터를 공유하는 방식으로 크게 구분할 수 있다.

블록 레벨 가상화 활용 방안
정보 가치의 제고 및 정보량의 폭증은 IT 발전과도 그 맥을 함께 한다고 할 수 있다. 산업의 전산화 및 자동화를 통해 정보의 흐름과 의사 결정 속도가 빨라졌으며, 그 근저에는 서버와 스토리지 장비들이 중요한 축을 이루고 있다. 그러나 벤더와 장치의 다양성으로 인해 관리의 어려움이 증대되고 있으며, 장비 간의 호환성 결여로 인해 변화에의 적응에 필수적이라 할 수 있는 구성의 유연성에 많은 문제를 지니게 됐다. 이러한 문제를 해결하기 위한 가상화 방안 중의 하나로 블록 레벨의 가상화 활용 방안이 제시되고 있다.
한 예로, IBM은 이러한 문제를 해결하고자 기존 인프라의 활용을 극대화하면서 구성의 유연성을 제고할 수 있는 SVC(SAN Volume Controller)를 솔루션으로 제시하고 있다. IBM에 따르면 SVC가 통제하는 모든 디스크는 물리적인 장치의 한계를 벗어나 단일 디스크 스토리지처럼 사용될 수 있으며, 서버나 사용자는 SVC와 연결돼 있는 모든 디스크 스토리지 장비를 하나의 디스크 풀(Pool)로서 인식하게 된다. 이를 가능하게 함으로써 기존에는 구현할 수 없었던 여러 가지 새로운 솔루션의 구현이 가능해진다. 그 구체적인 활용 방안을 다음 다섯 가지로 살펴보겠다.

스토리지 풀링(Pooling)
가상화 솔루션은 SAN에 접속된 이기종 스토리지를 통합해 관리의 용이성과 스토리지 활용도를 향상시키는 효과를 제공한다. 서버는 각 스토리지 장비별 LUN이 아닌 가상 LUN에 접근하며, 가상 LUN은 SAN에 연결된 스토리지 장비 전체의 풀(pool)에서 구성된다.
예를 들어, IBM의 SVC 솔루션의 경우, IBM 전 디스크 기종은 물론 EMC, HDS 등 주요 업체의 디스크들에 대한 가상화 환경을 제공해 이기종 환경에서 유연한 가상화 환경 구축이 가능하다.

디스크 장비간 순간 복제
데이터 백업이나 테스트 DB 형성 등의 용도로 활용되는 순간 복제 솔루션은 그 동안은 스토리지 장치의 물리적 한계를 벗어날 수 없었다. 즉 단일 장비 안에서만 가능했지만, 가상화 솔루션을 이용하면, 서로 다른 장비간에 순간 복제 솔루션 구현이 가능해져 시스템 구축의 유연성 및 비용 절감 효과를 기대할 수 있다.

사용자 삽입 이미지
이기종 디스크 장비간 원격지 복제
재해 복구 솔루션으로 주로 사용되는 원격지 복제 솔루션은 기존의 경우 동일 장비 사이에서만 구현이 가능했다. 따라서 원격지 상에도 고가의 디스크 장비를 구매해야 한다거나, 구형 장비를 계속해서 활용해야 하는 어려움이 있었다.
IBM의 경우, 이러한 문제를 SVC를 이용해 해결하고 있는데, 서로 다른 이기종 장비 사이에도 원격지 복제 솔루션 구현이 가능하다. 따라서 원격지에 보다 저렴한 디스크 장비로 재해 복구 환경을 구성할 수 있게 됐으며, 특정 벤더 제품에 종속되는 현상도 없어지게 돼 고객은 비용 절감 효과 및 보다 유연한 IT 구성을 갖출 수 있게 됐다.
온라인 데이터 마이그레이션
가상화 솔루션을 사용하면, IT 관리자는 스토리지를 오프라인으로 설정할 필요 없이 하나의 장치에서 다른 장치로 데이터를 가진 볼륨을 마이그레이션할 수 있다. 또한, 애플리케이션에 영향을 주지 않으면서도 스토리지 용량을 보다 효율적으로 할당 및 확장, 업그레이드 및 백업이 가능하다.

중앙 집중화된 볼륨 관리 및 제어
가상화 솔루션은 IT 관리자가 SAN에서 스토리지 볼륨을 관리하는데 도움을 주도록 설계되고 있다. 이는 다수의 이기종 스토리지 컨트롤러에 산재된 볼륨들을 단일한 창으로 관리할 수 있도록 해주며, 다른 벤더사의 스토리지 컨트롤러를 포함한 여러 스토리지 컨트롤러의 용량을 하나의 리소스로 결합할 수 있도록 지원한다. 예를 들어, IBM의 토털스토리지 프로덕티비티 센터는 웹 기반의 GUI 환경에서 디스크 및 SAN, 데이터에 대한 통합 관리 기능을 제공해 전산센터 수준의 관리 능력을 제공한다.

파일 시스템 가상화 활용 방안
현재의 SAN 환경에서는 각각의 애플리케이션 서버 별로 별도의 파일 시스템이 존재하게 된다. 이에 따라 다음에 나열한 필연적인 요구사항에 직면하게 된다. 이 같은 어려움들은 단지 전산환경의 어려움만으로 그치지 않고, 비즈니스 효율성과 비즈니스 연속성에 영향을 주는 이슈가 돼 결과적으로 막대한 금전적인 손실까지도 불러일으키게 된다.

- 파일과 데이터베이스 관리를 위해 일관된 방법론의 적용
- 애플리케이션 가용성에 영향을 주지 않는 스토리지나 서버 구성의 변경
- 서버간의 실 데이터 이동 없이 애플리케이션간 데이터 공유
- 다수의 중복 파일 생성 방지
- SAN 네트워크를 통한 파일 및 데이터베이스 활용도의 극대화

이와 같은 이슈가 발생하는 보다 근본적인 원인을 살펴보면, 현재의 파일 시스템들이 SAN 을 이용하고 있으면서도 SAN 자체의 이점을 완벽하게 활용하지 못하는 것에 기인한다고 할 수 있다. RM 해결을 위한 대안으로 제시되는 것이 SAN 파일 시스템이다. 현재의 환경에 SAN 파일 시스템을 도입하게 될 경우 다음과 같은 장점들을 기대할 수 있다.

- 데이터의 서버 종속성 제거에 따른 애플리케이션과 서버의 유연성 증대
- 단일화, 자동화된 정책 관리(Policy Management)에 의한 데이터와 스토리지 관리의 용이
- SAN을 통한 데이터 공유로 대형(Large scale) 파일공유 및 높은 성능 보장

사용자 삽입 이미지

SAN 파일 시스템 아키텍처
SAN에 연결된 외장형 공유 스토리지들은 스토리지 풀로 구성돼, 일종의 SAN 파일 시스템 공유 컨트롤러라고 할 수 있는 메타데이터 서버에서 관리된다. 이 메타데이터 서버들은 데이터의 록킹(Locking) 정보 등으로 구성된 메타데이터를 관리하며, 고가용성을 위해 클러스터 솔루션으로 보호된다.
한편 각 클라이언트 서버들은 SAN 파일 시스템 공유를 위해 기존의 NFS나 CIFS가 아닌 새로운 가상 파일 시스템(Virtual File System)을 사용하게 된다. 따라서 I/O 발생시 실제 사용자 데이터는 고속의 SAN망을 통해 전달되고 관리를 위한 소량의 메타데이터만이 IP 네트워크로 이동해 고성능의 SAN의 이점을 그대로 활용할 수 있게 됐다.

SAN 파일 시스템 5가지 활용 방안
1. 스토리지 풀 관리

SAN 파일 시스템은 공유 스토리지들을 과거와 같이 특정 서버에 종속시키지 않고, 비즈니스의 필요성에 따른 스토리지 풀로 관리한다. 즉, 스토리지의 물리적인 종속성을 제거함으로써 백엔드 스토리지의 하드웨어 추가나 제거에 따른 서버 애플리케이션, 즉 비즈니스의 영향을 없앨 수 있게 됐다. 또한 다수의 스토리지들을 풀로 관리함으로써, 스토리지별 용량 활용(Capacity Utilization)도 향상시킬 수 있게 됐다.

2. 단일 지점 관리(글로벌 네임 스페이스 사용)
SAN 파일 시스템은 이러한 스토리지 풀 위에 하나의 커먼 네임 스페이스(Common Name Space), 즉 모든 클라이언트 시스템들과 애플리케이션이 사용할 수 있는 하나의 파일 스트럭처를 만든다. 이들은 각 클라이언트 서버에서 일반적인 마운트 포인트(Mount point)를 가진 파일 시스템(ex: /SFS) 또는 윈도의 특정 드라이브(ex: F:)로 인식된다.
이처럼 글로벌 네임 스페이스(Global Name Space)를 사용함으로써 얻게 되는 가장 큰 장점은 단일 지점 관리(One-Point Administration)를 가능하게 한다는 것이다. 갈수록 복잡해져 가는 전산환경에서 수십, 수백의 서버와 스토리지를 관리해야 하는 IT 관리자에게 그 무엇보다 가장 중요하고 어려운 문제는 바로 일원화된 관리이다.
이러한 관점에 볼 때 SAN 파일 시스템의 단일 네임 스페이스 관리 및 효율적인 용량할당(Capacity Quota) 관리 기능은 데이터 공유의 필요성이 없는 환경이라고 하더라도 SAN 파일 시스템 도입을 고려할 만한 충분한 이유가 된다.

3. 정책에 의한 파일 관리
IT 환경의 혁명적인 변화를 나타내는 또 다른 키워드가 바로 자동화와 자율(Autonomy)이다. 이 중 자동화의 좋은 예라고 할 수 있는 것이 바로 SAN 파일 시스템의 파일 관리방법이다. 이제는 더 이상 사용자가 어느 물리적인 공간에 파일을 저장할 것인지를 고민할 필요가 없게 됐다. 사용자가 파일을 저장한 가상 공간과는 별도로, 실제 파일은 관리자가 정해놓은 정책에 따라 비즈니스 요구에 맞는 스토리지 풀에 저장된다. 이와 같은 정책들은 파일명, 확장자명 등은 물론 파일 생성일, 유닉스의 그룹 ID에 이르기까지 다양한 조건들을 만들 수 있다.

4. 다이렉트 I/O 및 플래시카피 기능
그간 데이터베이스를 사용하는 사용자들은 로(Raw) 디바이스 볼륨의 우수한 성능과 파일 시스템의 용이한 관리 장점 사이에서 계속 고민해 온 것이 사실이다. SAN 파일 시스템은 자체의 ‘다이렉트 I/O’ 기능을 통해, 파일 시스템이 주는 관리의 장점을 유지하면서도 데이터베이스 I/O 시 일반 파일 시스템이 주는 오버헤드 자체를 바이패스(Bypass)하게 해줌으로써 로 디바이스 볼륨의 성능을 보여준다.
그 뿐 아니라 SAN 파일 시스템의 플래시카피 기능을 이용하면 하나의 파일 세트에서 최대 36개까지의 시점 이미지를 순간 복제할 수 있다. 더군다나 이와 같은 시점 이미지들은 일반적인 스토리지 볼륨 카피와 달리 원본과 동일한 용량을 차지하지 않고, 다음과 같이 극히 일부의 공간만이 사용되므로, 비용 효율 측면에서도 매우 훌륭한 솔루션이라고 할 수 있다.
이렇게 만들어진 이미지들은 테이프 백업 용도로도 사용될 수 있을 뿐 아니라, 액티브 이미지(소스 볼륨)에서 복제된 이미지 시점으로의 복귀가 간단한 조작만으로 언제든지 가능하므로, 각종 프로젝트의 형상 관리 목적으로도 충분히 사용될 수 있다.

사용자 삽입 이미지
5. 데이터 관리
앞서 플래시카피 이미지를 이용한 백업을 잠시 설명했지만, SAN 파일 시스템은 동일한 네임 스페이스를 공유하므로 과거와 같이 서버당 별도의 백업 에이전트 모듈을 운용할 필요가 없다. 즉 단 하나의 백업 서버만으로도 모든 데이터 백업 및 복구 작업들을 처리할 수 있으며, 이는 바이러스 스캐닝 등 모든 데이터 관리 활동의 경우에 동일하게 적용 가능하다.

가상화 발전 단계
20세기 말부터 많은 기업들은 클라이언트/서버 환경과 같은 분산 컴퓨팅의 이점을 누리면서도, 그러한 분산 환경에 의해 야기된 관리의 어려움과 위험 요소의 증가에 수반되는 부수적인 비용의 발생을 줄이기 위해 많은 노력을 기울여 왔다. 많은 기업들이 최근 이러한 분산 자원의 통합을 위한 핵심 기술로 가상화 기술의 중요성을 인식하게 됐다. 즉, 온 디맨드 전산 환경에서 자원의 사용률을 높이고 총소유비용(TCO)을 줄이기 위해 가상화 기술은 필수적이라는 것이다.
그렇다면 가상화 기술의 현재와 미래는 어떤 모습일까? 전산 환경의 가상화 단계는 <그림 4>와 같이 단순화 및 최적화(Simplify & Optimize), 허용(Enable), 가상화된 서비스(Virtualized Services), 온 디맨드 운영 환경(On Demand Operating Environment)으로 발전해 나갈 것으로 예측되고 있다.
가상화 기술의 현 단계는 초기 단계인 단순화 및 최적화 수준이라고 볼 수 있는데, 대부분 기업에서 서버와 스토리지 박스의 개수를 줄이고, 자원의 사용률과 효율 수준을 개선하고, 각종 자원을 가상적으로 묶어 큰 풀(Pool)을 형성하고, 자원이 동적으로 추가, 삭제, 변경될 수 있고 애플리케이션에 할당 및 반환될 수 있는 기본 인프라를 구축해 가상화를 시작하는 것이다.
실제로 현재의 가상화 기술은 대부분이 물리적 자원의 가상화에 관한 것이다. 즉, 프로세서, 메모리, I/O 어댑터, 네트워크, 디스크 드라이브, I/O 서브시스템, 스토리지 컨트롤러, 그리고 서버 등을 하드웨어 혹은 소프트웨어적인 기법으로 가상적으로 통합하고 공유함으로써 원래의 물리적 자원과 동등하거나 심지어는 더 향상된 기능을 가지는 가상 자원에 대한 구조적인 인터페이스(Architected Interface)를 제공하는 것들이다.
한편, 미래의 가상화 기술은 단순히 물리적 자원을 가상화하는 것이 아니라, 네트워크 상에 분산된 이기종 환경의 모든 IT 자원을 공개 표준에 의거해 ‘가상화된 자원’으로서 정의하고 조작하는 것을 목표로 한다. 즉, 예를 들어 OGSA와 같은 공개 표준 서비스 기반에서 가상화된 자원을 서비스처럼 운영하게 된다.
 
PART Ⅳ

고성능 ASIC·SAN 라우팅 결합으로 미래형 스토리지 가상화 ‘제시’

표준 패브릭 중심 스토리지 관리 방안 실현 … 가속형 서버리스 백업 등 활용 방안 ‘다양’



스토리지 가상화는 스토리지 어레이에서 서버로, 그리고 또 어플라이언스의 형태로 다양하게 구현돼 왔지만, 솔루션이 탑재되는 위치에서 바로 해당 솔루션의 특징과 한계가 일정량 규정지어져 버리는 특성 때문에, 고객의 환경이나 의도와는 조금 이질감이 있었던 것이 사실이다. 그러한 움직임 속에서도 최근 몇 년간 가장 주목받았던 영역이라면 역시 네트워크 기반의 가상화 솔루션일 것이다.
| 김민세 시스코시스템즈코리아 차장·mskim@cisco.com |

가상화 기술은 스토리지 관리 기술의 만병통치약처럼 불렸던 것이 사실이나, 그러면서도 마치 영원히 늙지 않게 해준다는 불로초처럼 찾기도 어렵고, 고객의 환경이나 요구에 맞출 정도로 기술이 성숙되기까지는 언제까지나 향후의 이야기처럼 생각됐다.
스토리지 업체들이 가진 기술 중에서도 핵심적인 소프트웨어 영역으로 구분되던 가상화 기술은 그동안 스토리지 자체를 코어 비즈니스로 가지고 있지 않은 일부 중소 ISV들의 영역에서만 머물러 있었다. 그러나 스토리지의 기가바이트당 단가 하락과 같은 하드웨어 수익구조의 변화는 더 이상 스토리지 벤더들을 특정벤더에 국한된 범위에 머물게 하지 않았다.
주요 스토리지 벤더들은 예전처럼 자사의 스토리지 하드웨어 판매기반을 대상으로 추가의 소프트웨어나 솔루션을 제공하는 것이 아니라, 적극적으로 상대방의 영역으로 파고 들어가 이기종 인프라를 대상으로 한 광범위한 스토리지 관리 솔루션으로써 스토리지 가상화 솔루션을 개별적인 주력 제품의 하나로 내놓기 시작했다.

네트워크 기반 스토리지 가상화 등장 배경
서버나 스토리지에 별도의 소프트웨어나 에어전트를 탑재하지 않는다는 유연성, ASIC 기반의 전용 네트워크 프로세서를 사용함으로써 얻어지는 방대한 처리성능, 여기에 표준화와 대형 벤더의 지원까지 더해진 지금, 2005년도의 새로운 트렌드로써 네트워크 기반 가상화는 가장 각광받는 기술이 될 것으로 예측된다.
기술이 진보하면서 다양한 상위 계층의 기술을 통합하는 추세는 기가비트 이더넷 등의 데이터 네트워크 분야에서 익히 봐왔던 흐름으로, SAN 영역에서도 자연스럽게 상위계층의 기술을 수용하는 형태로, SAN 기반의 스토리지 관리기술의 등장이 예상됐다. 시스코는 처음 SAN 시장에 소개됐던 2002년 여름부터, 줄기차게 멀티레이어 인텔리전트 스토리지 플랫폼으로써의 SAN 스위치를 주장해온 업체이기도 하다.
파이버채널, IP 등의 순수 전송영역에서의 계층, 가상 패브릭 등의 표준 SAN 기술과 강력한 보안, 트래픽 관리와 분석툴들이 제공되는 지능형 네트워크 계층, 그리고 그 상위 계층에 바로 볼륨관리나 데이터 이전, 복제 등을 수행하는 지능형 스토리지 서비스 계층이 위치하게 되며, 이것이 바로 네트워크 기반의 가상화가 탑재되는 계층이다. 이를 항만의 물류시스템에 비유를 해보면, 전송계층을 항만 시설에, 네트워크 계층은 항만 운영 시스템에, 스토리지 서비스 계층은 실제 물류관리 시스템이라고 말할 수 있을 것이다.
네트워크 기반의 스토리지 관리 방법을 좀 더 자세히 알아보자. SAN의 구조를 살펴보면, SAN을 중심으로 스토리지 관련 장치가 모두 직접 연결되는 것을 알 수 있다. 외장형 스토리지와 서버와 같은 장치들은 SAN을 통해 서로를 인식하고, 대화한다. 이러한 스토리지와 서버간의 대화는 SCSI라는 표준 스토리지 언어체계를 사용하고, SCSI 단독으로는 고립된 데이지체인(daisy chain)에 불과했다. 파이버 채널 기술은 이 SCSI에 주소 체계를 부여하고 스토리지에 네트워크 개념을 도입, 자원공유가 가능한 SAN 네트워크가 등장하게 됐다.
그러나 여기에서 사용되는 SAN 스위치 자체가 SCSI 명령의 고속 전달자 역할에만 머무름으로써, 여전히 스토리지의 인텔리전스는 디스크측이나 서버측에서만 존재하게 되는 한계를 드러냈다. SAN 표준을 관리하는 ANSI 산하 T11에서는 SAN의 기능을 확대하고 새로운 역할을 부여할 수 있도록 FAIS(Fabric Application Interface Standard)라는 표준 언어체계를 만들고, 이를 통해 스토리지 관리 소프트웨어를 만드는 업체들이 SAN의 지능형 스위칭 하드웨어를 이용해 다양한 스토리지 관리 애플리케이션을 운영할 수 있도록 SAN의 역할을 확대, 진화시켰다.

네트워크 기반 가상화 탑재 플랫폼
네트워크 기반 가상화는 고성능의 ASIC과 높은 레벨의 스토리지 관리기술이 접목되는 영역으로, 모듈러 타입의 확장은 고객에게 당장 투자 결정을 서두르지 않아도 향상된 기술을 언제든 적용할 수 있게 해주는 전략적 유연성을 부여한다.
네트워크 기반 가상화 엔진은 FAIS를 통해 외부의 스토리지 관리 소프트웨어의 제어를 받아 지능형 패브릭을 완성하게 된다. 이때 데이터를 포워딩 및 고속의 SCSI 라우팅을 담당하는 가상화 ASIC을 DPC라고 부르며, 제어 소프트웨어가 구동되는 영역이 제어경로 프로세서(CPP)가 된다. 보통 DPC는 SAN 스위치 내부에 구현되지만, CPP의 영역은 벤더별로 내장형 타입을 지원하는 경우도 있고, 별도의 장비로 분리하는 방법으로 접근하는 경우도 있다.
CPP 분리형의 경우, 제어파트를 좀더 대형을 장비로 늘려 새로운 가상화 애플리케이션의 탑재를 용이하게 하거나, DPC만을 확장해서 가상화 스토리지의 전송성능을 늘리는 등 구현의 유연성을 제공한다. CPP 일체형 구조를 선택했다면, CPP 연결을 위한 SAN 포트 비용을 절감하고, HA 구현이 손쉬우며, 추가의 상면을 차지하지 않는 올-인-원(All-in-one) 구성이 가능하다.
멀티 SAN 환경 하에서의 네트워크 기반 가상화
초기에 개별 업무별로 구축됐던 SAN은 그 나름대로의 장점을 지니고 있었지만, 스토리지 유휴 스페이스의 활용도 문제와 개별적인 관리로 인한 부담, 낭비되는 SAN 포트, 전체 시스템의 DR(Disaster Recovery)의 어려움 등 점차 다양한 단점을 드러냈다. 특히 늘어나는 개별 업무별로 산재돼 있는 SAN들에 대한 효율적으로 관리와 함께, 가상화의 범위를 전체 스토리지 영역으로 확장하고자 하는 기업들에게는 이러한 SAN 통합과 가상화 시스템의 적용이 하나의 공통 목표가 됐다.
이러한 배경으로 현재까지 여러 SAN 네트워크 기술들이 등장했다. 대표적인 것으로 표준인 가상 패브릭이나 SAN 라우팅 기술들이 그것이다. 공통적으로 하나의 관리 도메인에서 여러 개의 SAN 패브릭을 통합할 수 있도록 해주는 이 기술은 네트워크 기반 가상화를 통해 그 가치를 더욱 높일 수 있다.
SAN 라우팅 기법에는 인-밴드(In-band) 타입의 내장형과 아웃-오브-밴드(Out-of-Band) 타입의 외장형 라우팅의 2가지로 크게 나뉘는데, 시스코는 장비별로 이미 내장돼 있는 가상 패브릭 라우팅 기능을 통한 인밴드 타입을 적용하고 있다. 이는 외부에 별도의 장비나 라우팅을 거치지 않고도, ASIC에 내장된 하드웨어 기반의 주소변환 기능(FC-NAT)을 이용하므로, 토폴로지 및 구성이 간단하고 확장성이 뛰어나다. 또한 중복된 도메인 ID에 대해서도 라우팅을 제공하고 있다.
네트워크 기반 가상화에서도, 패브릭 다중화에 따른 하드웨어 라우팅은 큰 효과를 기대할 수 있다. 가상화된 볼륨과 실제의 물리적인 볼륨은 각기 다른 SAN 에 위치하게 되므로, 가상화 볼륨에 접근하는 어떠한 호스트나 서버들도 본래의 물리적인 스토리지로의 접근은 차단된다. 이를 통해 안정적인 네트워크 기반 가상화 솔루션을 운영, 관리할 수 있게 된다.
가상 패브릭이나 SAN 파티셔닝 기법은, 간혹 스토리지 가상화와 혼동되는 경우도 있는데, 전송계층 및 네트워크 계층에 적용되는 기술로서 여기에서 운용되는 스토리지 데이터 자체는 건드리지 않는다. 스토리지 가상화를 단일 SAN에 적용하기 위해서는 일반 싱글 SAN 환경 하에서 상위의 스토리지 관리 기술을 적용하고, 다중 SAN에 적용할 때에는 위에서 언급한 다중 SAN 통합기술을 적용하면 되는 것이다.
또한 이러한 네트워크 가상화는 확장되고 있는 SAN 의 영역을 따라 적용 범위를 늘리고 있는데, IP와 결합한 IP SAN으로의 확장은 네트워크 가상화를 통한 스토리지 관리 영역을 저렴한 비용의 장거리 전송이 가능한 왠(WAN)을 따라 적용할 수도 있게 됐다.

네트워크 기반 가상화의 다양한 이점
가속형 서버리스 백업 구현

SAN이 소개되면서 각광 받았던 랜(LAN)-프리 백업, 그리고 대용량 테이프 라이브러리의 자동화된 관리기능이 돋보였던 서버-프리 백업 등과 같이 백업 기술은 나날이 발전돼 왔다. 네트워크 기반 가상화 기능을 이용하면, 네트워크 기반의 백업 기법은 다시 한번 새로운 차원으로 진화하게 된다.
기존의 서버-프리 방식의 백업의 경우, 미디어 서버를 거쳐야만 백업 트래픽이 이동됐다. 때문에 미디어 서버의 처리능력이 곧, 시간당 백업 속도의 제약과도 같았다. 패브릭 기반 백업의 경우, ASIC 기반의 가상화 하드웨어를 통해 디스크-투-테이프의 I/O를 처리하므로, 기존 미디어 서버의 I/O 한계를 가볍게 뛰어넘는 백업 성능의 향상이 가능해진다.
가상화 구현시 네트워크 변경 최소화
네트워크 기반 가상화 모듈의 유연성은 이외에도 다양한 종류의 활용이 가능하다. SAN 탭(Tap)과 같은 기술은 기존 네트워크의 변경을 최소화한 상태로 좀 더 손쉬운 가상화 기법을 적용할 수 있도록 해준다. SAN 탭은 메인 경로상의 데이터의 복제본을 어플라이언스로 전달하는데, 서비스 데이터 이동 경로에서 지능형 SAN 하드웨어의 도움을 받게된다.
이를 통해 고객은 주된 I/O 데이터들의 정합성과 가용성을 유지한 상태에서, 서비스 방해요소 없이 유연하게 배치할 수 있다. SAN 탭은 일종의 시스코가 정의하고 만들어낸 FAIS 애플리케이션이라 할 수 있다.
이처럼 네트워크 기반 가상화는, 특정 벤더에 종속적이거나 서버 환경에 종속적이었던 과거를 탈피해서, 표준기반의 패브릭 중심 스토리지 관리를 처음으로 실현했다. 벤더별로 차별화되는 스토리지 관리 기술은, 그대로 이를 데이터 전송에 이용하는 전용 ASIC들을 통해 지원받을 수 있으며, 제어부와 전송부를 분리한 구조를 통해 고차원의 확장성을 제공할 수 있게 됐다. 앞으로는 더욱 더 이러한 SAN 중심의 스토리지 관리가 관심을 모을 것으로 예상되며, SAN 플랫폼 기반의 다양한 기술과 솔루션들이 등장할 것으로 예상되고 있다.
 
PART Ⅴ

“차세대 가상화 플랫폼은 네트워크형 스토리지 컨트롤러가 접수한다”

계층형 마이그레이션·종단간 보안 등 이점 ‘확실’… 이기종간 상호 운용성 확보 ‘한수위’



스토리지 가상화는 2005년 스토리지 업계의 가장 뜨거운 화두가 됐다. 관련업계는 앞다퉈 자사의 하드웨어 및 솔루션들을 출시하고 있으며, 각 사의 기술과 제품에 따른 가상화 정의와 해석도 조금씩 차이가 있다. 그러나 '복잡성을 줄여 관리 능력을 높여 준다'는 점에서 이들 각 스토리지 관련업계가 내놓는 가상화 제품들은 일맥 상통하다.
| 최민호 HDS코리아 부장·minho.choi@hds.com |


현재 국내외 대부분의 기업이 보유하고 있는 데이터 규모는 연간 60∼80% 비율로 증가하고 있다. 기업에 따라서는 매년 100% 이상의 증가세를 보이는 경우도 많다. 설상가상으로 새로운 첨단 기능을 갖춘 휴대형 RFID 지원 무선 장치들이 속속 개발됨에 따라 엄청난 양의 데이터가 발생하고 있다. 어떠한 산업 분야도 이와 같이 급속도로 증가하는 데이터 관리에 따른 어려움을 피할 수 없는 실정이다.
데이터의 급격한 양적 증가는 기존 스토리지 도메인 인프라 뿐 아니라 이를 관리하고 있는 관리자들에게 심각한 부담을 안겨주고 있다. 과연 어떻게 하면 이 엄청난 데이터들을 복잡하지 않고 저렴하게 인공지능적으로 관리할 것인가? 이런 고민에 대한 화답으로 등장한 스토리지 가상화는 현재 서로 다른 4가지 관점에서 접근하고 있다.
호스트 기반 가상화와 네트워크(어플라이언스 또는 스위치를 통해) 기반 가상화, 컨트롤러 또는 스토리지 컨트롤러 기반의 가상화 플랫폼이 바로 그것이다. 이들 접근방법은 모두 장단점을 갖고 있다. 각 기업이 갖고 있는 데이터의 규모나 특성, IT 예산에 따라 네트워크 기반 가상화가 적합할 수도 있고 컨트롤러 기반 가상화가 가장 바람직할 수도 있다. 이를 판단하는 것은 각 솔루션과 하드웨어를 제공하는 IT 벤더들이 아닌 각 기업의 IT 담당자들이다. 여기에서는 각 접근방법의 특징을 간략히 파악하고 특히 스토리지 컨트롤러에 기반한 가상화 플랫폼에는 어떤 장단점이 있는지 확인해보도록 하겠다.

스토리지 가상화의 4가지 접근방법
호스트 기반 가상화

호스트에서 스토리지 가상화는 이미 일반적인 것이다. 처음에는 호스트 기반 가상화가 물리적 타깃에서의 ‘볼륨’에 대한 애플리케이션 뷰를 추상화하고, 호스트 인터페이스가 본 LUN 주소 지정을 합한 것이었다. 이러한 유형의 가상화는 볼륨 매니저로 알려져 있는 소프트웨어에 의해 제공된다. 볼륨 매니저 공급업체들이 스냅샷, 미러링 및 복제와 같은 추가 기능들을 추가한 것도 같은 맥락에서다.
볼륨 매니저는 원래 직접 부착식을 사용하던 시기에 개발된 것으로 SAN을 인식하지는 못했다. 복제와 같은 일부 기능들이 이기종 장치간에 완료될 수 있었지만, 일반적으로 가상 볼륨은 볼륨 당 한가지 유형의 스토리지로 제한됐다. 호스트 기반 가상화의 단점은 호스트 주기가 필요하고 볼륨 매니저가 상주하는 호스트로 제한된다는 점이다. 또한 볼륨 매니저는 호스트 플랫폼에만 특정한 것이고 종종 호스트 소프트웨어에 포함된다.

사용자 삽입 이미지
네트워크 기반 가상화
지난 4∼5년간에 걸쳐 시장에는 수많은 SAN 기반 가상화 제품들이 쏟아져 나왔다. 인-밴드(in-band) 어플라이언스 대 아웃-오브-밴드(out-of-band) 어플라이언스 또는 지능형 스위치 블레이드에 대한 논쟁이 뜨거운 열기를 띠며 벌어져 왔다.
하지만 이런 논쟁을 통해 복잡한 문제가 해결되기는커녕 스토리지 네트워크의 코어에 또 다른 복잡한 문제를 추가했을 뿐이었다. 스토리지 컨트롤러에 의해 네트워크의 에지에서 완성됐던 기능은 SAN의 코어에서 구현하기 위해 다시 개발됐다. 이 기능의 오버헤드에서 결과적으로 발생되는 대기 시간은 SAN에 연결돼 있는 모든 이가 느끼는 것이다.
SAN에서는 인텔리전스가 중요하다. 하지만 인텔리전스는 올바른 정보에 액세스할 때만 유용한 것이 될 수 있다. 네트워크의 코어에 상주하는 어플라이언스 또는 스위치 블레이드는 호스트 애플리케이션의 I/O 여부나 스토리지 시스템에서 데이터의 배치에 대한 정보는 갖고 있지 않는다. 이 정보는 원래 I/O 요청의 무결성에 위배되는 I/O를 인터셉트 및 리디렉션해 얻는다.
하지만 이 정보는 호스트 I/O를 수신하기로 돼 있는 스토리지 컨트롤러에 직접 사용할 수 있다. 또한 IPSec 및 ESP와 같은 종단간 보안 프로토콜은 종점들(호스트와 스토리지) 사이에서 프록시(가상화 인텔리전스)를 허용하지 않는다.

컨트롤러 기반 가상화
일부 스토리지 관련업체의 경우 논리적 단위로 어셈블링될 수 있는 독점적인 블록 풀을 제공하는 인박스(스토리지 내) 솔루션을 출시했다. 인박스 솔루션은 구성의 편의성 면에서 몇 가지 장점을 가지지만, 스토리지의 다중 계층 풀은 제공하지 않고 무결성과 서비스 품질(QoS)에 새로운 당면 과제를 초래한다. 데이터 공간을 분할하는 것도 복잡성을 가중시킨다.
인박스 솔루션은 자체적인 주소 공간을 제어하는 데이터베이스와 같은 애플리케이션과는 원활하게 작동하지 않는다. SAN 기반 어플라이언스/스위치 또는 인박스 솔루션 중 어떤 접근 방식도 현재와 미래의 스토리지 증가세를 감당할 수 있는 확장성을 제공하지 못한다. 결과적으로, 수많은 스토리지 가상화 솔루션이 쏟아져 나왔지만 그들 중 어떤 것도 시장에서 확실한 우위를 점하지는 못했다고 할 수 있다.

컨트롤러 기반 외부 가상화 플랫폼
지능형 컨트롤러를 통한 방식이라 할 수 있다. 인-밴드 솔루션이냐 아웃-오브-밴드 솔루션이냐 또는 어플라이언스냐 지능형 스위치 블레이드냐 하는 논쟁이 어떤 점에서는 무의미하다고 할 수 있는 스토리지 가상화 방식이다. 이 경우 SAN에서 제공되는 연결 기능을 이용하지만 직접 부착식 개방형 시스템과 메인프레임 호스트도 지원한다.
지능형 스토리지 컨트롤러로서, 이 방식을 도입한 스토리지 가상화 제품의 경우 I/O의 시작 지점과 목적 지점에 관한 정보에 직접 액세스한다. 따라서 네트워크의 에지에 상주하는 스토리지 및 데이터 가상화를 지원하기에 최적의 입지를 갖추고 있다고 볼 수 있다. 이런 접근 방식은 자원 집약적인 기능이 속하는 네트워크의 에지에 대한 미러링 및 복제와 같이 이런 기능들을 오프로드한다. 또한 네트워크 기반 접근 방식에서 발생하는 문제로서 네트워크를 통해 라우팅되는 모든 I/O에 대한 대기 시간이 추가되지 않도록 해준다.
이 방식을 도입한 경우 호스트 포트와 함께 크기의 차수에 의해 호스트 연결을 늘리지만, 그것은 지능형 스위치를 대체하는 것이 아니다. 지능형 스위치는 SAN의 라우팅과 관리에 가장 적합하다. 지능형 스위치는 라우팅 정보를 처리하고 네트워크의 상태와 성능을 모니터링해 크레딧 버퍼 정체 해결 및 회복성을 위한 가상 SAN과 같은 귀중한 서비스를 제공한다.

차세대 플랫폼 논쟁
IT 시장조사 기관인 IDC의 자료에 의하면 이런 스토리지 가상화 방식들의 장단점을 망라해 제시하는 차세대 플랫폼으로 네트워크형 스토리지 컨트롤러가 등장할 것이라고 제안하고 있다.
계층 스토리지 아키텍처를 관리하기 위한 가장 새로운 옵션이라고 IDC가 지칭하는 네트워크형 스토리지 컨트롤러(NSC)는 고객이 스토리지를 구매하고 배치하는 방식을 상당히 바꿔 놓을 가능성이 있는 새로운 범주라 할 수 있다. 여하튼 이 차세대 플랫폼은 IDC가 세부적으로 그 동향을 추적하고 있는 하드웨어 및 소프트웨어 요소를 모두 가진 중요한 시장이라는 점에서 향후 스토리지 가상화의 발전적인 진화 방향으로 염두에 둘 필요가 있다.

사용자 삽입 이미지
컨트롤러 기반 스토리지 가상화의 이점
SNIA(Stotage Networking Industry Association)의 사전에 따르면 가상화가 ‘유용한 추상화를 제공할 목적으로 추가적인 (프론트엔드) 기능을 이용해 하나 이상의 (백엔드) 서비스나 기능을 통합하는 행위로서, 일반적으로 가상화는 백엔드 복잡성의 일부를 숨기거나 새로운 기능을 추가하거나 기존의 백엔드 서비스와 새로운 기능을 통합하는 것’이라고 정의했다.
가상화는 복잡성을 감추고, 새로운 기능을 지원하고, 성능, 연결 능력, 용량 및 가용성을 향상시키기 위해 다년간 사용돼 온 기법이다. 가상화는 하나의 물리적 서버가 여러 개의 논리적 서버로 나타나도록 만들기 위해 서버에서 사용돼 왔다. RAID는 가용성과 성능을 높이기 위해 디스크 스토리지 시스템에서 사용되는 가상화 기법이다. 가상 근거리 통신망(VLAN) 그리고 보다 최근의 기술로는 가상 스토리지 영역 네트워크(VSAN)가 도입돼 IP 및 파이버 채널 네트워크에서의 보안성과 가용성이 향상됐다.
스토리지 관리 부문에서 ‘성배’처럼 떠받들어지는 것이 바로 스토리지 가상화였다. SAN의 채택 비율이 늘어나면서, 많은 공급업체가 SAN에 어플라이언스 또는 스위치 블레이드로 상주하는 스토리지 가상화 솔루션들을 선보였다. 이런 솔루션들은 고객이 비용을 절감하는 동시에 가속화되고 있는 스토리지 용량에 대한 수요와 점점 복잡해지고 있는 스토리지 인프라에 잘 대응하는 데 도움을 주는 만병통치약과도 같은 것이었다.
하지만 지금까지 개발돼 시장에 선보인 스토리지 가상화 접근 방식과 제품들은 고객의 요구에 부응하지 못했다. 이런 솔루션들은 확장성과 견고성이 제한돼 있고 데이터 경로에 또 다른 복잡한 요소를 끌어들임으로써, 결과적으로는 네트워크 정체의 증가, 가용성 노출 증대, 비용 증가 등의 악영향을 초래한다.
2004년 하반기 이후 각 기업에서 도입돼 가상화 기능을 수행하기 시작한 컨트롤러 기반 스토리지 가상화 기법의 태그마 스토어 유니버셜 스토리지 플랫폼의 경우 도대체 어떤 유형의 스토리지를 가상화할 수 있는 것일까?
태그마 스토어 유니버설 스토리지 플랫폼의 경우는 거의 대다수의 스토리지 하드웨어 제품과 호환이 된다. EMC(시메트릭스 3000, 5000 및 8000 시리즈, DMX800, DMX1000, DMX2000 및 DMX3000, 클라리온 CX 시리즈)와 IBM(ESS 2105 시리즈 모델 F20, 750 및 800, DS4000 또는 FAStT), SUN(스토에지 9900 시리즈, T3B 및 6120) 및 HP(XP 시리즈)의 스토리지에 직접 연결될 수 있으며 다른 주요 스토리지 공급업체들과 협력해 상호 운용이 가능하다.
엔터프라이즈 기능을 지원하지 않는 외부 부착식 모듈형 스토리지 전반에 걸친 미러링, 복제 및 마이그레이션과 같은 엔터프라이즈 기능 매핑, 규정 준수와 함께 미드레인지에 속하는 고객들은 데이터 보호와 데이터 마이그레이션에 대해 기업 고객과 똑같은 요구 사항을 가지고 있다. 메인프레임이 SATA와 같은 저렴한 개방형 시스템 스토리지를 사용할 수 있도록 하고자 하는 것이다.
그런 점에서 컨트롤러 기반의 가상화는 다양한 장점을 갖고 있다. 계층형 스토리지 마이그레이션이 수월하고 감가상각이 되는 자산 전반에 걸쳐 새로운 기능을 매핑할 수 있다. 스토리지 자산의 할당과 재할당이 단순하며 스위치 기반 가상화와는 달리, 스토리지 컨트롤러 기반 가상화는 종단간 보안을 지원한다는 점에서 주목을 끈다. 애플리케이션과 스토리지 사이에 에이전트나 프록시가 없는 것도 장점이다.
가상화된 스토리지 풀에 대한 인터페이스로서 다른 공급업체의 스토리지 연결을 가능케 함으로써 기존 스토리지 인프라의 수명을 연장하므로, 고객들은 기존 스토리지 기술의 수명과 상관없이 오래 스토리지를 활용할 수 있다. 이런 스토리지는 비활성(또는 가끔 사용되는) 데이터를 저장하는 데 사용되거나 애플리케이션 개발과 같은 특정 작업에 할당될 수 있기 때문이다. 즉 기존 스토리지 장비의 ROI 기여도를 늘릴 수 있음을 의미한다.
소프트웨어 유지보수 갱신의 감소도 컨트롤러 기반 스토리지 가상화 방식의 중요한 장점이다. 고객은 기존 스토리지에 대한 데이터를 관리 및 복제, 이동하는 데 사용되는 소프트웨어에 계속 비용을 지불할 필요가 없다. 고객들은 새로운 컨트롤러 기반 스토리지 가상화 시스템의 솔루션을 사용해 가상화된 모든 스토리지를 식별 및 관리할 수 있다.

스토리지 가상화가 나아갈 길
이기종 스토리지를 가상화 풀로 지정해 스토리지 효율성을 극대화하고 관리의 편의성을 도모하며, 계층화된 스토리지 관리를 도모한다는 점에서 스토리지 가상화는 분명히 나아갈 방향이다. 그러나 이기종 스토리지를 지원한다는 점에서 항상 관련 기업들은 상호 운용성이라는 점에 초점을 맞춰야 한다. 자사의 방식만을 고집하는 것이 아닌, 상호 호환이 되도록 지원한다는 점에서 가상화는 각 기업들에 있어 또 다른 도전일 수 있다.
컨트롤러 기반의 가상화 솔루션을 내놓은 HDS의 경우 이 상호 운용성을 확보하기 위해 관련업계의 저항을 감수해야했다. 그러나 동종업계 종사자들로서 접근 방식과 전략을 진솔하게 받아들이면 상호 운용성을 확보하기 위해 협력하는 것이 득이 된다는 것을 서로 깨닫게 된다.
이런 깨달음의 과정을 통해 HDS의 태그마 스토어는 이미 대다수 주요 기업들의 스토리지와 상호 운용성을 확보했다. 이는 각 기업의 공통적인 문제, 즉 ‘고객’과 관련된 문제를 해결하는 것으로 윈도 서버나 베리타스 볼륨 매니저 뒤에 자사의 스토리지를 부착하는 것과 전혀 다르지 않기 때문이다.
 
PART Ⅵ

파일 스토리지 가상화 통해 효율적인 스토리지 자원 활용 ‘가능’

구조화되지 않은 데이터 관리 요구 급증 … 차세대 계층적 스토리지 구성 해법 제시



스토리지를 크게 SAN과 NAS로 나눌 수 있다는 이야기는 이제 진부한 사실이 돼버렸다. 데이터베이스를 사용하는데 SAN을 사용하고, 파일을 저장하는데 NAS 혹은 파일서버를 사용하는 게 정설이 된 시점에서, 이러한 SAN 혹은 NAS의 가상화 문제가 대두되기 시작한 것은 불과 얼마 되지 않은 것이 사실이다. 이 글에서는 이 중 NAS 혹은 파일서버의 가상화, 즉 구조화되지 않은 데이터에 대한 가상화에 대해서 다루고자 한다. | 박경순 어코피아네트웍스코리아 차장·kpark@acopia.com |


기업의 가장 중요한 재산을 논하자면 가장 먼저 떠오르는 것이 인적 재산이다. 경쟁사의 재원을 스카웃하기 위해 무수히 많은 공을 들이는 요즘 기업들을 보면, 가히 인적 재산은 그 기업의 생명과도 같은 중요한 재산임에 틀림없을 것이다.
이에 못지 않게 중요한 재산은 역시 기업의 모든 것이라고 할 수 있는 디지털화된 데이터다. 과거에는 서류더미로 이뤄져있으나 현대 기업들에서 과거의 서류더미는 이제 모두 디지털 정보가 돼 디스크나 테이프에 저장돼 보관되고 있다. 이러한 데이터를 보존하는 디스크는 그 규모가 점차 방대해져서 스토리지라고 부르는 대단위 디스크의 집합체에 보관되고 있다.

구조화되지 않은 데이터 관리의 필요성
오늘날 수많은 기업들이 직면한 해결하기 어려운 문제중의 하나는 정보의 양이 기하급수적으로 늘어남에 따라 저장 매체에 대한 투자와 이러한 데이터에 대한 관리와 분배 문제다. 구조화된 데이터(Structured Data)란 말 그대로 이미 정형화되고 구조화돼 어느 정도 관리가 가능한 데이터를 말한다. 대표적인 예가 데이터베이스라고 할 수 있을 것이다.
그렇다면 구조화되지 않은 데이터(Unstructured Data)란 단순히 데이터베이스화되지 않은 데이터를 말하는 것일까? 이는 훨씬 넓은 의미를 내포하고 있다. 단적으로 말하면 파일로 이뤄진 모든 데이터를 넓은 의미에서 모두 구조화되지 않은 데이터라고 할 수 있다. 단순히 파일서버 내의 각종 문서들, 오디오 및 비디오 등을 담고 있는 멀티미디어 데이터, 각종 규제로 인해 장기간 보관돼져야 하는 파일들, 직원들의 중요한 백업 데이터들을 모두 구조화되지 않은 데이터의 범주에 넣을 수 있다. 이러한 데이터를 구조화되지 않은 데이터라고 하는 이유는 관리하기가 만만치 않고 그 양이 워낙 엄청나기 때문이다.
실제로 기업내의 데이터 중에 구조화된 데이터와 구조화되지 않은 데이터의 비율을 보면 거의 2대 8의 비율로 구조화되지 않은 데이터의 비중이 훨씬 높다. 하지만 지금까지 대부분 데이터베이스화돼 있는 데이터의 중요함만이 강조된 나머지 그 이외의 데이터들에 대한 관리는 소홀해 왔던 것이 사실이다. 하지만 그렇다고 데이터베이스는 중요하고 파일데이터는 중요하지 않다고 말할 수 있을까?
파일 서버를 포함한 NAS 스토리지는 다수의 클라이언트가 1대 혹은 그 이상의 스토리지를 NFS(Network File System) 혹은 CIFS(Common Internet File System) 표준 프로토콜을 사용해 공유하기 때문에 데이터의 중복을 최대한 억제할 수 있다는 이유로 흔히 파일 데이터를 저장하는데 최적의 솔루션으로 각광받고 있다.
데이터가 증가함에 따라 기업은 IT예산을 할당해 계속 스토리지를 투입할 수밖에 없게 된다. 하지만 새로운 스토리지를 투입함에 따라 스토리지의 관리는 점차 복잡해지고, 서비스의 일시적인 중단을 야기시키며, 스토리지의 정확한 효율성을 파악하기가 점차 힘들어진다는 모순이 생기게 된다.
이로 인해 알게 모르게 불필요한 중복 투자가 일어나고 운영에 들어가는 비용, 즉 총소유비용(TCO)이 점차 높아지게 된다. 더 크게는 각종 스토리지의 구성 변경이 가져오는 서비스의 다운타임으로 인한 기회 손실 비용이 날로 높아져 가고 있다. 여기서는 이러한 구조화되지 않은 데이터, 즉 파일 데이터의 저장에 대한 문제점 및 그에 대한 해결 방안을 짚어 보자.

사용자 삽입 이미지
파일 스토리지의 과제
·장비 중심의 관리

NAS 스토리지나 파일 서버(이하 파일 스토리지)들은 각각 개별적으로 관리될 수밖에 없다. 즉, 세 대의 파일 스토리지가 존재하고 이를 연결하는 4대의 클라이언트가 존재한다면 그 4대의 클라이언트는 모두 각각 3대의 파일 스토리지를 마운트(mount)해야 한다. 또한 각각의 파일 스토리지는 해당 장비 한대에 그 확장성이 제한되게 된다. 이러한 제약성이 ‘스토리지 고립(Island of Storage)’ 현상을 야기시키게 된다. 그야말로 전혀 통합된 관리 방법이 없을 뿐만 아니라 관리의 복잡성 또한 증대된다.
이러한 스토리지간의 데이터 마이그레이션(data migration)이나 용량의 추가 등은 시스템의 다운타임을 가져 올 뿐만 아니라 클라이언트의 재구성을 요구할 수도 있다. 더군다나 그 스토리지들이 모두 다른 제조사의 제품이라면 어떨까? 아마도 이 글을 읽는 많은 분들이 그 관리의 어려움을 직접 체험하고 있을 것이다.

·제한된 확장성
장비 중심의 스토리지 고립 현상은 성능 및 용량에 있어서 확장성의 한계를 극명하게 갖고 있다. 하이엔드급 NAS 스토리지가 그 자체의 확장성이 뛰어나다고 해도 한계가 있을 수밖에 없으며 그 자체로 하나의 독립적인 스토리지일 수밖에 없다. 하지만 기업 내의 애플리케이션의 요구와 점차 글로벌화돼 가는 기업의 특성상 결국 그 한계에 직면하고 이를 극복하기 위해 고민하기까지는 장비를 도입하고 나서 그다지 오랜 시간이 걸리지 않는다.

·비효율적인 가용성
다양한 이기종 스토리지에 대한 통일화된 관리 방법이 없이는 전체 스토리지의 가용성이나 수요 예측을 한다는 것이 거의 불가능하다. 그럼에도 불구하고 통일된 관리 방법이 거의 전무하기 때문에 어쩔 수 없이 한 제조사의 장비만을 도입하는 경우도 발생할 수 있다.

파일 스토리지 가상화의 적용
파일 스토리지의 이러한 문제점을 극복하기 위해 등장한 것이 파일 스토리지 가상화 솔루션이다. 파일 스토리지 가상화 솔루션은 현재 크게 소프트웨어기반의 솔루션과 하드웨어 기반의 솔루션이 있는데 국내에는 하드웨어 기반의 솔루션을 중심으로 본격적으로 소개되고 있다. 대표적인 하드웨어 기반(스위치 기반)의 파일 스토리지 가상화 솔루션인 어코피아 네트웍스(Acopia Networks)의 ARX(Adaptive Resource Switch) 제품을 중심으로 파일 스토리지 가상화를 적용할 수 있는 분야를 몇 가지로 나눠 알아보기로 하자.

글로벌 네임 스페이스
글로벌 네임스페이스(Global Name Space)란, 예를 들어 10대의 서로 다른 OS를 사용하는 서로 다른 제조사의 파일 스토리지가 있다면 이것을 마치 1대의 거대한 파일 스토리지가 있는 것처럼 클라이언트에게 보여주는 기능을 말한다. 클라이언트는 백엔드(Back-end)에 어떤 종류의 파일 스토리지가 있는지 전혀 신경 쓸 필요 없이 하나의 가상 IP 어드레스를 마운트해 사용하며, 저장되는 파일 또한 어디에 저장되는지 전혀 신경 쓸 필요 없이 ARX가 미리 정의된 룰에 의해 가장 적합한 스토리지로 파일을 저장한다.
이렇게 되면 실제로 어떤 파일 스토리지에 장애가 돼 네트워크에서 제거된다던가, 새로운 파일 스토리지를 도입해 네트워크에 추가하게 된다 하더라도 전체 서비스에 전혀 영향을 주지 않고 클라이언트는 이러한 사실을 전혀 눈치채지 못한 채 계속 서비스를 수행할 수 있게 된다. 아울러 모든 스토리지에 고르게 데이터를 저장함으로써 전체적인 용량 로드 밸런싱(Capacity Load Balancing) 효과를 가져오게 된다.

사용자 삽입 이미지

성능 향상
기업 내 애플리케이션이 날로 복잡해지고 다양해짐에 따라 하나의 파일 스토리지를 다양한 클라이언트가 액세스함으로써 종종 파일 스토리지 자체의 병목 현상이 생기곤 한다. 이를 해결하기 위해 고성능의 NAS 스토리지를 도입하기도 하지만 결국 NAS 스토리지 자체의 한계를 극복할 수는 없기 때문에 벽에 부딪치게 된다.
그러나 파일 스토리지의 가상화를 통해 다수의 물리적인 파일 스토리지를 두고 클라이언트는 마치 1대의 초 대용량 파일 스토리지를 사용하는 것처럼 구성할 수 있기 때문에 비즈니스 로직을 바꾸지 않고 다수의 파일 스토리지로 물리적인 분산을 효과적으로 꾀할 수 있으므로 전체적인 비즈니스 애플리케이션의 성능 향상을 기대할 수 있다.

데이터 마이그레이션
기존 스토리지의 용량 및 성능의 한계로 인해 새로운 스토리지를 도입한다면 피할 수 없는 당면 과제가 데이터 마이그레이션 작업이다. 데이터 마이그레이션은 오랜 시간을 필요로 할 뿐 아니라 필수적으로 서비스의 다운타임을 가져오게 되며 가장 사용률이 낮은 시간대에 이뤄져야 하기 때문에 보통 장기적인 계획을 가지고 순차적으로 하거나 밤샘작업을 여러 번 해야 하는 경우가 대부분이다. 하지만 ARX의 데이터 마이그레이션 정책을 사전에 정의해 놓기만 하면 클라이언트의 재구성이나 서비스의 다운타임 없이 자동으로 서비스 중에 데이터의 자연스러운 마이그레이션이 이뤄진다.
단적인 예를 들면, A라는 파일 스토리지에서 ARX를 통해 B라는 다른 파일 스토리지로 스트리밍 데이터를 계속 서비스하면서 마이그레이션 할 수도 있다. 또한 동일 기종의 스토리지간의 데이터 마이그레이션 뿐만 아니라 이기종의 다양한 스토리지 간에도 전혀 문제없이 마이그레이션할 수 있게 된다. 저성능의 파일서버를 사용하다가 고성능의 NAS 스토리지를 도입해 데이터를 마이그레이션해야 하는 경우, 혹은 그 반대로 고성능 NAS 스토리지의 액세스 빈도가 낮은 데이터를 저가형 파일 스토리지도 옮겨야 하는 경우 역시 다운타임 없이 전 과정을 자동으로 마이그레이션할 수 있다.

스토리지의 계층화
파일 스토리지는 이제 더 이상 단순한 파일 서버가 아닌 복잡한 다계층 인프라스트럭처(infrastructure)를 가지고 있다. 기업 내의 모든 데이터를 하나의 파일 스토리지에 보관하거나 주기적으로 테이프 라이브러리나 옵티컬 디스크에 백업하던 것과는 달리, 특히 SATA(Serial ATA) 디스크가 널리 보급됨에 따라 저렴한 대용량의 파일 스토리지가 시장에 등장하게 된 것이다.
기존의 테이프 라이브러리는 용량대비 가격이 저렴한 장점이 있으나 백업 및 복구의 복잡성 및 테이프 자체가 가지고 있는 선형적인 특정 때문에 특정 데이터의 복구가 대단히 부자유스러운 치명적인 단점이 있는데, 이러한 것을 극복하고자 흔히 2차 스토리지라고 부르는 값싼 대용량 디스크 솔루션이다.
하지만 과연 관리자가 그 모든 데이터를 일일이 어떤 스토리지에 보관해야 할지를 항상 결정하고 수동으로 옮긴다는 것이 가능할까? ARX 자체에 미리 정의할 수 있는 룰에 따라 자동으로 데이터를 옮길 수 있고 그에 대한 결과를 검토해 볼 수 있다.
이를테면 과거 60일 이내의 데이터는 고성능의 1차 스토리지에 저장하고, 그 이전의 데이터는 보다 저렴한 2차 스토리지에 저장하도록 사전에 룰을 정의해 놓는 것이다. 뿐만 아니라 특정 파일에 대해 액세스 빈도수에 따라 오래된 데이터라 하더라도 액세스가 많은 데이터는 1차 스토리지에, 최근에 생성된 데이터라 하더라도 액세스 빈도수가 적은 데이터는 2차 스토리지에 저장하도록 자동화하는 것이 가능하게 된다.
이러한 솔루션을 보통 ILM(Information Lifecycle Management) 혹은 DLM(Data Lifecycle Management) 솔루션이라고 부르는데, 지금까지는 소프트웨어적인 방법에 의존해 왔다.
하지만 ARX의 경우 스위치 내에서 모든 작업이 이뤄나기 때문에 솔루션 적용으로 인한 전체적인 성능저하를 근본적으로 막을 수 있으며 아울러 이기종 파일 스토리지를 자유롭게 혼합해 구성하는 데에도 아무런 문제점이 없게 된다.

사용자 삽입 이미지
재해 복구 혹은 데이터 복제
재해 복구와 비슷한 맥락에서 생각해 볼 수 있는 문제중의 하나가 바로 원격지로의 데이터의 효과적인 분배 문제다. 웹 애플리케이션의 경우 CDN(Contents Delivery Network) 혹은 ECDN(Enterprise Contents Delivery Network)과 같은 솔루션을 사용해 중앙의 웹 애플리케이션을 원격 사이트에 미리 복제본을 가져다 놓고 원격지의 사용자에게 빠른 액세스 효과를 가져다 줄 수 있다.
이러한 개념을 웹 애플리케이션뿐만 아니라 모든 파일 데이터로 확장시킨 것이 ARX의 DR솔루션이다. 즉, 메인 센터내의 데이터를 제 2, 제 3센터로 사전에 특정한 룰에 의해 읽기만 가능한(Read-Only) 복제본을 옮겨 놓고 사용자가 가장 가까운 곳의 데이터를 액세스할 수 있게 함으로써 전체적인 액세스 시간을 획기적으로 단축시킬 수 있는 것이다. 이렇게 하면 메인 센터의 장애시 재해 복구 센터로서의 역할을 수행할 수 있을 뿐만 아니라, 당연히 메인 센터의 복구시 역으로 데이터를 복구할 수도 있다.
기존의 스토리지 제조사의 재해 복구 솔루션의 가장 첫 번째 조건은 메인 센터와 재해 복구 센터의 스토리지가 동일 기종, 혹은 최소한 동일 제조사의 제품이어야 한다. 이는 스토리지 도입 결정에 커다란 제약 사항으로 작용할 수밖에 없었다. 하지만 ARX의 DR 솔루션은 메인 센터와 재해 복구 센터, 혹은 원격 사이트의 스토리지 기종 및 제조사에 전혀 무관하게 자유롭게 데이터를 복제 및 복구할 수 있다.

향후 시장 전망
전 세계 시장도 마찬가지지만 국내 시장 역시 NAS 시장보다는 SAN 시장이 매출을 비교해보면 그 규모가 훨씬 크다. 하지만 IDC를 비롯한 각종 시장 조사 기관의 발표를 보면 향후 몇 년간 꾸준히 스토리지 시장이 한자리 숫자의 성장을 해 나가는 중에 유독 NAS 및 파일서버 시장만이 두 자리 숫자의 성장을 거듭 해 나갈 것으로 예측하고 있다.
이와 같이 파일 스토리지의 비중이 날이 갈수록 급격히 증가함에 따라 이에 대한 관리적인 측면과 효율성에 대한 고려가 무시될 수 없게 됐다. 이러한 경우 파일 서버 및 NAS 스토리지의 가상화를 통해 클라이언트에게는 서비스 중단 없이 모든 디스크 자원의 효율적인 활용이라는 장점을 줄 수 있고, 관리자에게는 정확한 수요 예측과 자유로운 물리적인 스토리지 구성 변경 및 데이터 마이그레이션으로부터의 해방을 가져다 줄 수 있다. 더 나아가 회사에게는 불필요한 스토리지의 추가 도입 및 각종 구성 변경으로 인한 서비스 중단으로 비롯되는 기회 손실 비용을 현저히 줄일 수 있는 솔루션이 될 것이다.
 
 
출처 : http://blog.naver.com/iloview012/50000607571
출처  : Network Times

크리에이티브 커먼즈 라이센스
Creative Commons License
2009/09/01 11:45 2009/09/01 11:45
젤라피 이 작성.

당신의 의견을 작성해 주세요.