김성태 | 넷앱코리아 기술영업부 차장
각 RAID별 구성 상의 특징을 알아보고 권장 애플리케이션 환경을 살펴보도록 하겠다. 물론, 여기서 설명할 내용들이 모두 완벽히 적용될 수 있는 것은 아니다. 실제로 사용자가 스토리지 시스템을 선정해 구축하기 위해서는 RAID 뿐만 아니라 사용하고자 하는 애플리케이션의 I/O 성격, 필요한 데이터 용량, 가격, 시스템 아키텍처, 마이크로 코드 등의 다양한 스토리지 시스템 요소들을 고려해야 한다. 단지 본 기고를 통해 향후 독자들이 RAID에 의한 스토리지 시스템을 선정하는데 있어 조금이나마 도움이 되기를 바란다.
별도의 데이터 백업을 고려해야하는 RAID 0
RAID 0는 데이터를 블럭으로 나눠 다수의 디스크 드라이브에 저장하는 방식을 취한다. 따라서 I/O 로드를 다수의 채널과 드라이브에 분산시킴으로써, 성능을 급격하게 향상시킬 수 있다. 가장 좋은 성능을 내기 위해서는 하나의 디스크 드라이브만을 스토리지 컨트롤러에 할당하며, 다수의 컨트롤러에 데이터를 분산시킨다. 또한 RAID 0는 별도의 패리티를 생성하지 않기 때문에 패리티 생성을 위한 오버헤드를 줄일 수 있으며, 단순한 디자인으로 구성할 수 있어 수월하다.
하지만 RAID 0는 내고장성을 제공하지 못하는 치명적인 약점이 있기 때문에 ‘진정한’ RAID라 볼 수 없다. 즉, 이는 하나의 디스크 드라이브가 손상된다면 스토리지에 저장된 모든 데이터가 손실될 수 있다는 것을 의미하기 때문에 중요 업무 환경에서 사용돼서는 안된다.
업계에서는 거의 RAID 0를 사용하고 있지 않으며, 넷앱에서 제공하는 V-시리즈의 경우, HDS, IBM, HP, SUN/STK 등의 스토리지를 외장 스토리지로 사용하기 때문에 스토리지 제공업체에서 제공하는 RAID 기법을 그대로 이용할 수 있도록 단순 스트라이핑의 RAID 0 기법을 제공하고 있다. 또 다른 스토리지 공급업체에서는 내부 복제솔루션을 이용한 타깃 볼륨의 구성을 RAID 0로 구성하기를 권장한 적도 있다. 그러나 이 경우, 타깃 볼륨의 RAID를 구성하는 디스크 드라이브의 손상 시 원본 볼륨에서 다시 한번 데이터를 복사(full copy)해야 하는 부담을 준다.
RAID 0를 이용해 구성하는데 권장되고 있는 애플리케이션은 다음과 같다. 단, RAID 0의 경우 앞에서 언급한대로 디스크 드라이브의 손상 시 완벽한 데이터의 보호 기능을 제공하지 못하기 때문에 반드시 별도의 데이터 백업을 동시에 고려해야 한다.
- 비디오 제작과 편집 작업
- 이미지 편집
- 전자 출판 애플리케이션 중 인쇄전과정을 위한 애플리케이션
- 높은 대역폭을 필요로 하는 애플리케이션
금융 서비스에 용이한 RAID 1
RAID 1의 경우는 미러링된 영역을 단일 쓰기 업무와 이중 읽기 업무에 사용할 수 있다. 읽기 업무의 경우 단일 디스크때 보다 2배의 트랜잭션 성능을 제공하며, 쓰기 업무의 경우 같은 성능을 지원한다. 단일 디스크 손상에 비해 100%의 데이터 가용성을 보장하기 때문에 별도의 재설치 작업이 필요하지 않으며, 단지 대체 디스크에 데이터를 복제하는 작업만이 필요하다. 블럭당 전송률은 단일 디스크때와 동일하며, 특정 환경에서 RAID 1은 동시에 다수 디스크 드라이브의 손상에서도 데이터 전송을 지원할 수 있다.
이런 다양한 장점에도 불구하고 RAID 1은 용량 측면에서 RAID 구성 상 가장 높은 오버헤드를 발생시켜 비효율적이다. 일반적으로 RAID 기능은 시스템 소프트웨어에 의해 수행되기 때문에 많은 I/O가 발생할 경우에 CPU/서버 처리량의 저하 현상이 발생할 수 있다. 그래서 하드웨어적인 RAID 구현이 바람직하다. 대부분의 스토리지 제공업체는 하드웨어 혹은 소프트웨어 방식으로 RAID 1(미러링)을 지원하고 있다.
- 회계
- 급여
- 금융 서비스
- 높은 가용성을 필요로 하는 애플리케이션
아직 상용화되지 않은 RAID 2
RAID 2는 시스템 작동 중 데이터 에러 수정이 가능하며, 매우 높은 데이터 전송을 지원할 수 있다. 또한 RAID 2는 RAID 3, 4, 5에 비해 상대적으로 단순한 컨트롤러 디자인이 특징이다.
반면, 매우 작은 데이터 사이즈의 데이터 전송 시 많은 패리티 디스크를 필요로 하기 때문에 비효율적이며 초기 도입 비용도 높은 편이다. 처리량은 가장 최고일 경우에도 단일 디스크 드라이브와 동일할 수 밖에 없다. 가장 큰 약점은 현재 상업적으로 RAID 2를 구현한 사례가 없으며, 앞으로도 그럴 것으로 예상된다. 따라서 RAID 2에 권장되는 애플리케이션은 구체적으로 명시하지 않는다.
다소 복잡한 디자인으로 구성되는 RAID 3
RAID 3는 높은 읽기와 쓰기 데이터 전송을 지원하며, 디스크 손상이 전체 데이터 처리에 심각한 영향을 미치지도 않는다. 그리고 하나의 패리티 디스크로 많은 수의 데이터 디스크를 지원할 수 있기 때문에 높은 효율성을 제공한다.
그러나 처리량은 가장 최고일 경우에도 단일 디스크 드라이브와 동일할 수 밖에 없다. 또한 컨트롤러 디자인도 다소 복잡한 편이며, 소프트웨어 방식으로 RAID를 구성할 경우 매우 어렵고 많은 자원이 필요하다. 따라서 업계에서는 몇몇 스토리지 공급업체에서 RAID 3를 지원하고 있으나, 거의 사용되지 않고 있는 것이 현실이다.
- 비디오 제작과 라이브 스트리밍
- 이미지 편집
- 비디오 편집
- 전자 출판 애플리케이션 중 인쇄전과정을 위한 애플리케이션
- 높은 처리량을 필요로 하는 애플리케이션
온라인 서비스에 적합한 RAID 4
RAID 4는 매우 높은 읽기 데이터 전송률을 지원한다. 하나의 패리티 디스크로 많은 수의 데이터 디스크를 지원할 수 있기 때문에 높은 효율성을 제공하며, 전체 전송률도 높은 수준이다. 반면, 컨트롤러 디자인은 다소 복잡한 편이며, 쓰기 업무에는 성능 저하가 발생할 수 있다. 그리고 디스크 손상 시 데이터 재설치 작업이 어렵고 비효율적이다. 블럭 읽기 전송률은 단일 디스크의 전송률과 동일하다.
또한 RAID 4의 경우, 온라인 중에 용량을 증설할 수 있기 때문에 주로 닷컴, 병원과 커뮤니티 서비스 등 온라인을 통한 서비스를 주 애플리케이션으로 사용하는 환경에 알맞다. 현재 RAID 4는 이런 온라인 중에 용량을 확장할 수 있는 장점을 내세워서 NAS 시장에서 좋은 반응을 얻고 있다. 더불어 RAID 4 기반의 RAID-DP(Dual Parity)도 제공하고 있다.
- 비디오 제작과 라이브 스트리밍
- 이미지 편집
- 비디오 편집
- 전자 출판 애플리케이션 중 인쇄전과정을 위한 애플리케이션
- 닷컴, 병원 등의 온라인 애플리케이션 서비스
활용도 높은 RAID 5
일반적으로 RAID 5는 높은 읽기 데이터 전송률과 중간 정도의 쓰기 데이터 처리를 지원한다. RAID 4처럼, 하나의 패리티 디스크로 많은 수의 데이터 디스크를 지원할 수 있기 때문에 높은 효율성을 제공하며, 전체 전송률도 높은 편이다. 그러나 디스크 손상 시 전체 데이터 처리에 대해 어느 정도 영향을 받으며, 매우 복잡한 컨트롤러 디자인을 가지고 있는 것이 단점이라고 할 수 있다.
또한 RAID 1과 비교해 디스크 손상 시, 디스크 재설치 작업이 상당히 어렵다. 일반적으로 단일 디스크에 블럭 데이터 전송률과 거의 같은 수준으로 각각의 디스크에 데이터를 전송한다. 현재 거의 대부분의 스토리지 공급업체에서 RAID 5를 지원하고 있다.
- 파일과 애플리케이션 서버
- 데이터베이스 서버
- 웹, 전자우편, 뉴스 서버
- 인트라넷 서버
- 대부분의 애플리케이션에 대해 적용 가능
높은 가용성 지원하는 RAID 6
RAID 6는 근본적으로는 두 번째 독립 분산 패리티를 이용해 추가적인 내고장성을 가능하게 한 RAID 5의 확장판이라고 할 수 있다. RAID 5처럼, 데이터는 드라이브에 걸쳐 블럭 레벨로 분산돼 저장되고, 두 번째 패러티가 모든 드라이브에 걸쳐 계산되고 저장된다.
RAID 6는 매우 높은 데이터 가용성을 제공할 수 있으며, 동시에 다수의 드라이브가 손상되더라고 지속적인 서비스를 제공할 수 있기 때문에 기업의 중요한 애플리케이션에 알맞은 솔루션이다.
반면, RAID 6는 컨트롤러 디자인이 매우 복잡하며, 패리티 주소들을 계산하기 위한 컨트롤러 오버헤드가 매우 높다. 또한 쓰기 업무 시에 성능에 영향을 받을 수 있으며, 이중 패리티를 생성하기 위해 반드시 N+2의 디스크 드라이브가 필요하다.
최근 HDS에서 발표한 제품들이 RAID 6를 지원하고 있다. RAID 6는 RAID 5를 기반으로 하고 있으며, 쓰기 업무의 경우 최악의 경우 RAID 5에 비해 약 33%의 성능 저하가 발생할 수도 있는 것으로 알려지고 있다.
- 파일과 애플리케이션 서버
- 데이터베이스 서버
- 웹, 전자우편 서버
- 인트라넷 서버
- 적은 오버헤드로 높은 가용성을 필요로 하는 기업 애플리케이션
출처 : on the NET