카카오, 10.15 먹통 후 다짐 실현…첫 자체 IDC ‘안정성’에 방점
[‘AI 시대 핵심’ 데이터센터 4사 4색]③
‘카카오 먹통’ 사태 후 15개월 만에 안산 IDC 가동 본격화
카카오그룹 서비스 안정적 운영 목적…주요 설비 ‘이중화’
[이코노미스트 정두용 기자] 카카오가 드디어 자체 인터넷데이터센터(IDC)를 손에 쥐었다. 이른바 ‘10.15 악몽’을 떨쳐낼 기반 시설이 사고 발생 후 꼬박 15개월 만에 가동을 시작했다. 카카오는 첫 자체 IDC의 기능 고도화만큼이나 ‘안전성 확보’에 신경을 썼다. 대규모 ‘먹통’ 사태를 다시는 일으키지 않으리라는 의지가 묻어난다.
2021년 12월 첫 삽을 뜬 ‘카카오 데이터센터 안산’(이하 안산 IDC)은 2023년 9월 준공 후 운영 시스템 설치·안정화 테스트 등을 거쳐 올해 1월 본격적인 가동에 돌입했다. 안산 IDC는 카카오그룹 주요 서비스의 연속성 담보를 위해 마련됐다. 코로케이션 서비스(직접 IDC를 구축·운영하기 어려운 기업을 대상으로 시설을 임대·관리해 주는 사업)가 이뤄지지 않는다는 의미다. 오직 카카오그룹 내 서비스를 안정적으로 제공하고 데이터를 보관하기 위한 목적으로 운영된다. 카카오는 임대 서버와 안산 IDC를 병행 운영하면서 그룹 내 서비스를 안정적으로 제공할 방침이다.
카카오는 안산 IDC 준공 당시 ‘안전성 극대화 시스템을 갖춘 곳’이라고 소개했다. 화재·지진·홍수 등 자연재해·재난은 물론 대규모 화재에도 대응할 수 있도록 4단계 안전 시스템이 적용됐다. 내진설계와 정전에 대비한 전력·냉방·통신의 이중화도 이뤄졌다.
‘10.15 악몽’과 쇄신
카카오가 첫 자체 IDC 시설에 다양한 안전 조치를 적용한 배경으론 2022년 10월 15일 벌어진 ‘먹통 사태’가 꼽힌다. 카카오는 해당 사고 이후 쇄신을 약속했고, 인프라 마련에 투자금을 쏟아부으며 자체 IDC 구축에 속도를 높였다.
SK C&C 판교 IDC에 불이 나자, 이 시설을 임대해 서비스를 제공하던 카카오·네이버의 기능이 멈췄다. 정부는 당시 이 사고를 ‘재난’으로 규정하고 대응에 나섰다. 주요 플랫폼의 디지털 서비스를 기초 인프라(Infrastructure·기반 시설)로 보고 국민 피해가 커지지 않도록 조치에 나선 셈이다.
화재 발생 후 두 달여가 지나 발표된 과학기술정보통신부·방송통신위원회·소방청 공동 조사 보고서에 따르면 카카오의 서비스가 모두 정상화되기까진 127시간 33분이 소요됐다. 반면 네이버는 12시간이 필요했다. 네이버의 경우 서비스 장애 범위가 ‘일부 기사 댓글 이용 불가’ 정도로 한정적인 데다 기능 정상화도 비교적 빨랐다. 해당 사고가 ‘카카오 먹통’ 사태로 불리는 이유다.
주요 서비스 모두가 중단된 카카오의 경우, 대기 서버를 동작 서버로 만들기 위한 권한관리 기능인 ‘운영 및 관리 도구’를 SK C&C 판교 IDC 내에서만 이중화했다. 한 IDC가 일시에 불능이 되는 상황에 대비 불가능한 구조였고, 이에 따라 대다수 서비스 중단과 복구 시간 지연 등이 나타났다. 반면 네이버는 IDC 간 이중화 조치를 시행하고 있어 주요 서비스의 중단이 없었고, 기능 복구 역시 상대적으로 빨랐다. 업계에선 “자체 IDC 운영 경험과 안전성 기술 투자 차이가 ‘서비스 정상화 시간’을 결정한 것”이란 평가가 나왔다.
카카오는 사고 수습 후 본사는 물론 카카오게임즈·카카오모빌리티·카카오엔터테인먼트 등 주요 계열사 모두 유료 서비스에 대한 보상을 우선 진행했다. 또 무료 사용자를 대상으로 제공된 이모티콘 등을 포함해 약 275억원 규모의 보상금을 지급했다. 서비스 중단으로 피해를 본 소상공인에겐 총 5000만원을 보상금으로 줬다.
카카오는 보상안과 함께 다양한 방식으로 ‘다시는 일상 대화가 끊기지 않을 것’이란 다짐을 대외에 공개했다. 조직 정비는 물론 투자도 대폭 확대하겠다는 점을 강조했다. 사고 원인으로 지목된 ▲이중화 조치 미흡 ▲모니터링 시스템 구축 소홀 ▲자원확보 부족 등이 모두 인프라 설비와 관련이 돼 있기 때문이다. 회사는 당시 “향후 5년간 지난 5년간 투자 금액의 3배 이상 규모로 집행하겠다”고 약속한 바 있다.
안정성에 방점 찍은 ‘안산 IDC’
안산 IDC는 이런 카카오의 ‘서비스 중단 재발 방지’에 대한 다짐을 상징하는 시설이다. 안산 IDC는 경기도 안산시 상록구 사동 한양대학교 에리카(ERICA) 캠퍼스 혁신파크 내 축구장 2.6배 크기인 1만8383㎡ 부지에 마련됐다. 연면적은 4만7378㎡로, 총 12만대의 서버를 보관할 수 있는 초대규모(Hyperscale·하이퍼스케일) IDC다. 10만대 이상의 서버를 운영할 수 있는 시설부터 ‘초대규모 IDC’로 분류된다. 저장할 수 있는 데이터양은 6엑사바이트(EB)에 달한다.
카카오는 이 시설에 ▲IDC 이중화 ▲데이터·서비스 이중화 ▲플랫폼·운영 도구 이중화 등을 적용했다. 또 장애 탐지를 위한 모니터링 다중화 시스템과 대용량 트래픽 전송에 필요한 서비스 IDC 간 별도 전용망도 구축했다. 시스템뿐 아니라 전력·냉방·통신 등 주요 시설의 이중화도 진행했다.
서버 운용 중단에 가장 직접적인 영향을 미치는 전력 안정성에도 신경을 썼다. 안산 IDC 전력 공급 용량은 4만kW에 달하는데, 이를 안정적으로 운영하기 위해 카카오는 2회선 수전(전기 공급 상용 선로와 별개의 예비 선로)을 적용한 무정전 전력망을 구축했다. 전력망 이중화 구출을 위한 사업비만 139억원에 달한다. 또 무정전전원장치(UPS)실과 배터리실을 방화 격벽으로 각각 분리 시공하기도 했다.
재난·재해 상황에 대비해선 ▲리히터 규모 6.5 이상의 강진에도 견딜 수 있는 내진설계 ▲홍수 침수에 대비해 지상 1층의 지반 높이를 주변 대지보다 약 1.8m 높게 설계 ▲빗물 유입 방지를 위한 530mm의 차수판 설치 ▲초속 28m의 강풍을 기본 풍속으로 설계해 안전성 확보 ▲화재 자동 감지 센서를 구축하고 전문인력의 24시간 모니터링 체제 마련 등을 적용했다. 소방서와 안산 IDC 화재 대응 매뉴얼 공동 개발하고 정기적인 합동 모의 소방 훈련을 진행하는 등 운영 측면에서의 안전망도 마련했다.
친환경 시설 역시 안산 IDC의 특징이다. 프리쿨링(Free Cooling) 냉각기 시스템을 도입, 자연조건을 활용해 에너지를 절감할 수 있다. 서버를 식히면서 온도가 높아진 물을 바깥 공기로 다시 차갑게 만드는 냉각 방식을 채택했다. 또 우수·중수를 조경용수로 재활용하고, 전산실 폐열을 하역장 난방에 활용하는 시설도 마련돼 있다. 또 1000kW 규모의 태양광 패널도 설치돼 있다. 이에 따라 안산 IDC의 전력효율지수(PUE)는 1.3 수준을 기록하고 있다. PUE는 IDC 총 전력 중 IT 장비 외 냉방·설비 등 부가 전력 소모가 얼마나 적은지를 나타내는 지표로, 1에 가까울수록 에너지 효율이 높다는 걸 의미한다. 국내 IDC의 PUE 평균은 1.91 수준이다.
카카오는 안산 IDC에 이어 두 번째 자체 시설 건립을 추진하고 있다. 고성능컴퓨팅(HPC·대용량 정보를 고속으로 처리하는 환경) 전용 IDC를 마련해 인공지능(AI) 서비스의 안정적 제공을 구현할 방침이다. 카카오 측은 “차세대 IDC 역시 전력 소모 및 발열 등을 최소화하기 위해 다양한 특화 설비를 적용할 예정”이라며 “전력 소모의 환경 영향을 최소화하기 위해 친환경 에너지 수급과 전력 효율화가 가능한 입지를 검토 중”이라고 전했다.
ⓒ 이코노미스트. All rights reserved.
많이 본 뉴스
1유마인코리아의 유마인K, 2024 글로벌 인플루언서 엑스포 부스 입점
2WE하다-코틱스 코퍼레이션, 글로벌 인플루언서 엑스포서 장애인 근로 캠페인 협업
3테슬라, 中 주간 판매 최고 기록 경신…매출 지속 성장
4GTX-A노선 ‘운정중앙-서울역’ 구간 28일 개통
5바오연대네트워크, 中대사관 성명서 전달...“푸바오 건강 회복”
6고용률 ‘역대 최대’ 속 건설·제조업 고용 찬 바람
7'트럼프 식 패스트트랙'...미국에 10억달러 이상 투자하면 '완전 신속' 허가
8 경찰, 대통령실 압수수색 종료…경호처 저지에 진입 실패
9최태원 차녀 최민정, 美 보험사 대표 총격에 “의료 체계 변화해야”