전국이 멈췄던 '먹통사태' 1년…카카오, 안정성 확보로 신뢰회복 '박차'


지난해 10월15일 SK C&C 판교 데이터센터 화재로 서비스 먹통
자체 IDC 구축 막바지·개발자 도구 이중화 등 재발방지책 마련

지난해 10월 SK C&C 판교 데이터센터 화재로 인해 발생한 카카오 먹통 사태가 1년을 맞았다. 카카오는 당시의 경험을 바탕으로 자체 데이터센터 구축과 개발자 도구 이중화 등 안정적 서비스를 위한 노력을 이어가고 있다. /이동률 기자

[더팩트|최문정 기자] 지난해 10월15일 SK C&C 판교 데이터센터 화재로 인해 발생한 '카카오 먹통' 사태는 5일하고도 7시간30분 동안 이어졌다. 서비스 장애의 여파도 '국민 메신저'인 카카오톡을 비롯해 카카오모빌리티, 카카오엔터테인먼트 등 공동체 서비스 전반에 퍼져 있어 전 국민의 불편을 야기했다.

카카오는 지난 1년을 '절치부심'의 시간으로 삼았다. 먹통사태 이후 위기대응 조직 체계를 점검하고, 첫 자체 데이터센터의 준공을 마쳤다. 서비스 안정성을 강화하기 위한 투자와 인력도 늘렸다. 엔터테인먼트와 모빌리티 등 공동체도 지속 가능한 서비스를 위한 대응책을 마련하며 신뢰회복에 나서고 있다.

카카오는 첫 자체 데이터센터인 카카오 데이터센터 안산을 홍수·화재·지진·정전 등 다양한 재해와 재난에 대비할 수 있도록 설계·운영할 예정이다. /카카오

15일 업계에 따르면 카카오는 지난 9월 첫 자체 데이터센터인 '카카오 데이터센터 안산'의 준공을 마쳤다. 카카오 데이터센터 안산은 한양대 에리카 캠퍼스 내에 위치해 있으며, 총 12만 대의 서버에 6엑사바이트의 데이터를 저장 수 있는 '하이퍼스케일(초대규모)' 시설이다.

카카오 데이터센터 안산은 화재, 지진, 홍수 등의 자연재해와 인재가 발생해도 끊김없는 서비스를 제공할 수 있도록 하는데 초점을 맞췄다. 특히 대규모 화재를 대비해 4단계 대응 시스템을 마련했고, 내진설계와 정전에 대비한 전력·냉방·통신의 이중화를 구축했다. 또한 홍수, 해일, 태풍 등의 자연재해에 대비한 재난설계를 적용했다.

카카오 관계자는 "카카오 데이터센터 안산은 운영 시스템 설치와 안정화 테스트를 거쳐 내년 1분기 중 가동을 목표로 삼고 있다"고 말했다.

카카오는 첫 자체 데이터센터 마련을 넘어 곧바로 제2데이터센터를 확보한다는 목표다. 카카오는 서울대학교 시흥캠퍼스 M1 부지에 연면적 4만 평 이상, 전력량 100메가와트 규모의 데이터센터를 구축할 예정이다. 이 데이터센터는 2024년 착공에 들어가 2026년까지 준공을 마친다는 목표다.

지난해 먹통사태 당시 피해 복구를 늦췄던 원인인 '주요 작업과 운영도구'의 다중화 조치도 마쳤다. 주요 작업과 운영도구는 크게 권한관리 도구와 소스 관리 도구 등 2가지로 나뉜다. 이는 각각 카카오 서비스의 관리자 권한을 인증하거나, 코드 등 결과물을 관리하는 데 사용된다.

지난해 10월 홍은택 카카오 대표는 기자회견을 통해 "서비스의 주요 데이터와 서비스 응용프로그램에 대한 이중화 조치는 돼 있었지만, 개발자들의 주요 작업과 운영도구가 이중화되지 못했다"고 설명했다.

카카오는 "지난해 10월 데이터센터 화재 전에는 권한관리 도구는 데이터센터별로 분산 구축돼 있었지만, 소스 관리도구가 이중화작업이 완료되지 않아 영향을 받는 상황이 발생했다"며 "소스 관리 도구 복구의 지연이 카카오의 전반적 서비스 복구 과정의 지연으로 이어졌다. 같은 문제를 반복하지 않기 위해 소스 관리 도구를 데이터센터 수준에서 삼중화했다"고 설명했다. 이를 통해 하나의 데이터센터에서 문제가 발생하더라도, 다른 데이터센터 2곳에서 서비스를 이어갈 수 있다.

카카오 지난 9월 서비스 안정성을 위한 대책과 실천 과제 등을 담은 카카오 안정성 보고서를 발간했다. /카카오

회사 내 비상 대응 체계도 점검했다. 카카오는 올해만 209억 원 이상의 정보보호투자를 단행했다. 이는 전년 대비 48.8% 늘어난 금액이다. 정보보호 전담 인력은 지난해 61명에서 올해 103명으로 늘었다. 또한 정보보호 관리체계에 대한 국제 표준 검증(ISO 27001), 개인정보 관리체계에 대한 국제 표준 검증(ISO 27701), 클라우드 서비스 인증(ISO 27017), 국내 정보보호와 개인정보보호 관리체계 인증(ISMS-P)을 획득했다.

카카오엔터테인먼트와 카카오모빌리티 역시 데이터 다중화와 트래픽 모니터링을 통해 안정적인 서비스 제공에 나서고 있다. 카카오는 지난달 이와 같은 개선 방향과 결과를 담은 '카카오 안정성 보고서'를 발간했다.

아울러 카카오는 지난 6월 본 일반 이용자와 비즈니스 파트너를 대상으로 피해보상 절차를 마무리했다. 전체 피해 보상 규모는 약275억 원에 이른다.

주무부처인 과학기술정보통신부와 방송통신위원회 역시 지난해 '먹통사태'와 같은 대규모 플랫폼 서비스 장애를 막기 위한 법안을 통과시켰다.

과기정통부는 지난 7월부터 방송통신발전기본법(방발법) 개정안, '정보통신방법개정안, 전기통신사업법 개정안 등이 반영된 이른바 '디지털 안전3법'을 시행하고 있다. 이에 따라 정부의 재난관리 대상에 포함되지 않았던 부가통신서비스 사업자도 일평균 이용자 수가 1000만 명을 넘기거나, 트래픽 양 비중의 2% 이상을 차지하는 경우, 혹은 대규모의 서비스 장애가 발생해 통신재난관리심의위원회의 심의에 따라 한시적으로 지정된 사업자의 경우도 관리 대상에 포함된다.

방통위는 지난 5일 디지털플랫폼 서비스 장애 관련 이용자 보호 강화 대책을 발표했다. 이에 따라 디지털 플랫폼에서 2시간 이상 서비스 장애가 발생할 경우, 이용자에게 의무적으로 이를 고지해야 한다. 방통위는 향후 피해구제 강화를 위한 법 개선 방안도 검토할 예정이다.

munn09@tf.co.kr

Copyright@더팩트(tf.co.kr) All right reserved.