안녕하세요, 디무브입니다! 🎈

본 포스팅에서는 오픈소스 모니터링 솔루션인 Zabbix의 실제 고객 구축 사례에 대해 소개해 드리고자 합니다.

바로 우리 나라 게임 회사의 3N이라고 잘 알려져 있는 넥슨의 일본 지사인 넥슨 재팬 케이스인데요.

넥슨 재팬에서 존 모니터링 툴의 불편한 점을 해결하기 위해 Zabbix으로 변경하여 많은 이점을 보고 있다고 합니다.

왜 넥슨 재팬이 Zabbix를 도입하였고, Zabbix를 사용하여 조직에게 어떤 이점과 영향을 주었는지 알아보는 시간을 가져보도록 하겠습니다.

Preview

1. 서버 구성

시스템 개요 Zabbix 서버용 하드웨어
서버 : 1 Zabbix Server
사이트 수 : 2개
모니터링 되는 장치 수 : 1,000개
트리거 수 : 10,000
품목 수 : 20,000개
사용자 수 : 30명
서버 : HP DL380 8세대
CPU : Xeon E5-2660 2.20GHz(8코어) x 2
CPU메모리 : 32GB
HDD: : 300GB * 25
NVPS: 74.51

2. 도입 Simulation

Before Requirements Approach Outcome
이전 모니터링 소프트웨어는 리소스 모니터링을 완벽히 수행 불가 물리 & 가상 플랫폼으로 구성된 1,000대 이상의 서버에 리소스 모니터링 이 가능한 툴 Zabbix 인증 파트너, Johokobo, Inc. (Zabbix의 일본 파트너사)와 사이징에 관해 컨설팅 수행 원래 두 가지 다른 방법을 사용하여 구현되었던 VM 리소스 모니터링을 하나로 통합

넥슨은 대표작인 메이플스토리, 마비노기 등 150여종의 온라인 컴퓨터 게임을 전 세계에 배포하며 온라인은 물론 모바일 시장 등 새로운 분야로 적극 확장하였고, 성공적인 사업 확장을 위해서는 안전시스템 운영이 핵심이라고 판단하였습니다. 이는 사용자가 언제 어디서나 게임을 즐길 수 있는 신뢰할 수 있는 인프라가 필요하다는 것을 의미합니다.

사진은 넥슨재팬에서 인프라를 설계하고 관리하는 담당자인 넥슨운영본부 기술부 시스템정보실 인프라팀 구성원입니다.

그들은 스트레스 없는 게임 경험을 위해 안정적인 24x7 서비스를 구축하고자 시스템 운영을 모니터링 하고 있습니다.



구축 사례

1. 물리적 & 가상적 플랫폼을 위한 통합 모니터링 콘솔

Zabbix는 오픈소스 모니터링 솔루션으로, 넥슨 인프라 모니터링을 위해 통합 서비스를 제공하였습니다. Zabbix는 두 위치에 있는 1,000대 이상의 서버와 디스크 및 메모리와 같은 하드웨어 리소스에서 실시간 모니터링을 수행합니다. 또한 안정적인 운영을 위해 서버 응용프로그램의 상태를 모니터링 합니다.

Zabbix는 넥슨의 거대한 물리적 및 가상 플랫폼에서 광범위한 환경의 엔터프라이즈급 통합 모니터링 기능과의 결합을 위해 가장 적합한 솔루션이라는 사실을 입증했습니다.

넥슨 재팬은 현재 물리적 서버 400대 외에 가상 서버 600대를 운영하고 있습니다. 하지만 기존에 사용하던 툴이 가상 플랫폼의 일부를 지원하지 않아 실시간 모니터링을 통해 자세한 상태를 검색할 수 없었습니다.

그 결과 별도의 모니터링을 위해 VMware vCenter Server를 설정하는데 추가적인 노력이 필요했고, 두 가지 툴을 하나로 통합할 수 있는 솔루션을 찾고 싶었습니다.

이에 Zabbix를 선택하게 되었고 Zabbix의 구조를 이해한 후에는 제약 없이 커스터마이징 할 수 있었습니다. Zabbix는 사용 가능한 최고의 오픈 소스 소프트웨어 솔루션 중 하나입니다.

넥슨 인프라팀은 VMware의 많은 옵션을 고려했지만 그들이 원했던 기능을 잘 작동하지 못했습니다. 제어 화면이 복잡하거나, 기본 설정에 사용자 지정하는 데 추가 비용이 발생하거나, 제품이 1,000대 이상의 서버의 확장성을 보장할 수 없었습니다.

Zabbix는 VMware가 충족해내지 못한 요구 사항을 충족시킨 유일한 모니터링 솔루션 이었습니다.

또한 Zabbix는 웹 기반 사용자 인터페이스에서 물리적 리소스와 가상 리소스에 대한 통합 모니터링을 수행합니다. 명령창에 익숙하지 않은 사용자도 구성을 쉽게 변경할 수 있습니다. 구성 변경 사항을 다시 시작할 필요가 없으므로 유지 관리를 계획하고 알림을 전하는데 드는 노력과 시간을 절약할 수 있습니다.

2. 빠른 설치 및 구성이 가능한 솔루션

회사의 업무 흐름을 중단시키고 처음부터 재가동을 강요할 수 있는 모든 문제를 피하기 위해 Zabbix를 선정하였습니다.

넥슨 재팬이 Zabbix 설치를 서두르는 또 다른 이유는 이들의 모니터링 서버 플랫폼인 Windows Server가 곧 만료될 예정이었기 때문입니다.

넥슨은 OS 지원 만료를 예상하고 모니터링 솔루션을 찾고 있었습니다. Zabbix 도입을 결정한 후 이들은 요구사항 정의 및 설계를 시작한지 약 3개월 만에 마이그레이션을 완료할 수 있었습니다.

Zabbix의 일본 공식 파트너사인 Johokobo사는 Zabbix 프로젝트 경험을 토대로 넥슨의 요구사항을 원하는 일정에 맞게 완료하였으며, 시스템이 아직 사용 중이기 때문에 유지 보수 시간이 제한 되었지만 주어진 시간 내에 작동 구현을 완료 하였습니다.

Johokobo사의 담당자는 “두 회사 모두 제한된 시간 내에 마이그레이션을 완료하기 위해 협력하고 우선순위를 정해 세심하게 관리해야 했습니다. 넥슨은 다양한 종류의 모니터링을 요청하였으나 시간 제약으로 인해 최소 모니터링 항목을 설정했습니다. 그들은 우리의 서비스를 운영 지원과 품목 확장 모니터링에 충분히 활용하고 있습니다.”고 말했습니다.

넥슨 재팬은 Zabbix를 설치하는 동안 FreeBSD가 설치된 버전에는 설치 패키지를 사용할 수 없음을 발견했으나 파트너사를 통해 Zabbix 본사에 요청서를 제출하고 설치 일정에 맞춰 설치 패키지를 제작했습니다.

넥슨 재팬의 담당자는 “Zabbix는 오픈 소스 소프트웨어로 많은 정보를 쉽게 얻을 수 있지만, 전문적인 지원 없이 사용하는 것은 쉽지 않았습니다. 결국 Zabbix의 공식 파트너사에 문의하여 오류 해결의 시간과 노력을 절약할 수 있었습니다.” 고 언급하였습니다.

3. IOPS와 같은 세부 정보를 확보하고 인프라를 최적화

향후 서비스 확장에 따라 인프라 기능에 대한 수요가 증가할 것입니다. 우리는 Zabbix의 모니터링 시스템에 물리적 플랫폼과 가상 플랫폼 외에 클라우드 시스템과 같은 새로운 플랫폼을 도입하는 방법을 생각하고 있습니다.

넥슨 재팬은 Zabbix의 모니터링 대상을 미들웨어로 확대할 계획이며, 게임 및 서비스 운영팀이 웹 인터페이스를 통해 보다 세부적으로 모니터링 할 수 있는 시스템을 구축하고 있습니다.

이와 함께 신속한 이슈 발굴은 물론 이슈 발생을 막기 위한 대응책을 Zabbix 솔루션을 통해 해결하고자 계획하고 있습니다.

또한 Zabbix는 디스크 메모리가 부족하여 서비스가 일시 중단되기 전에 시스템이 문제를 감지하여, 남은 디스크 공간뿐만 아니라 하드웨어 교체를 위한 IOPS, 메모리 확장을 위한 정확한 크기 등의 세부 정보를 제공합니다.

넥슨 재팬의 인프라 팀 담당자는 이전의 인프라를 계속 사용하고 싶지 않으며, Zabbix를 통해 새로운 접근 방식으로 효율성을 극대화 하는 선도적인 팀이 되기를 바란다고 전하였습니다.

(원문: NEXON Case Study)


위 케이스 스터디와 같이, Zabbix는 엔터프라이즈급 인프라에 최적화 되어있으며 타 솔루션에 비해 구성이 쉽고 빠르게 구축할 수 있다는 장점을 갖고 있습니다.

오픈 소스 솔루션이라는 이유로 많은 고객 분들이 일체의 비용 없이 사용할 수 있기를 바라지만, 효과적인 구축과 활용을 위해서는 전문가의 도움을 통한 진단과 기술 지원이 필수적입니다.

디무브는 Zabbix의 공식 한국 파트너사로, Zabbix 모니터링 솔루션 구축과 관련된 모든 전문 기술 서비스를 제공해 드립니다.

Zabbix 모니터링 솔루션에 대해 궁금하신 사항이 있으시다면, 디무브에게 연락해주세요!

감사합니다. 😃