세일즈포스, 아시아·북미서 9시간 서비스 중단…클라우드 안정성 우려 증폭
세일즈포스는 지난 15일 아시아태평양 및 북미 지역에서 약 9시간 27분 동안 서비스 중단 사태를 겪었다. 이로 인해 기업들의 영업 및 고객 관리에 차질이 발생한 것으로 보인다. 세일즈포스 측은 보상 관련 사안에 대해 별도의 확인이 필요하다고 밝혔다. 이번 사태는 7월에 발생한 크라우드스트라이크의 대규모 서비스 장애에 이어져 클라우드 기반 서비스의 안정성에 대한 우려를 더욱 부각시켰다.
세일즈포스는 CRM 시장에서 21.7%의 점유율을 보유하고 있으며, 이는 마이크로소프트보다 3배 이상 높은 수치이다. 세일즈포스를 이용하는 기업 수는 전 세계적으로 약 15만 개에 달하며, 국내 고객사는 150여 개로 아모레퍼시픽, LG전자, 삼성바이오로직스, 교보생명 등이 포함된다. 일본에서는 지방정부의 재난 관리 시스템마저 마비될 정도로 심각한 상황이 발생했다.
서비스 중단은 해킹이나 AI 오류와 같은 외부 요인 보다는 기업 내부 시스템 변경 과정에서 비롯된 것으로 확인됐다. 세일즈포스는 데이터베이스 연결 구성 변경 중 오류가 발생한 것이며, 크라우드스트라이크는 소프트웨어 업데이트 도중 결함이 생긴 것으로 알려졌다. 특히, 크라우드스트라이크의 경우 850만 대 이상의 윈도 기기가 영향을 받았고, 1만 편 이상의 항공편이 취소되면서 델타항공은 5억 달러 이상의 손실을 주장하며 소송을 제기했다.
이번 연속된 서비스 장애 사건은 SaaS 기업들이 직면한 과제를 강조한다. 클라우드 서비스가 수많은 구성 요소로 이루어진 복잡한 시스템임을 고려하면, 내부 변경만으로도 전체 서비스가 중단될 수 있다는 점은 큰 경고로 작용한다. 이러한 복잡한 시스템은 관리 및 유지에 있어 더 큰 위험을 내포하고 있다.
SaaS 기업들은 급성장하는 시장에서 안정성과 혁신의 균형을 맞추는 것이 중요한 과제가 되고 있다. 따라서 이들은 변경 관리 프로세스를 강화하고, 장애 발생 시 실시간으로 고객들과 소통할 수 있는 시스템을 마련해야 할 필요성이 있다. HFS리서치의 필 퍼슈트 CEO는 크라우드스트라이크의 사태 이후 IT 업계가 자동 업데이트를 무작정 신뢰해서는 안 된다는 경각심이 필요하다고 언급했다.
이러한 의견에 따라, 시스템 변경 시 예비 배포를 통제된 조건에서 수행하는 방식이 도입되어야 대규모 장애를 예방할 수 있을 것이라는 지적도 나온다. SaaS 기업들이 앞으로 이러한 경험을 바탕으로 보다 안전한 시스템 구축을 위한 노력이 필요할 것으로 보인다.
│
이 포스트는 피시아(PHYSIA) 사에서 운영하는 게임투비즈(GameToBiz) R&D 블로그에서 작성되었으며, 공공의 이익에 기여하는 목적을 제외한 다른 용도의 무단 배포 및 수정을 금합니다. 참조 - 피시아(PHYSIA), 게임투비즈(GameToBiz), 게임메이커.KR, 게임S/W에이전시, 저널CTL코리아