세일즈포스, 9시간 서비스 중단… 고객 피해와 신뢰도 타격 우려
세일즈포스는 아시아-태평양 및 북미 지역의 고객들이 사용 중인 시스템이 약 9시간 30분 동안 중단되는 사고를 겪었다. 고객관계관리(CRM) 소프트웨어 분야에서 선두 자리를 차지하고 있는 세일즈포스의 이러한 장애는 15일 오후 2시 55분에 시작되어 16일 자정이 지나서야 복구되었다. 이로 인해 136개의 서버가 영향을 받았으며, 이에 따른 피해는 상당할 것으로 예상된다. 세일즈포스는 서비스 중단에 대해 사과하며, 문제 해결이 완료된 후 고객들에게 불편을 끼쳐 사과의 뜻을 전했다.
장애의 원인에 대해서는 세일즈포스의 데이터센터에서 발생한 '코어 서비스'의 마비가 원인으로 지목됐지만, 정확한 원인은 아직 확인되지 않았다. 업체 측은 데이터베이스 연결 구성 변경 중 오류가 발생했을 가능성이 있다고 설명하고 있다. 서비스 중단에 대한 첫 공지는 오후 5시 53분에 이루어졌으며, 이어서 데이터베이스 분석으로 문제를 진단하고 롤백 작업을 진행한 것으로 보인다.
세일즈포스는 2016년 이후 아마존웹서비스(AWS)와 함께 자체 관리형 데이터센터를 운영하고 있다. 이번 사고 발생 후 시스템 복구를 위해 여러 조치를 취했으며, 오후 10시 30분에 문제 해결을 공식 발표했다. 그러나 세일즈포스는 이러한 사고가 고객사의 비즈니스에 큰 영향을 미쳤음을 인식하고 있으며, 향후 재발 방지를 위한 조사를 실시할 것이라고 알렸다.
이번 사태는 세일즈포스가 지난달에도 정전으로 인해 서비스 마비를 경험한 바 있기 때문에 해당 기업의 서비스 신뢰도에 심각한 타격을 줄 것으로 보인다. 세일즈포스는 전 세계 CRM 시장에서 약 21.7%의 점유율을 차지하고 있으며, 이번 문제로 고객들의 피해 규모 산정이 시작된 상황이다. 특히 일본에서는 지방 정부의 재해 관리 시스템까지 마비되는 등 공공 부문에도 광범위한 영향을 미쳤다.
업계의 관점에서는 SaaS(서비스형 소프트웨어) 도입이 늘어나고 있지만, 서비스 장애가 잇따르면서 기업들이 불안감을 느낄 수 있다는 우려가 커지고 있다. 특히 내부 시스템 변경으로 인해 서비스 마비가 발생했다는 점에서 SaaS의 불안정성 문제가 도드라지고 있다. 보안 이슈와 관련된 장애도 높아지면서 기업들이 시스템 안정성 강화의 필요성을 느끼고 있다.
세일즈포스와 유사한 사례로, 글로벌 사이버 보안 기업 크라우드스트라이크의 서비스 장애 문제가 최근 이목을 끌었다. 당시 시스템 충돌로 인해 여러 기관과 기업이 영향을 받았고, 이에 따라 소송 사건까지 이어졌다. 이러한 사건은 SaaS 기업들이 장애에 대한 관리 체계를 강화하고, 고객사와의 실시간 소통 체계를 마련해야 한다는 경각심을 불러일으킨다.
이와 관련된 업계 전문가들은 클라우드 시스템의 이중화 및 삼중화를 통해 안정적인 서비스 운영 구성이 필요하며, 장애 발생 시 신속 대응 체계가 요구된다고 강조하고 있다. 또한, 예기치 않은 장애에 대비한 조치로, 시스템 변경 전 예비 배포를 통한 검증 작업도 필요한 것으로 보인다. 재발 방지를 위해서는 관리 프로세스에 대한 철저한 점검과 검증이 필수적이라는 점이 강조된다.
│
이 포스트는 피시아(PHYSIA) 사에서 운영하는 게임투비즈(GameToBiz) R&D 블로그에서 작성되었으며, 공공의 이익에 기여하는 목적을 제외한 다른 용도의 무단 배포 및 수정을 금합니다. 참조 - 피시아(PHYSIA), 게임투비즈(GameToBiz), 게임메이커.KR, 게임S/W에이전시, 저널CTL코리아