블랙웰 GPU 과열 문제, 엔비디아의 실적 발표 앞두고 도전 직면
엔비디아의 CEO 젠슨 황은 3월 18일 미국 캘리포니아 새너제이에서 열린 연례 개발자 회의 'GTC 2024'에서 새로운 생성형 인공지능 모델을 위해 설계된 그래픽처리장치(GPU) 블랙웰(B200)을 소개했다. 이 제품은 AI 응답 속도를 30배 향상시킨 성능으로 주목받고 있다.
그러나 엔비디아는 21일 새벽 한국시간으로 실적 발표를 앞두고 블랙웰과 관련된 서버 과열 문제로 어려움에 처했다. 미 IT 매체 디인포메이션에 따르면 블랙웰이 맞춤형 서버 랙에 연결될 때 과열이 발생해 일부 고객이 데이터 센터 가동에 대한 우려를 나타냈다고 보도했다.
익명의 엔비디아 관계자는 이 문제를 해결하기 위해 여러 차례 공급업체에 서버 랙 설계 변경을 요청했다고 전했다. 엔비디아는 로이터통신에 "엔지니어링팀이 클라우드 서비스 제공업체와 협력하고 있으며, 이러한 엔지니어링 반복 과정은 정상적"이라고 해명했다.
블랙웰은 3월에 공개된 이후 출시 일정이 여러 차례 연기되었으며, 최근에는 칩셋의 설계상 결함이 발견되어 최소 3개월의 지연이 예상된다. 이미 엔비디아는 올 2분기 출시를 계획했으나, 8월 실적 발표에서 블랙웰의 양산을 2025 회계연도 3분기로 연기할 것이라고 밝혔다.
이러한 결함 소식에 따라 마이크로소프트와 알파벳과 같은 사전 주문 업체들은 기존 AI 칩인 H100과 H200 제품으로의 주문 확대를 고려하고 있는 것으로 전해졌다. 이는 블랙웰의 결함이 장기적으로 엔비디아의 수익에 부정적인 영향을 미칠 수 있다는 경고로 해석된다.
엔비디아는 20일 장 마감 이후 실적 발표를 할 것으로 예정되어 있으며, 팩트셋은 이번 분기(8~10월) 매출이 331억 달러에 이를 것으로 전망하고 있다. 이는 이전 분기 대비 10%, 전년 동기 대비 83% 증가한 수치로, 성장률은 전 분기부터 둔화하기 시작했다고 보고되었다.
결론적으로, 블랙웰 칩의 기술적 문제와 관련한 고객들의 고민은 엔비디아에게 중요한 도전 과제가 되고 있으며, 이에 대한 해결책이 시급하게 요구되고 있다. 이러한 상황은 경쟁업체들에게도 기회를 제공하고 있으며, 엔비디아는 향후 어떻게 대응할지에 대한 명확한 전략을 마련할 필요가 있다.
│
이 포스트는 피시아(PHYSIA) 사에서 운영하는 게임투비즈(GameToBiz) R&D 블로그에서 작성되었으며, 공공의 이익에 기여하는 목적을 제외한 다른 용도의 무단 배포 및 수정을 금합니다. 참조 - 피시아(PHYSIA), 게임투비즈(GameToBiz), 게임메이커.KR, 게임S/W에이전시, 저널CTL코리아