미주연 리포트

아주 거대하고 엄청한 것이 오고 있다

주삼부칠 2024. 4. 14. 15:58
728x90

스타게이트 Stargate

 

GPT-4보다 뛰어난 모델(클로드 3 오푸스)까지 등장한 가운데 OpenAI와 마이크로소프트는 해자를 만들기 위한 대규모 컴퓨팅 인프라를 확보해야 할 필요성이 그 어느 때보다 커졌음.

 

이에 샘 알트만은 7조 달러에 이르는 자금을 모아 글로벌 차원의 AI 칩 생태계 구축에 나설 계획임을 밝힌 적도 있음. 그는 “앞으로 컴퓨팅 파워가 곧 미래의 화폐가 될 것”이라 말했는데, 여기에는 전력 공급망도 포함되는 말.

 

다시 말해, AGI 훈련을 위해서는 데이터센터 건설, 칩 생산, 에너지 공급 등 다방면의 난제를 극복해야 한다는 것. AI 개발의 에센스는 결국 실리콘과 전기임을 유념해야 함.

 

마이크로소프트와 OpenAI는 ‘Stargate'라는 야심찬 프로젝트에 착수.

 

1,000억 달러가 투입되는 이 계획은 현존 데이터센터 규모의 100배 이상 웃도는 초대형 AI 슈퍼컴퓨터를 2028년까지 건설하겠다는 목표. OpenAI 지분의 49%를 확보하고 있는 마이크로소프트가 대부분의 자금을 댈 예정이라 양사의 협력은 더욱 긴밀해지는 추세.

 

GPT-4.5나 5 등 OpenAI 모델의 괄목할 만한 성능 향상이 Stargate 프로젝트의 명분이 된다는 점에서 OpenAI는 AGI 개발에 더욱 박차를 가할 것. Stargate 계획이 추진되는 데에는 크게 세 가지 전략적 의도가 깔려있음.

 

첫째는, AGI 개발 경쟁에서 구글에 밀리지 않기 위함. 구글은 자체 TPU 확충을 통해 이미 OpenAI를 능가하는 컴퓨팅 인프라를 구비한 것으로 알려져 있고 샘 알트만도 이에 대해 의식하고 있는 상황.

 

둘째 요인은 GPT-7급 이상의 AGI 모델 개발을 위함. 현재 GPT-5는 약 10만 개 H100 GPU로 학습을 마무리 지은 것으로 추정되며, GPT-6의 경우 수십만 개 GPU가 투입될 것으로 예상. 또한, GPT-7 이후의 선도적 모델들도 한발 앞서 선보이겠다는 야심이 깔려있음.

 

세 번째로는 장시간에 걸친 '추론' 과정을 통해 모델 성능을 극대화하려는 의도. 알파고가 답변을 내놓기 전, 약 1분간의 사고 시간을 가져가는 것만으로 사전학습의 10만 배에 맞먹는 위력을 보여줬던 것에 착안. GPT-5 등에 수분~수시간에 이르는 추론 시간을 부여한다면(GPU 연산량 폭증) GPT-6, 7에 버금가는 성능을 기대해 볼 수 있다는 것. 특히 난치병의 신약 개발 같은 고난도 문제 해결에 효과적일 수 있어 레이턴시 저하 등 부작용은 감내할 만한 수준일 것이라는 게 중론.

 

오랜 고민 끝에 경이로운 해법을 제시하는 형태의 AI는 내년 중순쯤에는 현실화될 수 있을 것이라는 전망도 있음. 다만, 이를 위해서는 결국 실리콘과 전기 확보가 반드시 수반돼야 함.

 

최근 주요 하이퍼스케일러의 백로그에 따르면, 엔비디아가 내년에 본격 양산할 GB200 NVL 72(랙)에 대한 수요가 벌써 6~7만개에 해당하는 것으로 파악됨. 또한 주요 CSP들이 대규모로 공급받을 해당 랙의 ASP는 약 2백만 달러인데, 개별 판매 가격은 350만 달러에 육박한다는 분석도 제기. Stargate와 같은 신규 데이터센터 건설 수요는 곧 GB200의 주요 타겟 고객층에 해당한다는 점, 엔비디아의 올해 데이터센터 매출은 기대해볼만.

 

또한, 기존의 전력망으로는 AI 데이터센터의 막대한 전력 수요를 감당하기 어려움. SMR 등 신규 발전 설비 도입이 필수불가결할 것. 샘 알트만이 CEO로 있는 SPAC 기업 ALCC는 작년 7월 핵분열 원자로 개발기업인 Oklo와 합병 계획을 체결한 것, 아마존이 원전 옆에 데이터센터를 구축하겠다고 한 것은 다 이러한 맥락

 

 

(출처 : 미래에셋증권)