AI의 Reasoning Era로의 적응
대학에서 시험을 위해 주입식으로 공부한 경험이 있는 사람은 아마도 정보의 단순 재생산 능력이 비판적 사고와 동일하지 않다는 것을 알고 있을 것입니다. 2022년에 첫 공개된 대형 언어 모델(LLM)은 인상적이지만 제한적이었습니다. 마치 다중 선택 시험에서 우수한 성적을 내지만 자신의 논리를 방어하는 데 어려움이 있는 재능 있는 학생과 같았죠. 반면, 오늘날의 고급 Reasoning 모델은 포괄적인 문제 해결을 위해 애매함을 탐색할 수 있는 숙련된 대학원생과 유사합니다.
인간의 두뇌 메커니즘을 모방하여 학습하는 AI 시스템이 발전함에 따라, 우리는 단순한 정보 재생에서 진정한 추론으로의 진화를 목격하고 있습니다. 이 새로운 역량은 AI의 진화와 기업이 이를 통해 얻을 수 있는 기회의 새로운 장을 여는 계기가 됩니다. 그러나 최신 기술의 발전을 충분히 누리기 위해서는 적절한 인프라와 컴퓨팅 자원을 갖추는 것이 필수적입니다.
Reasoning 혁명
“Reasoning 모델은 이전 LLM과 질적으로 다릅니다,”라고 Microsoft의 AI/HPC 아키텍트인 Prabhat Ram은 설명합니다. 이러한 모델은 다양한 가설을 탐색하고 답이 지속적으로 정확한지를 평가하며 접근 방식을 조정할 수 있습니다. “이들은 훈련 데이터에 의해 노출된 정보에 기반해 내부적인 결정 트리를 생성하고, 어떤 솔루션이 가장 좋은지를 탐색합니다.”
이러한 적응형 문제 해결 접근 방식은 단점을 동반합니다. 이전 LLM은 통계적 패턴 매칭과 확률적 분석에 기반해 밀리초 내에 결과를 제공했습니다. 이는 많은 애플리케이션에서는 효율적이지만, AI가 다수의 해결 경로를 철저히 평가할 시간이 부족해 질 수 있습니다.
새로운 모델에서는 추론 중 연장된 계산 시간이 AI가 더 정교한 내부적 강화 학습을 활용할 수 있도록 하여 다단계 문제 해결과 더욱 미세한 의사 결정을 가능하게 합니다.
NASA의 로버가 화성 표면을 탐사하는 경우를 통해 이러한 Reasoning 능력을 설명할 수 있습니다. “결정은 매 순간마다 내려져야 하며, 어떤 경로를 선택하고 무엇을 탐사해야 하는지를 평가해야 하므로 위험과 보상의 균형을 맞추는 것이 필요합니다,”라고 Ram은 설명합니다. “AI는 ‘내가 절벽에서 뛰어들고 있는가? 아니면, 이런 암석을 연구하는 것이 한정된 시간과 예산으로 과학적으로 더 가치 있는 것인가?’와 같은 평가를 할 수 있어야 합니다.” 이러한 평가를 성공적으로 수행하는 것은 새로운 과학적 발견을 전례 없는 속도와 규모로 이루어질 수 있습니다.
Reasoning을 통한 기업 적용 사례
Reasoning이 가능한 AI의 기업 적용 사례는 매우 광범위합니다. 의료 분야에서는 환자 데이터, 의학 문헌 및 치료 프로토콜을 분석하여 진단 또는 치료 결정을 지원할 수 있습니다. 과학 연구 분야에서는 가설을 수립하고 실험 프로토콜을 디자인하며 복잡한 결과를 해석함으로써 소재 과학에서 제약 분야에 이르기까지 발견을 가속화할 잠재력을 가지고 있습니다. 금융 분석 분야에서도 Reasoning AI는 투자 기회나 시장 확장 전략, 리스크 프로파일 및 경제 예측을 평가하는 데 유용할 수 있습니다.
이러한 통찰력을 바탕으로, 인간 의사, 연구원 및 금융 분석가는 더 나은 의사 결정을 빠르게 내릴 수 있습니다. 그러나 이러한 시스템을 현장에 배포하기 전에, 특히 의료나 자율 주행 자동차와 같은 고위험 상황에서는 견고한 안전장치와 거버넌스 프레임워크가 필수적입니다.
“자율 주행 자동차의 경우, 스티어링 휠을 좌측으로 돌리거나 우측으로 돌리는 것, 가속페달을 밟거나 브레이크를 밟는지에 대한 실시간 결정을 내려야 합니다. 보행자와 충돌하거나 사고를 일으키는 것은 절대적으로 피해야 하죠,”라며 Ram은 강조합니다. “상황을 Reasoning하고 ‘최적의’ 결정을 내리는 것이 이러한 Reasoning 모델이 앞으로 해야 할 사항입니다.”
AI Reasoning을 위한 인프라
최적의 운영을 위해 Reasoning 모델은 추론을 위해 상당히 더 많은 컴퓨팅 리소스를 필요로 합니다. 이러한 수요는 명확한 확장 도전 과제를 만듭니다. Reasoning 모델의 추론 시간은 아주 짧을 수도 있고 몇 분 이상 걸릴 수도 있기 때문에 이러한 다양한 작업 간의 로드 밸런싱이 어려울 수 있습니다.
이러한 문제를 해결하는 것은 인프라 제공자와 하드웨어 제조업체 간의 긴밀한 협력을 필요로 하며, Ram은 Microsoft와 NVIDIA 간의 협력을 언급합니다. 이들은 그들의 가속화된 컴퓨팅 플랫폼을 Microsoft 제품, 즉 Azure AI에 통합하고 있습니다.
“Azure를 생각할 때, AI 훈련 및 추론을 위한 시스템을 배포하는 데 있어 전체 시스템을 하나로 고려해야 합니다,”라고 Ram은 말합니다. “데이터 센터에서 무엇을 다르게 할 것인지, 여러 데이터 센터에 대해서는 어떻게 할 것인지, 그것들을 어떻게 연결할 것인지에 대한 모든 고려가 필요합니다.” 이러한 고려사항은 신뢰성 문제에까지 확장되며, 이는 메모리 오류, 서버 내외부의 전송 오류, 열 문제 및 데이터 센터 수준의 전력 변동과 같은 문제를 포함합니다. 이를 해결하기 위해서는 정교한 모니터링 및 신속한 대응 시스템이 요구됩니다.
Microsoft와 NVIDIA의 협력은 기업들이 Reasoning 모델의 힘을 활용할 수 있도록 복잡한 배경을 관리할 필요없이 구현할 수 있는 틀을 만듭니다. 이러한 협력은 성능 측면의 이점 외에도, 기술 환경 변화에 따라 신속하게 대처할 수 있는 능력을 제공합니다. Ram은 “속도는 이 분야에서 독특한 도전 과제입니다. 매 3개월마다 새로운 기본 모델이 출시됩니다. 하드웨어 또한 아주 빠르게 발전하고 있습니다,”라고 덧붙입니다.
미래를 위한 AI Reasoning과 인프라 진화
Reasoning 및 agentic 모델을 위한 AI 인프라의 발전은 Reasoning이 가능한 AI를 더 많은 조직에 제공하는 데 필수적입니다. 견고하고 접근 가능한 인프라가 없다면, Reasoning 모델의 이점은 방대한 컴퓨팅 자원을 가진 기업에만 국한될 것입니다.
앞으로 Reasoning이 가능한 AI 시스템과 이를 지원하는 인프라의 발전은 더 큰 이익을 약속합니다. Ram에 따르면, 그 경계는 기업 적용을 넘어서 과학적 발견과 인류의 진전을 이끄는 혁신에 이릅니다. “이러한 agentic 시스템이 과학적 연구를 추진하고 새로운 가설을 제안하여 노벨상을 이끌어내는 그 날이 온다면, 우리는 이 진화를 완료되었다고 말할 수 있을 것”이라고 그는 말합니다.
자세한 내용을 알아보려면 Microsoft와 NVIDIA가 AI 개발 및 성능을 가속화하는 방법에 대해 읽고, NVIDIA GTC AI 컨퍼런스 세션을 시청하며, Azure AI 솔루션 및 Azure AI 인프라의 주제 분야를 탐색해보시기 바랍니다.