목록으로
[단독] 딥시크 9분의 1 규모로 성능 동급…SK그룹
News2025.05.25

[단독] 딥시크 9분의 1 규모로 성능 동급…SK그룹

요약

SK텔레콤의 추론형 AI 모델 ‘A.X 4.1’은 딥시크 R1 대비 약 9배 가벼운 720억 파라미터로도 동급의 추론 성능을 달성했으며, GPT-4o보다 한국어 처리 성능과 비용 효율이 우수하다.
이러한 고효율 추론형 모델은 투자 여력과 GPU 수급난이라는 한국 기업의 이중고를 극복할 해법으로 주목받으며, 네이버, 카카오 등 국내외 빅테크와 스타트업들도 개발 경쟁에 박차를 가하고 있다.
SK텔레콤은 ‘A.X 4.1’을 기반으로 AI 통화 에이전트 외 다양한 고객사를 확보하고, SK그룹 차원의 AI 밸류체인 구축을 가속화하며 글로벌 AI 경쟁력을 강화할 계획이다.

상세 내용

SK텔레콤(SKT)이 ‘딥시크 쇼크’의 주인공인 추론형 인공지능(AI) 모델인 DeepSeek R1 대비 9배 가벼운 모델인 ‘에이닷엑스(A.X)4.1’을 공개하며 동급의 추론 성능을 구현하는 데 성공했습니다. 이는 글로벌 AI 경쟁에서 한국 기업들이 겪는 투자 여력 한계 및 GPU 수급난이라는 이중고를 극복하기 위한 돌파구로 주목받고 있습니다. SKT는 이를 통해 OpenAI, Google, DeepSeek 등 글로벌 빅테크와의 AI 경쟁을 본격화하고, SK그룹 차원의 ‘AI 밸류체인(value chain)’ 구축에 속도를 낼 방침입니다.

SKT가 채택한 핵심 전략은 적은 파라미터(parameter) 수로 높은 효율과 성능을 달성하는 추론형 모델 개발입니다. 이는 기존의 파라미터 규모 경쟁에서 벗어나 비용 효율성과 특정 분야 전문성을 극대화하는 방향입니다.

핵심 성과 및 기술적 특징:

* 효율성: A.X4.1은 720억 개의 파라미터만으로 DeepSeek R1(6,710억 개 파라미터)과 맞먹는 성능을 달성했습니다. 이는 동일한 성능을 훨씬 적은 자원으로 구현함으로써 'AI 가성비(cost-effectiveness)'를 극대화한 것입니다.
* 성능 검증:
* MMLU(Massive Multitask Language Understanding) 점수에서 A.X4.1은 87.3점을 기록하여 DeepSeek R1(90.8점)과 거의 대등한 수준을 보였습니다.
* 비추론형 최신 모델인 OpenAI의 GPT-4o 대비 한국어 토큰(token) 처리 성능이 1.5배 높으며, 관련 비용을 34% 절감할 수 있습니다. A.X4.1의 MMLU 점수 또한 GPT-4o에 필적하는 것으로 알려졌습니다.
* 기술적 의미: 적은 파라미터와 토큰 비용은 모델 학습, 개발, 운영에 드는 비용을 절감할 뿐만 아니라, 모델 구동에 필요한 AI 반도체인 GPU의 개수도 줄일 수 있다는 점에서 국내 기업에게 특히 절실한 해법으로 제시됩니다. 이는 파라미터를 크게 늘리지 않고도 복잡한 수학 계산, 과학 연구, 코딩, 제조 등 고난도 분야에 특화된 모델로 응용될 수 있음을 시사합니다.

산업적 맥락 및 향후 전망:

이러한 추론형 모델 개발은 국내 기업들의 AI 경쟁력 강화를 위한 필수적인 요소로 부각되고 있습니다. 대규모 언어 모델(LLM)의 규모 경쟁에 투자 여력 부족으로 참여하기 어려운 국내 기업들이 GPU 확보 난항까지 겪는 상황에서 추론형 모델은 기술적 돌파구가 될 수 있습니다. SKT는 A.X를 자사 AI 통화 에이전트(agent) ‘에이닷’에 탑재하는 것을 넘어 다양한 고객사 확보에 나설 계획입니다.

국내 주요 기업들도 추론형 모델 시장에 적극적으로 뛰어들고 있습니다. LG AI연구원은 엑사원 딥(EXAONE Deep)을 공개했고, 네이버는 기존 ‘하이퍼클로바X(HyperCLOVA X)’의 추론형 버전을 출시 예정이며, 카카오 역시 언어 모델 기반의 추론형 모델을 개발 중입니다. 라이너(Liner), 업스테이지(Upstage) 등 AI 스타트업들도 자체 모델을 선보이거나 준비 중입니다.

글로벌 기업들 역시 추론 능력 고도화에 주력하고 있습니다. Google은 ‘Gemini 2.5 Pro’ 기반의 고급 추론 기능 ‘Deep Think’를, Anthropic은 자율성을 높인 ‘Claude Opus 4’를, 샤오미(Xiaomi)는 70억 파라미터의 ‘MiMO’를 공개했습니다.

SK그룹 차원에서는 이번 추론형 모델 출시를 계기로 AI 밸류체인 구축에 속도가 붙을 전망입니다. SKT의 AI 모델 및 데이터센터 인프라 사업을 필두로, SK하이닉스(SK Hynix)의 HBM4(고대역폭메모리) 조기 공급, AI 솔루션 조직으로 재편된 SK AX(구 SK C&C) 등을 통해 독자적인 AI 밸류체인을 구축하고 있습니다. SKT는 연내 에이닷 유료화와 북미 버전 ‘에스터(Aster)’ 출시, GPU 6만 장 규모의 AI 데이터센터 구축을 추진 중입니다.

원본 보기
News
Shared by Anonymous