2026.01.08 (목)

  • 맑음동두천 -8.1℃
  • 맑음강릉 -4.7℃
  • 맑음서울 -7.6℃
  • 맑음대전 -4.6℃
  • 맑음대구 -3.8℃
  • 맑음울산 -3.3℃
  • 맑음광주 -2.0℃
  • 맑음부산 -2.1℃
  • 맑음고창 -2.2℃
  • 흐림제주 4.2℃
  • 맑음강화 -6.9℃
  • 맑음보은 -5.9℃
  • 맑음금산 -4.5℃
  • 맑음강진군 -0.7℃
  • 맑음경주시 -4.0℃
  • 맑음거제 -1.1℃
기상청 제공
메뉴

SK텔레콤, 519B 초거대 AI ‘A.X K1’ 공개…국내 첫 500B급 모델

허깅페이스에 모델 개발 개요 및 벤치마크 지표 비교한 보고서 업데이트
수학·코딩 벤치마크에서 딥시크-V3.1 대비 성능 각각 102%, 110%로 앞서
연내 멀티모달 추가하고 조 단위 파라미터 규모로 모델 확장할 계획

[서울타임즈뉴스 = 최남주 기자] SK텔레콤 정예팀이 매개변수 519B(5,190억 개) 규모의 초거대 AI 모델 ‘A.X K1(에이닷엑스 케이원)’ 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다. A.X K1은 국내에서 처음으로 500B를 넘는 매개변수를 갖춘 초거대 언어모델로, 제한된 개발 기간과 자원 속에서도 높은 성능을 구현해 주목받고 있다.

 

SK텔레콤 정예팀은 약 4개월이라는 짧은 기간과 1,000개 수준의 GPU 자원을 활용해 모델을 설계·학습했다. 통상 초거대 모델은 매개변수가 늘어날수록 최적화 시간과 컴퓨팅 자원이 급증하지만, 정예팀은 학습량과 모델 크기를 수학적으로 설계하는 스케일링 이론을 적용해 효율을 극대화했다. 그 결과 약 10조 개에 달하는 데이터를 투입해 519B 규모의 모델을 완성했다. 특히 이번 개발은 정부 지원 없이 자체 GPU 조달만으로 이뤄졌다는 점에서 의미가 크다.

 

A.X K1은 주요 글로벌 오픈소스 모델과 비교해도 경쟁력 있는 성능을 보였다. 수학 능력을 평가하는 AIME25 벤치마크에서 89.8점을 기록하며 ‘딥시크-V3.1’ 대비 102% 수준의 성과를 냈다. 실시간 코딩 문제 해결 능력을 측정하는 LiveCodeBench에서도 영어·한국어 기준 모두 두 자릿수 이상 높은 점수를 기록해 실전 활용 가능성을 입증했다.

 

기술적으로는 전문가 혼합(MoE) 구조를 채택해 전체 519B 파라미터 중 33B만 선택적으로 활성화하는 방식으로 훈련 안정성과 연산 효율을 동시에 확보했다. 또한 최대 128K 토큰의 긴 문맥을 처리할 수 있어, 장문의 보고서나 서적 수준의 텍스트도 한 번에 분석할 수 있다.

 

SK텔레콤은 A.X K1을 시작으로 추가 연구와 자원 투입을 통해 성능을 고도화하고, 연내 멀티모달 기능을 추가한 뒤 조 단위 파라미터 모델로 확장할 계획이다. 이를 통해 국내 AI 기술 경쟁력을 한 단계 끌어올린다는 구상이다.


오늘의 포토뉴스