AI 활용법/직장인 활용

한국 소버린 AI 5개 컨소시엄 정리 — LG·SKT·업스테이지 1차 통과의 의미

피드너 2026. 6. 3. 18:00

 

지난 1월에 1차 평가 결과가 떨어졌을 때, 사내 슬랙 한쪽에서 "그래서 PoC 모델 다시 골라야 하냐"는 질문이 한참 돌더라고요. 작년 8월 정예팀 선정 이후 5개 진영이 한국형 파운데이션 모델 경쟁에 들어갔는데, 이번에 LG·SKT·업스테이지 세 팀만 살아남고 네이버클라우드와 NC AI가 떨어졌습니다. '소버린 AI' 용어를 국내에서 가장 먼저 띄운 게 네이버였다는 점에서 이 결과는 좀 의외였어요.

 

한국 소버린 AI 사업 구조와 1차 평가 결과

이 사업은 2025년에 5개 컨소시엄으로 출발해서, 6개월 단위 평가를 거치며 2027년에 최종 2팀만 남기는 서바이벌 구조입니다. 글로벌 빅테크 모델 대비 95% 이상의 성능을 갖춘 한국형 파운데이션 모델을 만들고, 결과물(모델 가중치·코드)을 오픈소스로 공개해야 한다는 의무가 붙어 있어요.

 

2026년 1월 1차 평가 결과는 이렇게 갈렸습니다.

  1. 통과: LG AI연구원, SK텔레콤, 업스테이지
  2. 탈락: 네이버클라우드, NC AI

네이버 탈락 사유는 시각언어모델(VLM)의 비전 인코더 가중치를 외부 오픈소스에서 가져다 쓴 게 '독자성' 기준에 걸렸기 때문이라고 합니다. 정부는 "아키텍처 설계부터 데이터 구축, 가중치 초기화 후 학습까지 전 과정을 자체 수행"한 모델을 독자 모델로 보는데, 이 가중치 기반 요건을 충족하지 못했다는 평가였어요. NC AI는 벤치마크·전문가·사용자 평가 전 부문에서 점수가 낮았다는 평이고요. AI 반도체 쪽도 SKT-리벨리온, LG-퓨리오사AI 두 진영으로 갈렸기 때문에, 사실상 이번 평가는 한국 AI 칩 스타트업의 대리전이기도 했지요.

 

 

LG·SKT·업스테이지 진영별 강점과 적합한 일감

1. LG EXAONE 4.0 — B2B 문서·산업 데이터

LG 진영은 LG유플러스·LG CNS·슈퍼브AI·퓨리오사AI·뤼튼이 붙어 있습니다. 그룹사 산업 데이터셋이 워낙 두텁기 때문에, 한국어 격식체 장문 PDF·계약서·기술 문서 처리에서는 가장 안정적이라는 평이 많아요. RAG 파이프라인을 사내 문서에 붙이는 작업이라면 우선순위가 높다고 봅니다.

 

2. SKT A.X 시리즈 — 통신·실시간 대화 워크로드

SKT 컨소시엄에는 크래프톤·포티투닷·리벨리온·라이너·서울대·KAIST가 모였습니다. 자체 통신·고객센터 데이터를 학습한 만큼 저지연 응답과 한국어 토큰 효율성에서 우위가 있다고 알려져 있어요. 콜센터·챗봇처럼 응답 속도가 곧 비용인 영역이면 자연스러운 후보가 됩니다.

 

3. 업스테이지 Solar Pro — 경량·온디바이스 비용 우위

이번 1차 평가의 다크호스는 단연 업스테이지였습니다. 노타·래블업·플리토·뷰노·마키나락스·로앤컴퍼니가 함께 들어와 있고, 경량 모델과 온디바이스 추론에 무게가 실린 진영이지요. 비용 대비 성능 비율이 중요한 PoC라면 가장 먼저 후보에 올려둘 만하다고 봅니다.

 

 

탈락한 네이버·NC AI와 카카오·KT의 자리

네이버 HyperCLOVA X Think는 1차에서 떨어졌지만 국내 검색·콘텐츠 코퍼스 규모는 여전히 1위로 평가받습니다. 2차 평가까지 VLM 독자성 문제를 어떻게 정리하느냐가 가장 큰 변수예요. NC AI Varco는 게임·캐릭터 같은 콘텐츠 생성 도메인에 집중하는 모양새라, 사업 자체가 흔들리기보다 다른 진로로 풀릴 가능성이 큽니다.

 

카카오와 KT는 아예 초기 선정에서 빠졌습니다. 카카오는 OpenAI, KT는 마이크로소프트(Microsoft)와의 대규모 협력이 '외산 의존' 평가를 받았다는 얘기입니다. 다만 카카오 Kanana는 카카오톡 MAU와 챗GPT(ChatGPT)를 묶어 B2C 트래픽을 노리는 그림이고, KT Mi:dm은 Azure 인프라 기반 B2G·공공 클라우드 쪽으로 방향을 잡아두고 있어요. 국가 사업에서 빠진 게 곧 시장 퇴장은 아니라는 점은 짚어둬야겠습니다.

 

직장인 일감별 한국 LLM 매칭 가이드

실무에서 PoC를 굴려보면 진영을 일률적으로 고르기보다 일감별로 다른 모델을 쓰는 쪽이 비용이 덜 드는 편이에요. 제가 사내 슬랙에 정리해뒀던 매칭 표를 그대로 옮겨보면 이렇습니다.

  1. 검색·요약: HyperCLOVA X 주력, 비용 절감용으로 Solar 보조
  2. 코딩·개발: 글로벌 모델(챗GPT 등) + 사내 코드 리뷰는 EXAONE
  3. 한국어 계약서·장문 PDF: EXAONE 우선
  4. 번역·다국어 응대: Solar Pro 또는 A.X
  5. 고객 응대·콜센터: A.X (저지연·비용 우위)

개인적으로는 한 모델에 다 맡기는 것보다 두세 개를 LangChain 같은 추상화 레이어 뒤에 두고, 일감별로 라우팅하는 구조를 추천하는 편이에요. 어차피 2027년까지 살아남을 2팀이 누가 될지는 아직 모르는 상황이라, 종속을 미리 만들 이유가 없거든요.

 

 

2026년 한국 LLM 멀티 모델 전략, 어디부터 잡을까

5팀 경쟁 체제가 굳혀지면서 API 단가는 떨어지는 흐름으로 보입니다. PoC를 미뤄왔던 팀이라면 지금이 비용상 진입하기 좋은 시기라는 얘기가 됩니다. 다만 결과물(모델 가중치·코드) 일체를 오픈소스로 공개해야 한다는 의무가 붙어 있다는 점에서, 사내 fine-tuning 정책도 같이 점검해두시는 게 좋습니다. 어떤 가중치가 어떤 라이선스로 풀릴지는 진영마다 미묘하게 다를 가능성이 있어요.

 

남은 두어 달 동안 어느 진영이 2차 평가를 통과할지, 네이버가 VLM 문제를 어떻게 풀어낼지가 가장 큰 관전 포인트입니다. 6월 말~7월 초에 한 번 더 발표가 있을 예정이고, 그때 살아남는 모델로 PoC 본 적용을 결정해도 늦지 않을 것 같습니다. 어느 쪽이 살아남든 라우팅 레이어를 먼저 깔아둔 팀과 단일 모델에 묶인 팀의 분기 비용 차이가 어디까지 벌어질지가, 제가 가장 궁금하게 지켜보는 지점입니다.