AI 도구 리뷰/기타 AI 도구

카나나 2.5, 정말 '한국어'를 아는 1500억짜리 LLM인가

피드너 2026. 5. 14. 18:00

 

얼마 전에 챗GPT(ChatGPT)한테 "부장님이 '한번 생각해볼게' 하셨는데 통과한 거야?"라고 물어본 적이 있어요. 챗GPT는 "긍정적인 신호로 보입니다"라고 답하더라고요. 하지만 다음 날, 제 메일함에는 어김없이 반려 메일이 와 있었습니다.

 

이 일화가 카카오의 카나나 2.5(Kanana 2.5)와 이어지는 이유가 있어요. "한번 생각해볼게"는 한국 직장인이라면 누구나 아는 사실상의 완곡한 거절이거든요. 그런데 영어 중심으로 학습된 글로벌 LLM은 이 미묘한 뉘앙스를 모릅니다. 단어 의미만 보고 '긍정'으로 처리해버리는 거죠. 카나나 2.5가 이 지점에서 진짜로 다를 수 있는지가 제가 제일 궁금한 부분입니다.

 

카나나 2.5의 1500억 매개변수, 규모가 말해주는 것

지난 5월, 카카오 정신아 대표는 실적 발표를 통해 1500억 개(150B) 매개변수 규모의 카나나 2.5를 공개하겠다고 밝혔습니다. 이는 초기 GPT-3(175B)와 비슷한 체급이에요.

 

기존 라인업의 최상위 모델이었던 카나나 Flag가 32.5B였으니 약 4.6배 커진 셈입니다. 비유하자면 단편소설 한 편을 외웠던 모델이 이제는 두꺼운 장편소설 여러 권을 외우게 된 것으로, 그 규모의 차이가 상당하죠. 보통 이 정도 크기부터 언어 추론 능력이 질적으로 달라지는 '창발적 능력'이 나타나곤 하거든요.

 

물론 요즘은 무조건 크다고 장땡은 아닙니다. 필요한 파라미터만 골라 쓰는 MoE(Mixture of Experts, 혼합 전문가) 구조를 통해 효율을 극대화하는 게 대세니까요. 카나나 2.5 역시 이러한 효율적 아키텍처를 통해 글로벌 최상위 모델 대비 덩치는 작아도 실무 능력은 대등하게 맞추는 전략을 취하고 있습니다.

 

카카오가 처음부터(From Scratch) 직접 만든 이유

카나나 2.5는 오픈소스 모델을 가져다 미세조정한 게 아니라, 처음부터 독자 개발한 'From Scratch' 방식입니다.

 

오픈소스 기반 모델은 빠르고 저렴하지만, 뿌리가 영어 중심이라 한국어는 '나중에 추가로 배운 언어' 수준에 머물 때가 많아요. 반면 처음부터 만들면 학습 초기 단계부터 카카오가 보유한 방대한 한국어 비정형 데이터와 플랫폼 노하우를 모델의 핵심에 배치할 수 있습니다.

 

특히 카카오는 "개인의 카카오톡 대화는 학습에 쓰지 않는다"고 명확히 선을 그었지만, 그 외의 공개된 비정형 데이터를 처리하는 기술만큼은 독보적이죠. 이런 접근의 결과가 바로 '토크나이저' 효율입니다. 글로벌 모델은 한국어를 분석할 때 영어보다 1.5~3배나 더 잘게 쪼개서 토큰을 낭비하는데, 카카오는 자체 토크나이저로 이를 해결해 학습 비용은 40% 절감하고, 응답 속도는 60%나 개선했다고 합니다.

 

 

한국형 LLM 비교: 카나나 2.5 vs 하이퍼클로바X vs 솔라

국내 주요 모델들과 비교해 보면 카나나 2.5의 지향점이 더 명확해집니다.

모델명 특징 포지셔닝
카나나 2.5 150B 규모, MoE 아키텍처 서비스 전반에 쓰이는 수평적 범용 모델
하이퍼클로바X 네이버 서비스 내재화 강점 0.5B~32B 등 다양한 'SEED' 라인업 보유
솔라(Solar) 10.7B 규모의 작은 거인 고품질 데이터 기반의 글로벌 벤치마크 강자
엑사원(EXAONE) LG의 산업 특화 모델 전문가용 B2B 및 연구 영역 집중

 

 

카나나 2.5 공개 후 테스트할 5가지 포인트

공개되면 저는 이 다섯 가지 질문으로 '진짜 실력'을 검증해볼 계획입니다.

 

1. 한국 직장 문화 읽기

"팀장이 내 기획안을 보고 '고려해볼 만하네'라고 했다. 이거 긍정적인 신호야?"

 

한국 직장 특유의 완곡한 거절 패턴을 데이터 레벨에서 체화하고 있는지 확인할 수 있는 질문입니다.

 

2. 최신 신조어와 뉘앙스 처리

"'갓생', '킹받다', '중꺾마' 같은 표현을 섞어서 요즘 세대 말투로 업무 격려 메시지 써줘."

 

단순히 단어 뜻을 아는 게 아니라, 문맥에 맞게 자연스럽게 녹여내는지 보면 비정형 데이터 처리 능력이 드러납니다.

 

3. 장문 요약 — 글쓴이의 '톤' 유지

"이 블로그 글을 요약하되, 원문 작성자의 친근하고 부드러운 말투를 그대로 살려줘."

 

내용만 뽑아내는 건 쉽지만, 문장 스타일까지 잡아내는 건 언어 이해의 깊이가 달라야 가능합니다.

 

4. 한국 현대사 및 문화 코드 (환각 검증)

"2025~2026년 대한민국 주요 경제 정책의 변화와 부동산 시장 전망을 요약해줘."

 

최신 정보가 얼마나 촘촘히 업데이트되어 있는지, 그리고 한국형 정보를 그럴싸하게 지어내는 '한국형 환각' 문제가 없는지 확인하는 구간입니다.

 

5. 실무 도입의 핵심, API 효율

"동일한 과제를 처리할 때, 최신 GPT 모델 대비 응답 속도와 예상 비용이 어느 정도인가?"

 

카카오가 주장한 60% 속도 개선이 실제 실무 환경에서 체감되는지가 관건입니다.

 

 

마치며

카나나 2.5의 등장은 단순한 국산 모델 하나가 추가되는 것 이상의 의미가 있습니다. 과연 "팀장님의 한번 생각해볼게"를 거절로 읽어낼 수 있는 '눈치 빠른' AI가 탄생할지, 공개 직후의 테스트 결과가 정말 기다려지네요.