AI 도구 리뷰/기타 AI 도구

미스트랄 스몰 4, 직장인이 실제로 쓸 자리가 있을까

피드너 2026. 5. 18. 18:00

 

얼마 전에 팀 후배가 카톡으로 스크린샷을 하나 보내왔어요. 회의 화이트보드 사진을 AI에 넣었더니 10초 만에 회의록 초안이 나왔다는 거였습니다. 쓴 모델이 챗GPT(ChatGPT)도 클로드(Claude)도 아니었거든요.

 

모델 이름이 미스트랄 스몰 4(Mistral Small 4)였어요. 유럽에 기반한 AI 회사 미스트랄(Mistral)이 최근 출시한 통합 모델인데, 이름에 "Small"이 붙어 있어서 가볍고 저렴한 보조 모델 정도로 보기 쉽거든요. 근데 실상은 좀 달랐습니다.

 

추론·비전·코딩 통합, 미스트랄 스몰 4 내부 구조

미스트랄은 원래 추론 전용, 이미지 분석 전용, 코딩 전용 모델을 각각 따로 운영했어요. 쓰는 입장에선 용도마다 모델을 바꿔야 했고, 사내 도입을 검토하는 IT 부서라면 모델마다 따로 관리해야 하는 부담이 있었습니다. 미스트랄 스몰 4에서는 이 세 기능을 하나로 묶었어요.

 

내부 구조는 MoE(Mixture of Experts, 전문가 혼합) 방식입니다. 전체 파라미터는 119B인데 토큰마다 실제로 작동하는 건 약 6B 정도예요. 내부적으로는 128명의 전문가 중 4명만 호출하는 구조라고 보시면 됩니다. 덕분에 대형 모델 성능을 유지하면서도 응답 속도가 이전보다 눈에 띄게 빨라졌습니다.

 

한 번에 처리할 수 있는 분량도 넉넉해요. 256K 토큰까지 받아주는데, 256K가 어느 정도냐면 한국어 기준으로 쳐도 수백 쪽 분량의 문서를 통째로 넣을 수 있는 수준입니다. 긴 보고서 여러 개를 동시에 비교·요약하는 작업이 한 번의 요청으로 가능해지는 거예요.

 

 

미스트랄 르샤 무료 사용법과 로컬 설치 선택 기준

개발자가 아니어도 바로 써볼 방법이 있어요. 미스트랄이 운영하는 웹앱 르샤(Le Chat, chat.mistral.ai)에서 회원가입만 하면 무료로 사용할 수 있습니다. 한국어도 지원하고요.

 

보안이 걱정된다면 로컬 설치 옵션도 있습니다. LM 스튜디오(LM Studio)나 올라마(Ollama) 같은 GUI 도구를 이용하면 개인 PC에 직접 설치해서 데이터가 외부로 나가지 않는 환경을 만들 수 있어요. 다만 119B 규모의 원본 가중치를 그대로 띄우려면 메모리 요구가 상당하기 때문에 일반 노트북에서는 구동이 어렵습니다. GPU가 달린 고사양 데스크톱이나 서버 환경이 필요한 상황입니다.

 

대신 양자화 버전(GGUF Q4/Q5)을 활용하면 16~32GB RAM의 적당한 고사양 PC에서도 돌려볼 수 있으니, 사양이 빠듯하다면 양자화 모델부터 시도해 보시는 게 현실적입니다. 개인 사용이라면 르샤 웹앱이 가장 빠른 시작점이에요. 민감한 업무 데이터를 다뤄야 한다면 사내 서버 설치를 IT 부서와 상의해보는 게 현실적인 방향이라고 봅니다.

 

한국어 메일·문서 작업, 르샤로 직접 써보니

저도 직접 르샤에서 한국어 업무 메일 초안을 몇 개 만들어봤는데요. 전반적으로 실용적이더라고요. 아래 같은 지시도 꽤 잘 따라왔습니다.

- "딱딱한 어투로 작성해줘"
- "친근하게 다듬어줘"
- "간결하게 정리해줘"

 

다만 한국어 표현에서 어색한 순간이 있었어요. 예를 들면 이런 문장이 나오는데요.

뵙게 되어 기쁩니다.

 

문법적으로는 맞지만 실제 업무 메일에선 잘 안 쓰는 표현이거든요. 완성도 높은 메일을 보내야 할 때는 발송 전에 한 번 더 손을 봐야 합니다.

 

반면 회의 내용 정리나 긴 문서의 핵심 추출은 속도도 빠르고 결과도 안정적이었어요. 불릿 형식으로 요약해달라거나 항목별로 분류해달라는 작업에서는 충분히 믿고 쓸 만한 수준이었습니다.

 

 

이미지·표 분석 정확도, 챗GPT와 비교해보면

기본적인 사진 묘사와 단순한 표 구조는 잘 잡아냅니다. 단순한 표를 텍스트 데이터로 변환하는 경우엔 대부분 깔끔하게 뽑혔어요. 반면 셀 병합이 많은 복잡한 표나 차트 안의 세부 숫자는 놓치는 경우가 생기더라고요.

 

이미지 분석 정확도 기준으로만 비교하면 챗GPT나 클로드보다 한 단계 아래로 보시는 게 현실적입니다. 절대적인 정확도가 중요한 작업이라면 아쉬울 수 있어요.

 

가격 쪽에서는 이야기가 달라지는데요. API 비용이 100만 토큰 기준 입력 $0.15, 출력 $0.60 수준으로, 같은 급으로 비교되는 GPT-5 mini 라인 대비 상당히 저렴한 편입니다. 그래서 완벽한 정확도보다 속도와 비용이 중요한 작업, 예를 들어 화이트보드 초안을 텍스트로 뽑거나 보고서 표를 정리하는 용도에서는 가격 대비 효율이 높습니다. HITL(Human-in-the-Loop, 사람 검수 단계)을 하나 더 끼우는 워크플로라면 더더욱 잘 맞는 위치예요.

 

챗GPT·클로드 대비 미스트랄 스몰 4 경쟁력

성능 기준으로 비교하면 현재 Claude Haiku 4.5 와 비슷한 수준이라는 평가가 있어요. Claude Sonnet 4.5 나 GPT-5 급 모델과는 복잡한 추론·창의성에서 차이가 납니다.

 

그럼 어디서 차별점이 있냐면, 제가 보기엔 두 가지가 결정적이에요.

 

하나는 비용이에요. 재피어(Zapier)나 n8n 같은 자동화 도구와 API로 연결해서 반복 작업을 처리할 때, 이메일 분류나 간단한 요약처럼 고성능 모델이 굳이 필요 없는 작업들이 꽤 많거든요. 작업별로 Task Budgets(작업당 토큰·비용 한도)를 정해 두고 운영하면, 이 자리에서 비용 효율 차이가 크게 납니다.

 

다른 하나는 보안이에요. 미스트랄 스몰 4는 Apache 2.0 라이선스로 공개된 오픈 웨이트 모델이라 기업 서버에 직접 설치할 수 있어요. 챗GPT나 클로드 같은 외부 서비스 사용이 내부 규정으로 막혀 있는 기업에서는 꽤 유력한 대안이 될 수 있겠습니다.

 

다만 한국어 품질은 추가 검증이 필요한 부분도 있습니다. 앞서 말씀드린 것처럼 저도 르샤에서 직접 써보니 표현이 어색하게 나오는 순간이 있었거든요. 업무 중요도가 높은 문서라면 결과물을 꼼꼼히 검토하시는 게 좋겠습니다.

 

 

마치며

일단 "비용 없이 바로 써보고 싶다"는 분이라면 르샤 웹앱을 먼저 열어보시는 게 가장 빠릅니다. 설치 없이 회원가입 하나로 시작할 수 있으니까요.

 

개인적으로는 요즘 단순한 문서 정리나 이메일 초안은 르샤에서 빠르게 뽑아보고, 복잡한 분석이 필요한 경우엔 클로드나 챗GPT로 넘기는 방식으로 쓰고 있어요. 모델 하나로 모든 걸 해결하려고 매달리는 것보다, 작업 성격에 맞게 갈아 끼우는 게 훨씬 현실적이더라고요.

 

어떤 AI를 쓰든 결국 결과물의 질을 가르는 건 도구 자체가 아니라 어떻게 지시를 주느냐거든요. 도구를 고르기 전에 내 업무에서 반복되는 작업이 무엇인지부터 짚어보는 게 순서라고 봅니다.