
지난 주말, 350쪽짜리 PDF를 통째로 끌어다 놓고 엔터를 눌렀어요. 2분 40초 뒤, 1장과 9장의 모순을 페이지 번호까지 찍어주더라고요.
지난 3월 13일, 클로드 코드(Claude Code)의 1M 토큰 한도가 추가 요금 없이 표준 요금으로 단일화됐습니다. 200K 시절엔 책 한 권을 챕터 단위로 쪼개서 던져야 했는데, 이제는 단행본 5~6권을 한 번에 받아주는 양으로 늘어났어요. 비개발자인 제가 한 주 동안 책·연간 보고서·1년치 카톡을 던져본 결과를 정리해봤습니다.
클로드 코드 1M 토큰, 무료라는 말의 진짜 의미
먼저 짚을 게 있어요. "무료"라는 표현이 도는데, API 호출 자체가 공짜가 됐다는 얘기는 아닙니다. 200K 토큰을 넘기면 붙던 장문 처리 할증(long-context 추가 요금)이 폐지되고, 전 구간이 표준 요금으로 단일화된 것이라는 얘기예요.

소넷 4.6은 1M 토큰당 입력 3달러 / 출력 15달러, 오푸스 4.6은 입력 5달러 / 출력 25달러로 알려져 있습니다. 클로드 코드 사용자는 최신 버전으로 업데이트하면 별도 설정이나 베타 헤더 없이 1M이 자동 적용된다고 해요. 1M 토큰이 어느 정도냐면, 약 75만 단어로 단행본 5~6권 분량(한국어 기준)을 한 번에 던질 수 있는 양입니다. 기존 200K가 1.5권 정도였으니 체감이 확 달라요.
책 한 권 통째로 던져 1장과 9장의 모순 잡기
첫 실험은 평소 모순이 의심되던 350쪽짜리 자기계발서였어요. 200K 시절엔 항상 앞부분을 잊어버려서 "1부 요약 → 2부 요약 → 통합" 식으로 세 번 돌려야 했습니다. 이번엔 PDF 한 개를 그대로 던지고 "1장과 9장에서 같은 개념을 다르게 정의한 자리가 있으면 페이지 번호와 함께 뽑아줘"라고만 시켰어요.

2분 40초 뒤, 1장 47페이지와 9장 281페이지의 정의 차이를 인용문까지 붙여서 짚어주더군요. 60만 토큰 입력에 2천 토큰 출력, 청구 금액은 약 1.83 달러. 무료가 아닌 "할증 없는 정상가"라는 표현이 정확하다고 봅니다.
다만 긴 글 중간부에서 정확도가 떨어지는 'Lost in the Middle' 현상은 여전합니다. 일부러 4장 중간에 끼워둔 사소한 통계 수치(p.142의 "37%")는 잡아내지 못한 경우가 있었어요. 중요한 디테일은 별도로 한 번 더 확인하는 절차를 깔아두는 게 안전합니다.
12개월치 연간 보고서로 분기별 리스크 흐름 분석
두 번째는 부업으로 굴리는 작은 사이드 사업의 월간 보고서 12개와 분기 KPI 시트 4개였어요. 로컬 폴더째로 넘기고 "분기별로 등장한 리스크 키워드와 원인을 표로 정리해줘"라고 시켰습니다.

200K 시절엔 분기별로 쪼개서 요약한 뒤 다시 통합 호출을 돌렸는데, 그러다 보니 1분기 결산과 4분기 결산의 같은 키워드를 서로 다른 단어로 묶는 시점 왜곡이 자주 생겼습니다. 1M 한 번 호출로 끝내니까 그런 왜곡이 사라지고, "2분기 '재고' 문제가 4분기 '캐시플로'로 번진 인과"까지 한 표로 정리됐어요.
처리 시간은 약 2분 30초 안팎. 사내 보고서 같은 민감 자료를 다루신다면 회사 보안 정책(API 키 별도 분리, 외부 전송 가능 자료인지 확인)부터 점검하실 필요가 있어요. 참고로 저는 개인 부업 자료만 다루고, 회사 데이터는 외부 API에 절대 넣지 않는 원칙을 유지하고 있습니다.
1년치 카톡 42만 토큰으로 본 말 습관 패턴
세 번째 실험이 제일 재밌었어요. 친구 한 명에게 양해를 구하고 1년치 카톡 대화 로그(약 42만 토큰)를 통째로 던졌습니다. "오후 11시 이후 단답 비율이 평일 낮 대비 3배 늘었다", "연말로 갈수록 이모지 사용이 절반으로 떨어졌다" 같은 정량적 패턴이 뽑혀 나오네요.

200K 시절엔 월별로 쪼개서 빈도 분석만 가능했지, 1년 추이나 연말·휴가철 계절성을 한 번에 비교하는 건 어려웠습니다. 1M은 단일 호출이라 시점 비교가 자연스럽게 됩니다.
다만 카톡 같은 민감 데이터를 다룰 땐 이름·전화번호·계좌 같은 식별 정보를 마스킹한 뒤 분석하고, 끝나면 원본을 즉시 삭제하는 절차를 미리 짜두셔야 해요. 저는 친구에게 사전 양해를 구한 뒤 → 마스킹 스크립트 한 번 돌리고 → 분석 → 원본 즉시 휴지통 비우기, 이 네 단계를 한 묶음으로 돌리고 있어요.
200K vs 1M 직접 비교, 1M 토큰 안정권은 어디까지?
마지막은 한계 테스트였어요. 한국어 인문서 3권(약 78만 토큰)을 동시에 던지고 "세 책의 상충하는 논점을 인용과 함께 정리"를 시켰습니다. 첫 책과 둘째 책까지는 페이지 인용이 정확했는데, 세 번째 책으로 갈수록 인용 정확도가 눈에 띄게 떨어졌어요. 제 체감으론 60만 토큰 근방이 안정권으로 보입니다.
반면 학술 논문 12편(약 35만 토큰)을 던지고 "교차 인용 관계도를 그려달라"고 한 케이스는 1M 모델이 진가를 보여줬습니다. 200K로는 단순 요약 그 이상이 안 됐는데, 1M 단일 호출에선 어느 논문이 어느 논문을 누적 인용했는지 화살표 관계까지 정리해주더라고요.
흥미로운 건 비용입니다. 1M 단일 호출이 200K 분할 호출 4번보다 오히려 저렴할 때가 있었어요. 매 호출마다 반복되는 시스템 프롬프트·문서 헤더 같은 중복 토큰이 사라지기 때문입니다.
마치며

써보고 나니 프롬프트를 짜는 머릿속 첫 질문이 바뀌었습니다. 예전엔 "이 문서를 어떻게 쪼개서 넣을까"였는데, 이제는 "어디까지 한 번에 보여줘도 정확도가 무너지지 않을까"가 먼저더라고요. 책 한 권은 안정적, 책 세 권 동시 비교는 60만 토큰 근처에서 검증 한 번, 12개월치 시계열은 1M의 본 무대. 이 세 줄이 한 주의 결산이었습니다.
'AI 활용법 > 직장인 활용' 카테고리의 다른 글
| MS 보고서 '한국 생성형 AI 1위'의 진짜 의미, 직장인 5가지 업무 자리로 확인 (0) | 2026.06.07 |
|---|---|
| 챗GPT 개인 금융 도구, 미국 먼저 풀렸어요 — 한국 직장인이 진짜 기다려야 할 이유 3가지 (0) | 2026.06.04 |
| 한국 소버린 AI 5개 컨소시엄 정리 — LG·SKT·업스테이지 1차 통과의 의미 (0) | 2026.06.03 |
| 한국 직장인 AI 활용 51.8%, 미국의 2배 쓰는데 뭐가 다를까 (0) | 2026.06.02 |
| Notion Developer Platform — 5월 풀린 'Workers + External Agent API', 한국 직장인이 만들 수 있는 자동화 워커 5가지 (0) | 2026.06.01 |