AI 도구 리뷰/기타 AI 도구

'한 채팅에서 다 끝낸다'는 Perplexity Computer, 진짜 가능할까요

피드너 2026. 5. 26. 18:00

 

지난달에 한 해외 매체가 10일 테스트한 결과, 라이브 DB 기사 4,000개가 통째로 날아갔다고 합니다. URL 21,145개는 구글에서 색인이 빠졌구요. 'AI가 알아서 일을 끝낸다'는 약속의 뒷면입니다.

 

마케팅 카피만 보면 19개 모델이 한 채팅 안에서 동시에 돌아가서 월 단위로 일을 자율 수행한다는 그림인데, 막상 뜯어보면 그렇게 깔끔하지가 않더라구요. 어디까지가 진짜고 어디부터가 UX 트릭인지 한 번 정리해봤어요.

 

Perplexity Computer가 약속한 '한 채팅' 마케팅 뜯어보기

Perplexity가 2월 말에 띄운 컴퓨터(Computer)는 단일 채팅창에서 리서치·코딩·이미지·비디오 작업을 한꺼번에 처리한다는 컨셉이에요. 처음엔 Max 구독자($200/월) 한정으로 풀렸다가, 이후 엔터프라이즈 플랜(Enterprise Max, $325/seat/월)까지 확장됐습니다.

 

핵심 키워드는 '비동기 병렬'과 '월 단위 자율 실행'이지요. 사용자가 한 줄 던지면 백그라운드에서 여러 인스턴스가 동시에 돌고, 며칠씩 걸리는 작업도 알아서 끝내준다는 그림입니다.

 

근데 '한 채팅'이라는 표현이 좀 묘한 게, 실제로는 백그라운드 비동기 실행이라서 단일 컨텍스트 안에서 모든 게 흐르는 게 아니거든요. 채팅창은 결과를 한곳에 모아 보여주는 대시보드에 가깝다고 보시면 되겠습니다. UX 메타포지 기술적 단일성이 아니에요.

 

19개 모델 정체, Claude Opus 4.6이 끌고 가는 외부 API 라우터

여기가 제일 흥미로운 지점인데요. Perplexity는 자체 모델 회사가 아니라, 경쟁사 API를 묶어서 라우팅하는 회사로 자리가 옮겨갔습니다.

 

공개된 구성만 정리하면 이렇습니다.

  • 메인 추론 오케스트레이터: 앤스로픽(Anthropic)의 Claude Opus 4.6
  • 심층 리서치: 제미나이(Gemini)
  • 이미지 생성: Nano Banana
  • 비디오 생성: Veo 3.1
  • 빠르고 가벼운 작업: Grok
  • 장문·광범위 검색: 챗GPT 5.2

나머지 13개는 공식 리스트가 비공개로 알려져 있어요. 즉 외부 모델을 상황별로 호출하는 라우터 구조인데, 모델 안에 있는 MoE(Mixture of Experts) 구조를 모델 바깥에서 다시 만든 형태에 가깝습니다.

 

참고로 생성 라인업은 최근에 또 한 번 갈아엎혔는데, Perplexity가 기본 생성 모델을 Nano Banana Pro / Sora 2 Pro로 교체한다고 공식 채널에서 발표했어요. 그러니까 이 글을 쓰는 5월 시점 기준으로는 이미지·비디오 쪽은 새 라인업으로 보시는 게 맞습니다.

 

 

RioTimes 라이브 DB에서 기사 4,000개가 날아간 10일

도입에서 짧게 언급한 케이스가 가장 뼈아픈 사례입니다. The Rio Times가 4월 중순에 발행한 자체 리뷰("Perplexity Computer Field Test: Ten Days of Destruction")에 따르면, 두 개 독립 사이트에 컴퓨터를 라이브 DB로 붙여서 합산 10일 동안 자동 운영을 맡긴 로그가 있었다고 해요. 한쪽은 다국어 뉴스 사이트, 다른 쪽은 WordPress 기반 일간지였습니다.

 

큰 사고는 더 큰 사이트에서 났는데, 라이브 서버에서 스테이징 서버로 기사 4,000여 개를 '복사'하라고 시켰더니 에이전트가 '이동'시켜버렸다고 합니다. 라이브 DB에서 기사가 통째로 사라진 거지요.

 

결과는 라이브 기사 4,000개 이상 삭제, URL 21,145개 구글 deindex. 거기다 한 작업 사이클에 크레딧 10,000을 태웠다고 합니다. 1만 크레딧이 어느 정도냐면, 뒤에서 다시 얘기하겠지만 Max 플랜의 월 할당량 전체에 해당하는 양이에요. 한 사이클에 한 달치를 다 써버린 셈이지요.

 

자율 실행의 함정이 여기서 드러납니다. 비가역적 작업(삭제·발행·결제 등)을 사람 확인 없이 맡기면, 에이전트가 잘못된 전제를 잡았을 때 멈출 사람이 없네요. 요즘 흔히 말하는 HITL(Human-in-the-Loop) 게이트나 Task Budgets 같은 안전장치를 끼우지 않은 채 운영 환경에 그대로 붙이기엔 아직 이른 단계라고 봅니다.

 

 

챗GPT 5.2 한 개로 안 되던 일, 멀티 에이전트 오케스트레이션이 메우는 자리

그럼 단일 모델로는 안 되는데 컴퓨터로는 되는 게 뭐냐, 이 질문이 남죠.

 

진짜 차별점은 모델 개수가 아니라 멀티 에이전트 오케스트레이션 학습 방식이거든요. Perplexity가 19개 모델을 구체적으로 어떻게 조율하는지 공식 학술 자료를 따로 공개하진 않았지만, 비슷한 아이디어로 최근 Moonshot AI가 자사 Kimi K2.5 기술 보고서에서 제안한 PARL(Parallel-Agent Reinforcement Learning) 같은 학습 패러다임이 학계와 업계에서 회자되고 있어요. 여러 에이전트를 동시에 돌리면서 누가 어떤 작업을 맡고 결과를 어떻게 합칠지를 학습으로 조율한다는 아이디어입니다.

 

같은 작업을 챗GPT 5.2 같은 단일 모델에 던졌을 때보다, 작업 단계를 쪼개서 다른 모델에 분산하면 토큰 비용은 낮추고 품질은 올릴 수 있다는 게 Perplexity의 주장입니다. 다만 챗GPT 단일 모델 자체가 에이전트 기능을 내장하는 방향으로 진화하고 있는 상황이라, 1~2년 뒤에도 외부 라우터 방식이 살아남을지는 좀 회의적으로 봅니다.

 

 

Perplexity Max $200/월 ROI 계산법

마지막으로 돈 얘기예요. Perplexity Max는 정액 $200/월인데, 여기에 월 10,000 크레딧이 포함되는 구조입니다. 문제는 컴퓨터 한 작업 사이클이 이 월 할당량 전체를 한 번에 태울 수 있다는 거예요. 앞서 RioTimes 케이스가 정확히 그 시나리오였구요. 정액제처럼 보여도 실제로는 한 번의 폭주로 한 달치가 증발할 수 있다는 얘기지요.

 

개인적으로는 두 가지 경우에만 ROI가 나온다고 봅니다. 리서치·콘텐츠 생성이 주력이고 멀티스텝 분석·실험을 자주 돌리는 1인 사용자이거나, 실패해도 비가역적 손실이 없는 샌드박스 작업(리포트 초안·이미지 시안·시장 조사 등)을 자주 하는 경우지요.

 

반대로 실서비스 코드, 라이브 DB, 결제 시스템, 메일 자동 발송처럼 한 번 잘못 나가면 되돌릴 수 없는 자리에는 컴퓨터 자율 실행을 붙이지 않는 게 안전합니다. RioTimes처럼 며칠 만에 회사 자산 절반이 날아갈 수 있어요. Max를 끊더라도 자율 실행 권한은 단계적으로 풀고, OAuth 토큰 관리와 크레딧 상한(Task Budgets) 설정을 먼저 잡아두시는 편이 낫습니다.

 

저 같은 경우엔 컴퓨터 기능은 리서치·초안 생성 정도로만 쓰고, 실제 코드 머지나 DB 작업은 클로드 코드(Claude Code) 로컬 실행으로 분리해두고 있어요. 초안 라인까지는 컴퓨터에 맡기고, 머지나 배포처럼 되돌릴 수 없는 라인은 사람 손에 남겨두는 방식이지요.

 

19개 모델이 한 화면에 모인다는 카피보다, 그 뒤에서 백그라운드로 무엇이 비가역적으로 실행되는지를 먼저 보는 게 컴퓨터를 쓰는 첫 단계더라구요.