Claude Opus 4.6 공개: 1M 컨텍스트·에이전트 작업·코딩 성능을 한 번에 끌어올린 Anthropic의 최신 플래그십
Anthropic이 Claude Opus 4.6을 공개했습니다. 이번 버전은 “코딩 잘하는 모델”을 넘어, 장기(롱-호라이즌) 작업을 끝까지 밀고 가는 에이전트형(Agentic) 성능과 1M 토큰 컨텍스트(베타), 그리고 개발자가 ‘생각의 깊이’를 조절할 수 있는 제어 기능을 앞세워 실무 활용성을 크게 확장한 것이 핵심입니다. 아래에서 핵심 포인트를 실무 관점으로 정리해볼게요.

필자가 느끼기에는 이제 인간이 코딩하는 시대가 끝났습니다. 더 앞도적인 모델이 나오면서 이제는 클로드에 더 의존하게 되었습니다. 그럼 이번에 클로드 오퍼스4.6 가격, 기능이 뭐가 달라졌나 알아봅시다.
1) Claude Opus 4.6 한 줄 요약
- 대규모 코드베이스/문서/스프레드시트/프레젠테이션 같은 “덩치 큰 작업”을 한 번에 다루는 능력이 강화
- 에이전트가 오래 달리면서도(지속성) 흐트러지지 않게(일관성) 작업하도록 개선
- 1M 토큰 컨텍스트(베타)로 장문·복합 작업을 더 안정적으로 처리
2) 무엇이 달라졌나: ‘장기 작업 지속성’과 ‘코딩 실전력’
Anthropic 발표 기준으로 Opus 4.6은 전작 대비 다음이 강화됐습니다.
✅ (1) 계획 능력 & 에이전트 지속성
- 작업을 더 신중하게 계획하고
- 오래 걸리는 에이전트 작업을 더 오래 지속하며
- 여러 도구/단계를 거치는 작업에서 신뢰도 있게 마무리하는 쪽으로 개선됐습니다.
✅ (2) 코드 리뷰·디버깅 실전력
- 단순 생성이 아니라 코드 리뷰/디버깅에서 스스로 실수를 잡아내는 방향으로 강화
- 대규모 코드베이스에서 탐색 → 변경 → 검증 흐름을 더 안정적으로 수행하도록 설계됐다는 점이 강조됩니다.
✅ (3) 1M 토큰 컨텍스트(베타)
- Opus 계열 최초로 1,000,000 토큰 컨텍스트 윈도우를 베타로 지원
- 긴 대화/대형 문서/코드 덩어리에서 흔히 말하는 컨텍스트 품질 저하(‘context rot’) 완화가 주요 목표입니다.
3) 벤치마크: “코딩·지식노동·탐색”에서 상위권
Opus 4.6은 여러 평가에서 선두권 성능을 내세웁니다.
- Terminal-Bench 2.0: 에이전트형 코딩/시스템 작업 평가에서 최고 점수
- Humanity’s Last Exam(HLE): 복합 학문 추론 평가에서 선두권
- GDPval-AA(Elo): 경제적 가치가 높은 지식노동(재무/법률 등) 과제에서 경쟁 모델 대비 우위(Elo 차이로 표현)
- BrowseComp: 온라인에서 “찾기 어려운 정보”를 찾아내는 능력에서도 좋은 성능을 주장
※ 벤치마크는 테스트 환경/세팅에 따라 결과 해석이 달라질 수 있으니, 실제 업무에서는 사내/팀 기준 데이터로 PoC(파일럿 테스트)를 해보는 걸 권합니다.
4) 개발자 제어 기능: ‘생각(추론)’을 조절하는 시대
이번 업데이트가 실무에 의미 있는 이유 중 하나는, 모델 성능만이 아니라 운영 제어가 강화됐기 때문입니다.
✅ Adaptive thinking
- 모델이 상황을 보고 깊게 생각할지(추론을 길게 가져갈지)를 자동으로 조정
✅ /effort 레벨
- low / medium / high(기본) / max로 “생각의 깊이”를 직접 조절
- 쉬운 작업에서 과도한 추론으로 지연·비용이 늘어나는 문제를 줄이기 위한 장치
✅ Context compaction(베타)
- 대화/작업이 길어질수록 오래된 내용을 요약(압축)해 컨텍스트를 정리
- 장기 실행형 에이전트를 만들 때 특히 유용한 방향성
5) 제품 업데이트: Claude Code·Cowork·Excel·PowerPoint
Opus 4.6은 모델 자체뿐 아니라 업무 도구 통합도 전면에 내세웁니다.
- Claude Code의 ‘agent teams’: 여러 에이전트가 병렬로 역할을 나눠 협업
- Cowork: 사용자를 대신해 멀티태스킹으로 일을 처리하는 워크플로우 강조
- Claude in Excel: 비정형 데이터를 구조화하고 다단계 변경을 처리하는 능력 강화
- Claude in PowerPoint(리서치 프리뷰): 템플릿·폰트·레이아웃을 이해해 브랜드 일관성 유지 방향
6) 가격과 접근성: “그대로(대신 긴 컨텍스트는 프리미엄)”
- 모델명(예시): claude-opus-4-6
- 기본 가격은 입력 $5 / 출력 $25 (각 100만 토큰당) 수준으로 유지된다고 안내됩니다.
- 다만 매우 긴 프롬프트(예: 200k 토큰을 초과하는 장문 요청)에는 별도(프리미엄) 요금이 적용될 수 있어, 대형 문서/코드베이스를 통째로 넣는 워크로드라면 비용 설계를 먼저 보는 게 안전합니다.
7) 실무에서 이렇게 쓰면 좋다 (추천 시나리오)
① 대규모 코드베이스 리팩터링/마이그레이션
- “레포 전체 맥락을 읽고” 변경 제안 → 영향 범위 점검 → 리뷰/테스트 전략까지 한 번에
② 코드 리뷰·디버깅 자동화
- PR 요약 + 위험 구간 지적 + 대안 제시 + 테스트 케이스 추천까지
③ 재무/리서치/문서 자동화
- 재무 데이터 정리 → 분석 → 보고서 초안 → 슬라이드 요약 흐름을 한 번에
④ 장기 실행형 에이전트 운영
- /effort로 비용·지연을 관리하면서, context compaction으로 “기억”을 정리
8) 체크포인트: 과도한 추론(Overthinking)과 비용
Opus 4.6은 어려운 문제에서 더 깊게 생각해 결과를 끌어올리는 대신, 쉬운 작업에서도 생각을 길게 가져가면 지연/비용이 늘 수 있습니다.
그래서 운영 팁은 간단합니다.
- 쉬운 작업 → effort를 medium/low로 낮추기
- 어려운 작업/중요한 배포 → effort를 high/max로 올리기
- 긴 대화/장기 에이전트 → compaction 활용
Claude Opus 4.6 가격정보 정리
Claude Opus 4.6을 API로 쓰거나(Developer Platform), 웹/앱 구독으로 쓰려는 분들이 가장 많이 궁금해하는 가격(요금) 구조를 공식 문서 기준으로 정리했습니다.
1) API 기본 요금 (Opus 4.6)
Anthropic의 Claude Developer Platform 기준, Opus 4.6(모델명: claude-opus-4-6)의 기본 요금은 아래와 같습니다.
- 입력(Input): $5 / 100만 토큰(1M tokens)
- 출력(Output): $25 / 100만 토큰(1M tokens)
2) 1M 컨텍스트(베타) + 장문 프리미엄 요금 규칙
Opus 4.6은 1,000,000 토큰 컨텍스트 윈도우(베타)를 지원하지만, 장문 프롬프트에서는 요금이 달라집니다.
✅ 핵심 규칙
- 입력 프롬프트가 200K 토큰을 초과하면, 해당 요청은 long-context 프리미엄 단가가 적용됩니다.
✅ 프리미엄 단가(입력 > 200K인 경우)
- 입력(Input): $10 / 100만 토큰
- 출력(Output): $37.50 / 100만 토큰
운영 팁: 대형 문서/코드베이스를 통째로 넣는 워크로드라면, 200K를 넘는 순간 단가가 올라가므로 프롬프트 분할(Chunking) + 캐시(Prompt caching) 전략을 같이 보는 게 안전합니다.
3) Batch 처리(비동기) 할인
많은 요청을 비동기로 모아 처리하는 Batch API는 비용 절감에 유리합니다.
- Batch는 50% 할인
- Opus 4.6 기준 예시(문서 표 기준):
- Batch 입력: $2.50 / 100만 토큰
- Batch 출력: $12.50 / 100만 토큰
4) Prompt Caching(프롬프트 캐싱) 요금
반복되는 시스템 프롬프트/컨텍스트를 캐싱해 비용을 줄일 수 있습니다.
- 캐시는 일반적으로 Write(저장) / Read(재사용) 단가가 따로 존재
- 문서에서는 캐시를 통해 **비용 절감(최대 90% 수준)**도 강조
- 또한 장문 프리미엄(long-context) 요금과 중첩될 수 있어, 긴 컨텍스트를 다룰 땐 캐시 정책을 함께 설계하는 편이 좋습니다.
참고: 캐시의 상세 단가(Write/Read) 및 TTL(예: 5분/1시간 등)은 플랫폼 가격 문서의 표를 확인하세요.
5) US-only inference(미국 리전 고정 실행) 추가 요금
데이터 거버넌스/규정 준수 등 이유로 미국에서만 추론 실행(US-only inference) 옵션을 선택할 수 있습니다.
- 이 경우 토큰 요금이 1.1배로 적용됩니다.
6) 웹/앱 구독(Claude Pricing)도 함께 참고
Opus 4.6은 API뿐 아니라 Claude 웹/앱 구독 플랜에서도 접근이 안내되어 있습니다.
- Free: $0
- Pro: $17/월(연간 결제 기준) 또는 $20/월(월간)
- Max: 월 $100부터(인당)
- Team:
- Standard seat: $20/석/월(연간) 또는 $25(월간)
- Premium seat: $100/석/월(연간) 또는 $125(월간)
한눈에 보는 요약

- Opus 4.6 기본 API 요금: 입력 $5 / 출력 $25 (각 100만 토큰당)
- 입력 200K 초과 장문 요청: 입력 $10 / 출력 $37.5 (각 100만 토큰당)
- Batch API: 50% 할인(대량/비동기 처리에 유리)
- US-only inference: 1.1배
- Prompt caching: 반복 프롬프트 비용 절감(Write/Read 단가/TTL 문서 확인)

개발자가 코딩하는 시대 끝! “실무형 AI”의 기준을 한 단계 올린 업데이트
Claude Opus 4.6은 긴 컨텍스트 처리(1M 베타), 에이전트형 장기 작업, 코딩/지식노동 성능, 그리고 개발자 제어 기능을 한 번에 강화하면서, 단순 ‘챗봇’이 아니라 업무 실행 파트너에 더 가까운 포지션을 분명히 했습니다.
대형 코드베이스, 복합 문서 작업, 장기 운영형 에이전트가 필요한 팀이라면 PoC로 바로 체감하기 좋은 업그레이드입니다.