Claude Opus 4.6 공개: 1M 컨텍스트·에이전트 작업·코딩 성능을 한 번에 끌어올린 Anthropic의 최신 플래그십

Anthropic이 Claude Opus 4.6을 공개했습니다. 이번 버전은 “코딩 잘하는 모델”을 넘어, 장기(롱-호라이즌) 작업을 끝까지 밀고 가는 에이전트형(Agentic) 성능과 1M 토큰 컨텍스트(베타), 그리고 개발자가 ‘생각의 깊이’를 조절할 수 있는 제어 기능을 앞세워 실무 활용성을 크게 확장한 것이 핵심입니다. 아래에서 핵심 포인트를 실무 관점으로 정리해볼게요.

필자가 느끼기에는 이제 인간이 코딩하는 시대가 끝났습니다. 더 앞도적인 모델이 나오면서 이제는 클로드에 더 의존하게 되었습니다. 그럼 이번에 클로드 오퍼스4.6 가격, 기능이 뭐가 달라졌나 알아봅시다.

1) Claude Opus 4.6 한 줄 요약

대규모 코드베이스/문서/스프레드시트/프레젠테이션 같은 “덩치 큰 작업”을 한 번에 다루는 능력이 강화
에이전트가 오래 달리면서도(지속성) 흐트러지지 않게(일관성) 작업하도록 개선
1M 토큰 컨텍스트(베타)로 장문·복합 작업을 더 안정적으로 처리

2) 무엇이 달라졌나: ‘장기 작업 지속성’과 ‘코딩 실전력’

Anthropic 발표 기준으로 Opus 4.6은 전작 대비 다음이 강화됐습니다.

✅ (1) 계획 능력 & 에이전트 지속성

작업을 더 신중하게 계획하고
오래 걸리는 에이전트 작업을 더 오래 지속하며
여러 도구/단계를 거치는 작업에서 신뢰도 있게 마무리하는 쪽으로 개선됐습니다.

✅ (2) 코드 리뷰·디버깅 실전력

단순 생성이 아니라 코드 리뷰/디버깅에서 스스로 실수를 잡아내는 방향으로 강화
대규모 코드베이스에서 탐색 → 변경 → 검증 흐름을 더 안정적으로 수행하도록 설계됐다는 점이 강조됩니다.

✅ (3) 1M 토큰 컨텍스트(베타)

Opus 계열 최초로 1,000,000 토큰 컨텍스트 윈도우를 베타로 지원
긴 대화/대형 문서/코드 덩어리에서 흔히 말하는 컨텍스트 품질 저하(‘context rot’) 완화가 주요 목표입니다.

3) 벤치마크: “코딩·지식노동·탐색”에서 상위권

Opus 4.6은 여러 평가에서 선두권 성능을 내세웁니다.

Terminal-Bench 2.0: 에이전트형 코딩/시스템 작업 평가에서 최고 점수
Humanity’s Last Exam(HLE): 복합 학문 추론 평가에서 선두권
GDPval-AA(Elo): 경제적 가치가 높은 지식노동(재무/법률 등) 과제에서 경쟁 모델 대비 우위(Elo 차이로 표현)
BrowseComp: 온라인에서 “찾기 어려운 정보”를 찾아내는 능력에서도 좋은 성능을 주장

※ 벤치마크는 테스트 환경/세팅에 따라 결과 해석이 달라질 수 있으니, 실제 업무에서는 사내/팀 기준 데이터로 PoC(파일럿 테스트)를 해보는 걸 권합니다.

4) 개발자 제어 기능: ‘생각(추론)’을 조절하는 시대

이번 업데이트가 실무에 의미 있는 이유 중 하나는, 모델 성능만이 아니라 운영 제어가 강화됐기 때문입니다.

✅ Adaptive thinking

모델이 상황을 보고 깊게 생각할지(추론을 길게 가져갈지)를 자동으로 조정

✅ /effort 레벨

low / medium / high(기본) / max로 “생각의 깊이”를 직접 조절
쉬운 작업에서 과도한 추론으로 지연·비용이 늘어나는 문제를 줄이기 위한 장치

✅ Context compaction(베타)

대화/작업이 길어질수록 오래된 내용을 요약(압축)해 컨텍스트를 정리
장기 실행형 에이전트를 만들 때 특히 유용한 방향성

5) 제품 업데이트: Claude Code·Cowork·Excel·PowerPoint

Opus 4.6은 모델 자체뿐 아니라 업무 도구 통합도 전면에 내세웁니다.

Claude Code의 ‘agent teams’: 여러 에이전트가 병렬로 역할을 나눠 협업
Cowork: 사용자를 대신해 멀티태스킹으로 일을 처리하는 워크플로우 강조
Claude in Excel: 비정형 데이터를 구조화하고 다단계 변경을 처리하는 능력 강화
Claude in PowerPoint(리서치 프리뷰): 템플릿·폰트·레이아웃을 이해해 브랜드 일관성 유지 방향

6) 가격과 접근성: “그대로(대신 긴 컨텍스트는 프리미엄)”

모델명(예시): claude-opus-4-6
기본 가격은 입력 $5 / 출력 $25 (각 100만 토큰당) 수준으로 유지된다고 안내됩니다.
다만 매우 긴 프롬프트(예: 200k 토큰을 초과하는 장문 요청)에는 별도(프리미엄) 요금이 적용될 수 있어, 대형 문서/코드베이스를 통째로 넣는 워크로드라면 비용 설계를 먼저 보는 게 안전합니다.

7) 실무에서 이렇게 쓰면 좋다 (추천 시나리오)

① 대규모 코드베이스 리팩터링/마이그레이션

“레포 전체 맥락을 읽고” 변경 제안 → 영향 범위 점검 → 리뷰/테스트 전략까지 한 번에

② 코드 리뷰·디버깅 자동화

PR 요약 + 위험 구간 지적 + 대안 제시 + 테스트 케이스 추천까지

③ 재무/리서치/문서 자동화

재무 데이터 정리 → 분석 → 보고서 초안 → 슬라이드 요약 흐름을 한 번에

④ 장기 실행형 에이전트 운영

/effort로 비용·지연을 관리하면서, context compaction으로 “기억”을 정리

8) 체크포인트: 과도한 추론(Overthinking)과 비용

Opus 4.6은 어려운 문제에서 더 깊게 생각해 결과를 끌어올리는 대신, 쉬운 작업에서도 생각을 길게 가져가면 지연/비용이 늘 수 있습니다.

그래서 운영 팁은 간단합니다.

쉬운 작업 → effort를 medium/low로 낮추기
어려운 작업/중요한 배포 → effort를 high/max로 올리기
긴 대화/장기 에이전트 → compaction 활용

Claude Opus 4.6 가격정보 정리

Claude Opus 4.6을 API로 쓰거나(Developer Platform), 웹/앱 구독으로 쓰려는 분들이 가장 많이 궁금해하는 가격(요금) 구조를 공식 문서 기준으로 정리했습니다.

1) API 기본 요금 (Opus 4.6)

Anthropic의 Claude Developer Platform 기준, Opus 4.6(모델명: claude-opus-4-6)의 기본 요금은 아래와 같습니다.

입력(Input): $5 / 100만 토큰(1M tokens)
출력(Output): $25 / 100만 토큰(1M tokens)

2) 1M 컨텍스트(베타) + 장문 프리미엄 요금 규칙

Opus 4.6은 1,000,000 토큰 컨텍스트 윈도우(베타)를 지원하지만, 장문 프롬프트에서는 요금이 달라집니다.

✅ 핵심 규칙

입력 프롬프트가 200K 토큰을 초과하면, 해당 요청은 long-context 프리미엄 단가가 적용됩니다.

✅ 프리미엄 단가(입력 > 200K인 경우)

입력(Input): $10 / 100만 토큰
출력(Output): $37.50 / 100만 토큰

운영 팁: 대형 문서/코드베이스를 통째로 넣는 워크로드라면, 200K를 넘는 순간 단가가 올라가므로 프롬프트 분할(Chunking) + 캐시(Prompt caching) 전략을 같이 보는 게 안전합니다.

3) Batch 처리(비동기) 할인

많은 요청을 비동기로 모아 처리하는 Batch API는 비용 절감에 유리합니다.

Batch는 50% 할인
Opus 4.6 기준 예시(문서 표 기준):
- Batch 입력: $2.50 / 100만 토큰
- Batch 출력: $12.50 / 100만 토큰

4) Prompt Caching(프롬프트 캐싱) 요금

반복되는 시스템 프롬프트/컨텍스트를 캐싱해 비용을 줄일 수 있습니다.

캐시는 일반적으로 Write(저장) / Read(재사용) 단가가 따로 존재
문서에서는 캐시를 통해 **비용 절감(최대 90% 수준)**도 강조
또한 장문 프리미엄(long-context) 요금과 중첩될 수 있어, 긴 컨텍스트를 다룰 땐 캐시 정책을 함께 설계하는 편이 좋습니다.

참고: 캐시의 상세 단가(Write/Read) 및 TTL(예: 5분/1시간 등)은 플랫폼 가격 문서의 표를 확인하세요.

5) US-only inference(미국 리전 고정 실행) 추가 요금

데이터 거버넌스/규정 준수 등 이유로 미국에서만 추론 실행(US-only inference) 옵션을 선택할 수 있습니다.

이 경우 토큰 요금이 1.1배로 적용됩니다.

6) 웹/앱 구독(Claude Pricing)도 함께 참고

Opus 4.6은 API뿐 아니라 Claude 웹/앱 구독 플랜에서도 접근이 안내되어 있습니다.

Free: $0
Pro: $17/월(연간 결제 기준) 또는 $20/월(월간)
Max: 월 $100부터(인당)
Team:
- Standard seat: $20/석/월(연간) 또는 $25(월간)
- Premium seat: $100/석/월(연간) 또는 $125(월간)

한눈에 보는 요약

Opus 4.6 기본 API 요금: 입력 $5 / 출력 $25 (각 100만 토큰당)
입력 200K 초과 장문 요청: 입력 $10 / 출력 $37.5 (각 100만 토큰당)
Batch API: 50% 할인(대량/비동기 처리에 유리)
US-only inference: 1.1배
Prompt caching: 반복 프롬프트 비용 절감(Write/Read 단가/TTL 문서 확인)

개발자가 코딩하는 시대 끝! “실무형 AI”의 기준을 한 단계 올린 업데이트

Claude Opus 4.6은 긴 컨텍스트 처리(1M 베타), 에이전트형 장기 작업, 코딩/지식노동 성능, 그리고 개발자 제어 기능을 한 번에 강화하면서, 단순 ‘챗봇’이 아니라 업무 실행 파트너에 더 가까운 포지션을 분명히 했습니다.

대형 코드베이스, 복합 문서 작업, 장기 운영형 에이전트가 필요한 팀이라면 PoC로 바로 체감하기 좋은 업그레이드입니다.

엔돌슨의 IT이야기

클로드 오퍼스 4.6 공개 달라진점 요금제 가격: 에이전트 작업·코딩 성능을 한 번에 끌어올린 Anthropic의 최신 플래그십