何が起きたか
Anthropic は3月13日、**Claude Opus 4.6 と Sonnet 4.6 の100万トークンコンテキスト窓を一般提供(GA)**にしたと公式ブログで発表した。
これまでアーリーアクセスやAPI限定だった100万トークン(約75万語)の入力が、標準料金のまま全ユーザーに開放される。Opus 4.6は$5/$25、Sonnet 4.6は$3/$15(いずれも100万トークンあたり)で、長文コンテキストのプレミアム課金は撤廃された。
何が変わるか
RAG パイプラインの簡素化
大量のドキュメントを扱うアプリケーションでは、これまでチャンキング → 検索 → 合成という RAG パイプラインが必須だった。100万トークンのネイティブウィンドウがあれば、ドキュメント全体をそのまま投入して質問できる。パイプラインの複雑さ、レイテンシ、「中間部分の見落とし」問題を大幅に削減できる。
コードベース全体の把握
Claude Code のようなコーディングエージェントでは、リポジトリ全体のコンテキストを一度に渡せるようになる。Cursor フォーラムでもすでに「いつ反映されるか」という議論が始まっており、AI コーディングツールへの波及効果は大きい。
競合との比較
| モデル | 最大コンテキスト | 料金体系 |
|---|---|---|
| Claude Opus 4.6 | 100万トークン | 標準料金 |
| Claude Sonnet 4.6 | 100万トークン | 標準料金 |
| Gemini 1.5 Pro | 100万トークン | 別料金あり |
| GPT-4 Turbo | 12.8万トークン | — |
Google Gemini 1.5 Pro も100万トークンに対応しているが、Anthropic は追加料金なしで提供する点で差別化している。
個人開発者への示唆
- 法的文書・技術仕様書の一括分析アプリを、RAG なしで構築できる可能性が広がった
- Claude Code を使ったリポジトリ全体のリファクタリングがより実用的に
- ただし、100万トークンのリクエストはコスト面で注意が必要。Opus 4.6で出力込み$30相当になるケースもある
- 「中間部分の見落とし」が本当に解消されたかは、独立ベンチマークの結果を待ちたい
一次ソース: 1M context is now generally available for Opus 4.6 and Sonnet 4.6 — Claude Blog
💡 エキスパートコメント
AI Solo Craft 編集部のエキスパートが、今日のニュースを専門視点で読み解きます。
100万トークンが使えると、ユーザーに「全部投げていい」という体験を提供できる。これはUX的に大きい変化。ファイルアップロードのUIも「1ファイルずつ」から「フォルダごとドロップ」に変わるはず。ただ、レスポンス待ち時間が長くなるならプログレス表示の設計が重要になる。
Anthropicが追加料金なしで出してきたのは、Googleとの価格競争の側面がある。個人開発者にとっては嬉しいが、この価格が持続可能かは注視が必要。RAG不要のシンプルなアーキテクチャで差別化できるプロダクトを今のうちに作れると、先行者優位が取れそう。
📋 デスクコメント
エンジニアが指摘するコスト面の検証と、マネージャーが言う「シンプルなアーキテクチャで先行者優位」は両立する。まず小さなプロトタイプでRAGなし全文投入を試し、コスト・精度・速度を計測してみよう。デザイナーのUX視点も含め、「ユーザーが何も考えずに全部渡せる」体験が作れたら、それは明確な競合優位になる。
追加料金なしは大きい。ただしTransformerの注意機構はシーケンス長の2乗でコスト増なので、Anthropicが内部でどう最適化しているかは気になる。個人開発者としては、RAGパイプラインを捨てる前に「本当に全文投入が最適か」をコスト面で検証すべき。10万トークン以下なら従来のRAGの方が安い場合もある。