Claude Opus 4.5 がリリースされました: 最も強力なコーディング、エージェント、およびコンピュータ使用モデル。トークンの使用が大幅に削減され、価格は Opus 4.1 の 1/3 です。SWE-bench Verified スコアが初めて 80 ポイントを超えました。 コーディング能力におけるパフォーマンスの飛躍的向上:SWE-bench Verifiedテストで80.9%のスコアを達成し、Google Gemini 3 Pro(76.2%)とOpenAI GPT-5.1-Codex-Max(77.9%)を上回りました。さらに驚くべきことに、Anthropic社内のパフォーマンスエンジニアリングテストにおいて、Opus 4.5はすべての応募者を上回るパフォーマンスを達成しました。 • エージェント機能:OSWorldコンピュータ使用テストで66.3%のスコアを達成し、長期にわたる目標指向的な動作を強力に実証しました。社内テスターからは、Opus 4.5は数週間前まではSonnet 4.5では完了できなかったタスクを処理でき、複雑なマルチシステムバグに直面しても自律的に解決策を見つけられるという報告がありました。 • 効率性の向上:これは大きな改善です。長時間実行されるコーディングタスクを処理する際、Opus 4.5 は出力品質を維持または向上させながら、トークンの使用量を最大 65% 削減します。これはコストの削減と応答時間の短縮につながります。 価格設定の改革により、入力トークン100万個あたり5ドル、出力トークン100万個あたり25ドルという価格設定が実現しました。これは、従来のOpus 4.1の15ドル/75ドルと比べて3分の2の削減となります。これにより、Opusレベルの機能が初めて手頃な価格となり、日常的な使用における主要モデルとして活用できるようになります。 製品アップデートは複数のプラットフォームで利用可能です:Opus 4.5は、Claudeアプリケーション、API、そして3つの主要クラウドプラットフォーム(Amazon Bedrock、Google Cloud Vertex AI、Microsoft Azure)で利用可能です。開発者はモデル識別子 claude-opus-4-5-20251101 を使用して呼び出すことができます。 技術革新 · ハイブリッド推論:Opus 4.5は、即時応答モードと拡張思考モードの両方をサポートします。APIユーザーは、「effortパラメータ」を通じて、モデルが応答に費やす計算量を細かく制御し、パフォーマンス、レイテンシ、コストのバランスを実現できます。 • メモリ管理の改善: 長いコンテキスト操作のメモリ管理が大幅に改善され、エージェント シナリオに特に適しました。Opus はマスター エージェントとして機能し、Haiku 駆動型サブエージェントのグループを制御できます。 • セキュリティの強化: このモデルはキューインジェクション攻撃に対する耐性が高まり、ミスアライメント評価における問題のある動作の発生率が低くなったため、これまでで最も安全な Anthropic バージョンとなっています。 市場ポジショニング Opus 4.5は、主にプロのソフトウェアエンジニア、財務アナリスト、コンサルタント、会計士などのナレッジワーカー、そして複雑なエンタープライズタスクや高負荷のインテリジェントエージェントワークフローの処理を必要とするシナリオ向けに設計されています。これは、以前のモデルでは問題を解決できず、パフォーマンスが極めて重要だったシナリオに適したハイエンドモデルです。 業界への影響:今回のリリースは、AI業界における熾烈な競争のさなかに行われました。GoogleのGemini 3はリリースからわずか1週間で既に市場に大きな反響を呼び、SalesforceのCEOでさえChatGPTからGeminiへの移行を表明しました。Opus 4.5のリリースは、この競争におけるリーダーとしての地位を維持しようとするAnthropicの決意と力強さを示すものです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
