Anthropicが現地時間5月28日、フラグシップモデル「Claude Opus 4.8」を発表し、同日から一般提供を開始しました(国内では5月29日に各媒体が一斉報道)。
最大の進化は「誠実さ(integrity)」。自分が書いたコードの欠陥を見落とす確率が前世代Opus 4.7の約4分の1に減り、エージェントコーディングで未実装機能やテスト失敗を報告しそびれる割合は3.7%まで低下。未知のツールに関する質問での「過信による誤答」も10分の1以下に激減しました。コーディングベンチマークSWE-Bench Proでは69.2%を記録し、GPT-5.5(58.6%)やGemini 3.1 Pro(54.2%)を上回ったと報じられています。
価格は通常版が据え置き(入力$5/出力$25・100万トークンあたり)、Fast modeは従来の約3分の1へ値下げ。新機能として、複数のサブエージェントを並行実行して「数週間かかる数十万行のコード移行を数日に短縮する」Dynamic workflowsや、応答速度と精度を選べるEffort制御も追加されました。さらにAnthropicは、全体能力では上位の「Mythos級」モデルを、より強力な安全策を施した上で数週間以内に一般公開する計画も明らかにしています。