アンストロピックは10日、人工知能(AI)モデル業界の状況を揺るがす超高性能モデル2種を同時に発表した。『クロード・フェイブル5』と『クロード・ミトス5』であり、これによりオープンAIとグーグルの次期モデルのロードマップに対する圧力が本格化している。
アンストロピックはこの日、『ミトスクラス』を新設し、既存の最上位モデル群であるオーパスの上に新たな性能階層を追加した。フェイブル5とミトス5は同じ重みを共有する同一の基盤モデルであるが、違いは能力ではなくアクセス制御にある。アンストロピックは、このモデルの能力レベルがサイバーセキュリティや生物学の分野で公開配布時に潜在的なリスクを引き起こす可能性があると判断し、発売方式を二元化した。
フェイブル5はサイバーセキュリティ・生物学関連のクエリをオーパス4.8で回避する安全分類器を搭載し、一般公開された。ミトス5はこのセーフガードを解除したバージョンで、既存の『プロジェクト・グラスウィング』パートナーであるサイバー防御機関とインフラ提供業者にのみ制限的に提供される。アンストロピックが世界を驚かせたミトスモデルを初めて商用サービス段階に引き上げたものである。スペック面では、両モデルはコンテキストウィンドウ100万トークン、最大出力12万8000トークンをサポートする。価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、オーパス4.8の2倍の水準である。
ベンチマーク性能は競合モデルを圧倒している。ソフトウェアエンジニアリング分野の代表指標であるSWE-Bench Proで、フェイブル5は80.3%を記録した。オーパス4.8の69.2%、GPT-5.5の58.6%、ジェミナイ3.1プロの54.2%を大きく上回る。さらに難易度の高いフロンティアコードダイヤモンドセットでも29.3%で、オーパス4.8(13.4%)の2倍以上である。知識業務評価指標であるGDPval-AAではエロ1932点で1位に立った。アンストロピックの核心的な説明は「作業が長く複雑になるほど、競合モデルとの格差が大きくなる」というものである。
実戦性能も注目されている。ストライプの初期テストでは、5000万行規模のコードベースのマイグレーションを1日で完了した。外部研究者のマシュー・ファインズは、自身のフロンティア物理学研究課題において、GPT-5.5が4日かかる作業をフェイブル5が36時間で追いついたと述べた。
今回の発売により、オープンAIとグーグルのロードマップへの圧力が顕在化している。オープンAIは4月23日、当初GPT-6の発売が期待されていたコードネーム『スパード』モデルをGPT-5.5として発表した。事実上、GPT-6のスケジュールを延期し、中間バージョンで市場に対応している。しかし、GPT-5.5のSWE-Bench Pro性能はフェイブル5に21.7ポイント遅れをとっている。現在までにGPT-6に関する公式な発売日程は発表されていない。
グーグルも同様である。先月19日のグーグルI/Oでジェミナイ3.5フラッシュを公開し、ジェミナイオムニの段階的な発売を進めているが、業界ではジェミナイオムニの性能がGPT-5.5レベルにとどまり、ミトスクラスには及ばないと評価されている。
IPO資金競争も変数である。オープンAIとアンストロピックが並んで上場を目指す中、今回のアンストロピックの超高性能モデルの発売は投資家の関心を引き寄せるのに有利に働くと見られる。
業界ではフェイブル5・ミトス5の登場が単なるモデル性能の更新を超え、AI業界の基準点自体を再設定したとの評価が出ている。オーパスの上にミトスクラスという新たな階層を作ったアンストロピックの戦略が、競合他社にロードマップの全面的な再検討を強制しているとの分析である。
* この記事はAIによって翻訳されました。
亜洲日報の記事等を無断で複製、公衆送信 、翻案、配布することは禁じられています。
