IPOを控えたアンストロピック、最上級AIを発表…リスクの高い質問は下位モデルが処理

企業公開（IPO）を準備中のアンストロピックは、最上級の人工知能（AI）モデルを一般利用者に公開した。一般用モデルには高リスクの質問をブロックする装置が適用されており、別途のセキュリティ検証用モデルは承認された機関にのみ提供される。

アンストロピックは9日（現地時間）、新しいAIモデル「クロード・フェイブル5」と「クロード・ミトス5」を発表した。フェイブル5は一般利用者向けのモデルであり、ミトス5はセキュリティ協力プログラムであるプロジェクト・グラスウィングなどを通じて検証された機関に制限的に提供される。

両モデルは同じ基盤モデルを使用しているが、安全装置の適用の有無に違いがある。フェイブル5は、サイバーセキュリティや生物・化学などの悪用の可能性がある質問が入ると、直接回答せずに以前の最上級モデルであるクロード・オーパス4.8が代わりに処理する。この事実は利用者に通知される。

制限対象には、競合AIモデルの機能を抽出する無断「蒸留」の疑いがある質問も含まれる。アンストロピックは、この安全装置が平均して全セッションの5%未満で作動すると明らかにした。無害なリクエストが一部ブロックされる可能性があるが、安全なリリースのために保守的に設定されたと説明している。

アンストロピックはフェイブル5とミトス5を、既存のオーパスグレードよりも高い「ミトス級」モデルとして分類した。ミトス5はサイバーセキュリティ評価であるエクスプロイトベンチで78%を記録した。オープンAIのGPT-5.5は34%、アンストロピックのオーパス4.8は40%、先に公開されたミトス試験版モデルは69%であった。

博士級知識評価である「人類の最後の試験」では、ウェブ検索や計算機などの外部ツールなしで59%を記録した。これはミトス試験版の56.8%よりも高かった。ターミナル環境コーディング評価であるターミナル・ベンチ2.1では88%で、GPT-5.5の83.4%を上回った。

一般コーディング能力を測定するSWE-ベンチプロでは80.3%を記録した。GPT-5.5は58.6%、グーグルのジェミナイ3.1プロは54.2%であった。知識業務評価であるGDPval-AAでも1932点を記録し、GPT-5.5とジェミナイ3.1プロよりも高いスコアを出した。

アンストロピックはフェイブル5とミトス5で発生する使用データを30日間保存する。このデータは新しい攻撃の検出や誤検知の識別に使用される。

フェイブル5はこの日から使用可能であり、22日までは既存の有料購読者に追加費用なしで提供される。23日からは別途使用クレジットが必要となる。アンストロピックはサーバー容量が十分に確保され次第、フェイブル5を再び一般購読料金プランに含める計画である。

* この記事はAIによって翻訳されました。

亜洲日報の記事等を無断で複製、公衆送信、翻案、配布することは禁じられています。