Claude Opus 4.7がやってきた。前バージョンから何が変わったのか?

claude

この記事について

2026年4月16日、AnthropicがClaudeの最新モデル「Opus 4.7」をリリースしました。

「また新しいモデル?」と思った方もいるかもしれません。ここ最近、生成AIのバージョンアップは本当に早くて、追いかけるだけで一苦労です。しかし今回のOpus 4.7は、地味に見えて実は現場の使い方を変える可能性がある、なかなか見逃せないアップデートになっています。

この記事では、AIにあまり詳しくない方でも「何が変わったのか」「自分の仕事にどう影響するのか」がわかるように、公式発表の内容をかみ砕いて紹介していきます。技術者向けの細かい話もありますが、できるだけ日常的な言葉で説明するので、最後まで付き合っていただけると嬉しいです。

まず、Claudeって何でしたっけ?

本題に入る前に、念のため簡単に整理しておきます。

ClaudeはAnthropicという会社が開発している生成AIです。ChatGPTやGeminiと同じカテゴリの、いわゆる対話型AIですね。ChatGPTが派手な存在感で世の中に広まった一方で、Claudeは「丁寧で賢い」「長文や複雑な指示に強い」「コードがうまい」といった評価を得て、とくに開発者やビジネス用途で静かに人気を集めてきました。

Claudeのモデルには大小さまざまなラインナップがあります。

モデル名キャラクター
Opus一番賢くて、一番じっくり考えるタイプ
Sonnet賢さと速さのバランス型
Haiku軽くて速い、コスト重視タイプ

今回のOpus 4.7は、この中の最上位クラス「Opus」シリーズの最新版です。

全体像:今回のアップデートを3行でまとめると

詳しい話に入る前に、ざっくりの全体像を先に書いておきます。

Opus 4.7を一言で表すなら、「頼れる相棒度が上がった」というのが近い気がします。もう少し分解すると、次の三つです。

  1. 難しい開発タスクを、見張ってなくてもちゃんと最後までやりきるようになった
  2. 画像の細かいところまで読めるようになった
  3. 指示を律儀に守るようになった(良くも悪くも)

それぞれ見ていきましょう。

変化その1:難しいコーディングで「任せきり」ができるようになった

「肩越しに監視」しなくてよくなる

Opus 4.7のアップデートのなかで、もっともインパクトが大きいのがコーディング能力の向上です。Anthropicが発表の中で強調しているのは、「これまでは人間が横について監督する必要があった難しい作業を、Opus 4.7には任せて大丈夫になった」という点です。

AIエージェントで開発をしたことがある人なら、この意味がすぐわかると思います。従来のモデルは、短いコードを書かせるぶんには優秀でも、長時間の作業になると途中で迷子になったり、指示の一部を忘れたり、自己満足で作業を終わらせたりすることがありました。「完璧です!」と自信満々に報告してくる成果物を見て、「あれ、肝心のところが抜けてる…」とがっくりする経験、誰にでもあると思います。

Opus 4.7では、この「最後まで粘り強く、正確にやりきる」能力が上がっています。具体的には次のような変化です。

  • 数時間レベルの長い作業でも一貫性が崩れない
  • 指示の細部まで読み込んで、見落としが減った
  • 自分の出力が本当に正しいか、自力で検証する手段を考え出せる

最後のポイントは特に興味深いです。たとえばコードを書いたあとに、自分でテストを書いて実行し、おかしなところがないか確認してから「できました」と報告する、というようなことができるようになっています。

どれくらい強くなったのか

Anthropicが公開しているベンチマーク結果を見ると、有名な指標「SWE-bench Verified」などで前バージョンのOpus 4.6を上回るスコアが出ています。とくに難易度が高い問題での伸びが顕著とのこと。

これは実感値としても納得できる変化だと思います。易しい問題は前のモデルでも解けていたので、そこで差がついても劇的な違いは感じにくい。でも「これはさすがに無理だろう」というレベルのタスクが解けるようになると、体感としてかなり大きな進歩になります。

変化その2:画像を「細かいところまで」見られるようになった

解像度が3倍以上に跳ね上がった

Opus 4.7のもう一つの大きな進化が、画像の理解能力です。公式発表によれば、受け取れる画像のサイズが**最大で長辺2,576ピクセル(約3.75メガピクセル)**まで拡大されました。これは従来のClaudeモデルの3倍以上です。

「画像が大きく扱えて何が嬉しいの?」と思うかもしれませんが、これは地味ながら結構な変化です。たとえばこんなシーンで効いてきます。

  • ブラウザを操作するAIエージェントが、Webページのスクショから小さなボタンや細い文字を読み取る
  • 学術論文の複雑なグラフから数値を正確に抽出する
  • UIデザインのカンプを渡して「これと同じ画面を実装して」と頼む
  • 複雑なフロー図や組織図を解釈させる

これまでは「画像を渡したのに、細かい部分が潰れていて誤読される」という悩みがかなりありました。そこが解消されると、画像をはさんだワークフローの精度が一段上がります。

ちなみにこれはAPIのパラメータではなくモデル側の仕様変更なので、画像を渡せば自動的に高解像度で処理されます。特別な設定は不要です。ただし、その分画像のトークン消費が増えるので、そこまでの解像度が要らない用途なら、事前に縮小してから渡すのが節約のコツです。

試しに書いてみるとこんな感じ

PythonのSDKで画像を渡すサンプルを置いておきます。モデル名に claude-opus-4-7 を指定するだけで、あとは普段どおりの書き方です。

import anthropic
import base64

# 画像ファイルを読み込んでBase64に変換
with open("diagram.png", "rb") as f:
    image_data = base64.standard_b64encode(f.read()).decode("utf-8")

client = anthropic.Anthropic(api_key="<YOUR_API_KEY>")

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=2048,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": "image/png",
                        "data": image_data,
                    },
                },
                {
                    "type": "text",
                    "text": "この図に書かれている数値を、表形式で抜き出してください。",
                },
            ],
        }
    ],
)

print(message.content[0].text)

変化その3:指示を「言葉通り」に受け取るようになった

真面目すぎるくらい真面目

これは表現がむずかしいのですが、Opus 4.7は指示を字義通りに受け取って実行する傾向が強くなっています。

一見すると「え、それはいいことでは?」と思いますよね。確かに、指示をちゃんと守ってくれるのは良いことです。でも、ここには裏側があります。

従来のモデルは、指示を「ゆるく解釈して良きに計らう」部分がありました。ユーザーが本当には望んでいなさそうなことは勝手にスルーしてくれたり、矛盾した指示があっても空気を読んで調整してくれたり。

Opus 4.7はこれをやらなくなった、というのが大きな変化です。言われたことを、言われた通りに、全部やろうとします。

だから既存のプロンプトは要見直し

Anthropic自身も公式に警告していますが、旧モデル向けに作られたプロンプトが、Opus 4.7では意図と違う結果を生むことがあります。

たとえば、プロンプトの中に「ついでに〇〇もお願いね」みたいな軽いノリで書いた指示があったとします。旧モデルはそれを「状況に応じてやる」くらいに解釈していたかもしれません。でもOpus 4.7は真正面から受け取って、毎回律儀に実行しようとします。結果として、出力が冗長になったり、不要な処理が走ったりする。

運用中のシステムで置き換えを検討している方は、次の観点で既存プロンプトを一度棚卸しすることをおすすめします。

  • プロンプト内に矛盾した指示が埋まっていないか
  • 「良きに計らって」前提で書かれている暗黙の部分はないか
  • 制約条件に優先順位をつけているか

変化その4:ファイルに書いたメモを活用するのが上手くなった

ここはマニアックな話ですが、エージェント開発に関わる方には重要なポイントです。

AIモデルは基本的に、セッションをまたぐと記憶を持ちません。しかし「ファイルに書いて、後で読み直す」という方法で、擬似的に記憶を持たせることができます。Opus 4.7は、このファイルベースのメモリ運用が上手くなりました。

具体的には、決定事項を DECISIONS.md にメモしたり、残タスクを TODO.md に書き出したり、実験結果を EXPERIMENTS.log に追記したりしながら作業を進め、必要なときに自分で読み返してコンテキストを補う、という動きが自然にできるようになっています。

これができると、長期プロジェクトや、複数セッションにまたがる開発作業でAIを活かしやすくなります。

新しい機能たち

ここからは、Opus 4.7のリリースと同時に追加された、周辺機能について触れていきます。

「xhigh」という新しいギア

Claudeには、どれくらい深く考えるかを調整する「エフォートレベル」という概念があります。軽く答えるか、じっくり考えるか、のツマミです。

これまでは low medium high max の4段階だったのですが、Opus 4.7で highmax の間に xhigh が追加されました。「高いけど最高ではない、そのちょい上」くらいの位置づけです。

コーディングのツール「Claude Code」では、Opus 4.7のリリースに合わせてデフォルトのエフォートレベルが xhigh に引き上げられました。全プランで適用されます。

Anthropicは、コーディングやエージェント用途では highxhigh から試すことを推奨しています。簡単なタスクで max を使うとトークンの無駄になるので、用途次第で使い分けるのがコツですね。

タスク予算(Task Budgets)

開発者向けAPIに、タスク予算という機能がパブリックベータで提供されました。

これは、Claudeが自律的に長い仕事をこなすときに、「トータルでこれくらいのトークン量でお願い」と予算上限を指示できる仕組みです。

エージェントを自由に動かすと、試行錯誤しているうちに想定以上のトークンを消費することがあります。タスク予算があれば、「お金が限られた状況なら、優先度の高いところからやろう」という判断が促されます。実運用のコスト管理では結構ありがたい機能です。

/ultrareview という「厳しいレビュアー」

Claude Codeに /ultrareview という新しいスラッシュコマンドが追加されました。これは、コードの変更内容を徹底的にレビューするための専用セッションです。

イメージとしては、「ベテランエンジニアが隣に座って、厳しめにコードレビューしてくれる」機能です。バグの可能性、設計上の懸念、セキュリティ面の見落とし、そういったものを系統立てて指摘してくれます。

ProプランとMaxプランのユーザーには、お試しとして3回分の無料利用が付いているので、気になる方は試してみるといいと思います。

claude
> /ultrareview

これだけで起動します。プルリクを出す前の最終チェックとしてかなり便利です。

Auto Mode、Maxユーザーにも開放

Claude Codeの Auto Mode が、Maxプランユーザーにも使えるようになりました。

これはClaudeが一定の範囲で自分の判断で作業を進めてくれるモードです。毎回「これやっていい?」「あれやっていい?」と聞かれないので、長いタスクが中断なく進みます。

似たような機能として「すべての許可をスキップする」オプション(いわゆる --dangerously-skip-permissions)がありますが、Auto ModeはClaudeが危険性を判断しながら動くので、その中間くらいの安全性です。完全に放置するほどではないけれど、いちいち確認されるのは鬱陶しい、という場合にちょうどよい選択肢になります。

とはいえ、本番環境で使うのはまだ心配なので、サンドボックス環境で試すとか、Gitでロールバックできる状態で使うとか、安全策を取ったうえで活用するのがおすすめです。

Opus 4.6から乗り換える場合の注意点

料金は変わらない

まず朗報から。Opus 4.7の料金は前世代のOpus 4.6と同じです。

種類料金
入力100万トークンあたり 5ドル
出力100万トークンあたり 25ドル

性能アップで価格据え置きなので、コストパフォーマンスは単純に上がっています。ただし次に書くように、同じ仕事でも使うトークン数が変わる可能性があるので、そこは実測が必要です。

トークン数は増える傾向

Opus 4.7には、トークン消費に影響する変更が2つ入っています。

1つめは、新しいトークナイザーの採用です。

トークナイザーとは、文字列をAIが処理しやすい小さな単位(トークン)に分解する仕組みのこと。Opus 4.7はこれが更新されており、テキスト処理の品質は上がりました。一方で、同じ入力でも、これまでより1.0〜1.35倍くらいのトークン数になる場合があります。 日本語や中国語などのマルチバイト文字、専門用語が多いテキストでは影響が大きく出る傾向です。

2つめは、高いエフォートレベルでより多く考えるようになったことです。

Opus 4.7は、特にエージェント的な作業の後半のターンで、これまでより多く思考を回すようになりました。これで難問での信頼性は上がりましたが、その分、出力トークンも増えます。

結果として、同じ仕事を同じ設定で回すと、支払いが少し増える可能性があります。気になる方は次のような対策が有効です。

対策やり方
エフォートレベルを下げるeffort パラメータで medium などを指定
タスク予算を設定するtask_budgets 機能で上限を設定
簡潔に答えさせるプロンプトで「短く答えて」と明示する
画像を事前縮小する長辺2576px以下にリサイズしてから送る

ただし公式の社内検証では、トータルで見ると同じ仕事に必要なトークン量はむしろ改善しているケースが多いとのこと。つまり「1回あたり増えても、効率が上がったから総合的には下がる」という可能性もあります。自分のユースケースで計測するのが一番確実です。

乗り換えの手順イメージ

既存のシステムをOpus 4.7に切り替えるなら、次のような流れがおすすめです。

  1. プロンプトを棚卸しし、曖昧な表現や旧モデル前提の書き方を書き直す
  2. 実トラフィックの一部だけをOpus 4.7に流して、挙動を比較する
  3. エフォートレベルを調整(必要ならmediumに落とす、または xhigh に上げる)
  4. タスク予算や請求額のモニタリングを強化する
  5. 問題なければ全体を切り替える

どこで使えるのか

Opus 4.7は、すでに主要なClaude関連プラットフォームで利用可能になっています。

  • Claude.ai(ブラウザ、デスクトップアプリ、モバイルアプリ):Pro/Max/Team/Enterprise プラン
  • Claude API:モデル名 claude-opus-4-7 で呼び出し
  • Amazon Bedrock:AWS経由で利用
  • Google Cloud Vertex AI:GCP経由で利用
  • Microsoft Foundry:Azure経由で利用

自社がすでに使っているクラウド環境に合わせて選べます。

シンプルなAPI呼び出しの例はこんな感じです。

import anthropic

client = anthropic.Anthropic(api_key="<YOUR_API_KEY>")

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Pythonで、ポート8080で動くシンプルなHTTPサーバーを書いてください。ルートパスで『Hello, World!』を返すものでお願いします。"
        }
    ],
)

print(message.content[0].text)

モデル名の claude-opus-4-7 さえ指定すれば、あとは今までどおりです。

安全性についての話

全体としてはOpus 4.6と同等レベル

Anthropicは発表のなかで、Opus 4.7の安全性評価についても詳しく触れています。ざっくり言うと、Opus 4.6と同じくらいの安全性プロファイルです。

良くなった点としては、以下のような項目があります。

  • 正直さ(ハルシネーションを減らす、正確に答える)
  • プロンプトインジェクション攻撃への耐性

一方で少し後退した項目もあります。たとえば「規制物質に関して、必要以上に詳しい害軽減アドバイスを出してしまう傾向」などです。完璧ではない、と正直に開示されています。

Anthropicの評価によると、Opus 4.7は「おおむね適切にアラインされていて信頼できるが、完全に理想的とまでは言えない」とのこと。100点満点ではないけれど、実用レベルでは問題ないという位置づけですね。

サイバーセキュリティ関連の取り扱い

先ほど少し触れた「Project Glasswing」の話に戻ります。Anthropicは、AIの高度な能力がサイバー攻撃に悪用されるリスクを真剣に捉えていて、この文脈でいくつかの対応策を入れています。

Opus 4.7には、サイバー攻撃に悪用されそうな要求を自動的に検出してブロックするセーフガードが組み込まれています。これは学習段階でサイバー能力を選択的に抑える実験も行われたうえで、リリースされた初のモデルです。

ただし、脆弱性調査やペネトレーションテストなど、正当なセキュリティ業務にOpus 4.7を使いたい人たちのために、「Cyber Verification Program」という新しい申請制度も用意されています。該当する業務の方は、申請すれば検証プロセスを経て利用できるようになります。

こんな場面で使うと効く

ここまで機能の話ばかりしてきましたが、最後に実務でOpus 4.7が刺さるシーンを具体的に挙げておきます。

大規模なリファクタリング

従来のAIエージェントが苦手としていた、「大きなコードベースに対する一貫した作業」が、かなり現実的になりました。たとえば「非推奨APIを全箇所で置き換える」「命名規則を全体に適用し直す」「古いテストフレームワークから新しいものに乗り換える」といった作業を、指示さえ明確なら粘り強くこなしてくれます。

UIデザインのコード化

高解像度画像のおかげで、Figmaのスクリーンショットを見せて「これを実装して」と頼んだときの再現度が上がっています。パディングの細部、フォントサイズ、配色、そういった部分までちゃんと読めるので、修正の往復回数が減ります。

長時間の自動作業

Auto ModeとxhighエフォートとXの組み合わせで、「夜間にまとめて回しておく」系のタスクが現実的になりました。GitHubのIssueを一つずつ調査してレポート化する、といった使い方も十分に実用レベルです。

ビジネス分析やアナリスト業務

Opus 4.7は金融分析ベンチマーク「Finance Agent」でトップクラスのスコアを出しており、社内テストでも「Opus 4.6よりもできるアナリスト」と評価されています。財務モデルの構築、プレゼン資料の作成、複数の分析タスクの連携、このあたりで威力を発揮します。金融だけでなく、法務、コンサル、経営企画といった「知識集約型」の業務全般に効く進化です。

密度の高い資料のデジタル化

フローチャート、組織図、論文の図表、手書きメモ、スキャンされた契約書。こういった、視覚的には情報量が多いけどAIが読み解くのは難しかった資料が、より正確に扱えるようになります。

プロンプトを書くときに意識したいこと

Opus 4.7時代のプロンプトで意識すべきポイントを、最後にまとめておきます。

指示を具体的に書く

指示追従性が上がった分、曖昧なプロンプトは曖昧な結果を生みます。たとえばこう書くのではなく:

このコードをいい感じにリファクタしてください。

こう書くほうが結果が安定します:

以下のPythonコードを、次の方針でリファクタリングしてください。

方針:

  1. 関数を20〜40行の粒度に分割する
  2. すべての関数に型ヒントを付ける
  3. docstringを日本語で書く
  4. 変数名はスネークケースで統一する

出力:

  • リファクタ後の完全なコード
  • 変更点の要約(5項目以内)

矛盾しそうな制約には優先順位をつける

複数の制約が潜在的に衝突しそうなら、先に優先順位を示すと安心です。

優先順位:

  1. 動作すること
  2. 可読性
  3. パフォーマンス
  4. 依存関係の少なさ

この順で迷ったらこう判断して、と伝わればOKです。

自己検証を促す

Opus 4.7は自分で成果物を検証するのが上手くなっているので、それを引き出す指示を入れると品質が上がります。

実装が終わったら、以下を行ってください:

  • テストコードを書いて実行する
  • エッジケースを3つ考えて動作確認する
  • 問題があれば修正してから最終報告する

出力フォーマットを指定する

システム連携ではフォーマットの一貫性が重要です。JSONスキーマを明示して渡すと、パースエラーがかなり減ります。

以下のJSONスキーマに沿って出力してください。
{
  "summary": "要約、200文字以内",
  "key_points": ["要点", ...],
  "risks": ["リスク", ...],
  "next_actions": ["次のアクション", ...]
}

エフォートレベルを無駄遣いしない

用途と難易度に合わせた設定が、コストと品質のバランスを取るうえで大事です。

タスク推奨エフォート
軽い質問、単純な変換low〜medium
一般的なコーディングmedium〜high
複雑な設計、難しい推論high〜xhigh
研究レベルの難問max

まとめ

長くなったので、最後にまとめておきます。

  • Opus 4.7は、難しいコーディングと長時間タスクが大きく強くなった
  • 画像認識の解像度が3倍以上になり、細部の読み取りが効くようになった
  • 指示を字義通りに守るようになったので、既存プロンプトは見直しが必要
  • ファイルベースのメモリ運用が上手くなり、長期プロジェクトで活きる
  • xhigh エフォート、タスク予算、/ultrareview、Auto Mode拡張など開発者向け機能が充実
  • 料金は据え置き、ただしトークン消費は増える傾向があるので実測が大事
  • Claude.aiでもAPIでも主要クラウドでも使えるので、今の環境で試せる

個人的な感想としては、Opus 4.7は「派手な新機能で驚かせる」というより、「日常的に使っていて『あ、なんかちゃんとしてる』と感じる」方向の進化だと思います。一度のやり取りで劇的な違いを感じるタイプではないかもしれません。でも、数日〜数週間かけて何かを作る長期プロジェクトでは、その真価を実感できるはず。

まずはClaude.aiかAPIで普段のタスクを流してみて、挙動の違いを肌で感じるところから始めてみてください。プロンプトを少しチューニングすれば、かなりのことができるはずです。

それでは、良いAI活用ライフを。

参考情報

タイトルとURLをコピーしました