
- Gemini使うことで、指示追従にとどまらず「推論・計画・協働」を行える次世代エージェント
- 視覚ベースの入力とキーボード/マウス操作により、未知の3D環境でも柔軟に適応・行動可能
- 自己改善機能と未学習環境での一般化性能を持つ
2025年11月、Googleから新たなAIエージェントが登場!
今回リリースされた「SIMA 2」は従来のSIMAに比べ単なる指示追従から、ユーザーの目的や意図を汲み取り、推論し、行動に移すことができるAIエージェントです。
本記事ではSIMA 2の概要や仕組み、特徴、活用事例などについて解説をします。本記事を最後までお読みいただければ、SIMA 2の理解が深まります。
ぜひ最後までお読みください!
\生成AIを活用して業務プロセスを自動化/
SIMA 2の概要
SIMA 2は、Google DeepMindが開発したAIエージェントであり、3D仮想空間において人のパートナーとして行動・推論・学習ができます。
前世代のSIMAが600以上の基本的な指示に従う「言語→行動」変換に特化していたのに対し、SIMA 2はGeminiモデルを活かすことで、単なる指示追従を超えた高度な推論、対話、自己改善を実現。
SIMA 2は画面を見ながらキーボードとマウスを操作するという、人と同等のインターフェースでゲーム世界を認識・操作します。これにより、ゲーム固有のAPIに依存せず、未知の環境でも柔軟に適応できる汎用性を備えています。

Geminiの組み込みにより、SIMA 2は指示の背後にある「目的」や「意図」を理解し、タスク達成のための行動計画を立てます。ユーザーとの対話を通じて考え方を説明する機能も追加され、より協働的な利用が可能。

SIMA 2の仕組み
SIMA 2は、視覚入力の理解、目標推論、行動計画、操作実行、自己改善の各プロセスを統合したエージェントアーキテクチャによって構築。前世代のSIMAが「指示に従うエージェント」であったのに対し、SIMA 2はGeminiモデルを活用することで、環境理解と推論を伴う高度な意思決定が可能となっています。

視覚ベースの入力処理と環境認識
SIMA 2は、ゲームの内部APIを利用せず、人間と同様に画面映像を見ながら内容を理解。視覚情報をもとに周囲の状況や地形、アイテム配置などを認識し、行動などの状況判断を行います。また、入力装置としてキーボードとマウスを使用し、ゲーム環境に直接介入せず、人間と同じIFで操作します。

なお、Googleが実現した「自律操作AI」であるGemini 2.5 Computer Useについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

SIMA 2の特徴
SIMA 2は、3D仮想空間で「観察し、理解し、計画し、行動し、学習する」という一連の能力を持ったAIエージェントであり、従来の指示追従型モデルから大きく進化。特に、Geminiの推論能力、未学習環境への高い適応力、自己改善機能など、汎用エージェントとしての基盤を備えている点が特徴です。
高度な推論能力と行動計画
SIMA 2最大の特徴は、単に指示に従うのではなく、ユーザーの意図を理解し、目的達成に向けて最適な手順を考えられる点にあります。Geminiモデルを使用したことで、タスクに対する高レベルな推論が可能となり、行動の理由や計画をユーザーに説明しながら進行できます。
また、SIMA 2は、トレーニングされていないゲームであってもタスクを高い成功率で遂行可能です。
MineDojoやASKAなどの未学習環境で実際に動作し、目的地の特定や資源採集などの複雑な操作を行えることが確認されています。

マルチモーダル入力への対応
SIMA 2は、テキストだけでなく、画像、スケッチ、絵文字といった多様な入力形式を解釈できます。抽象的な表現や曖昧な指示であっても、環境情報と照合しながら適切な行動に変換する柔軟性を備えています。

自己改善機能を備えた発展的な学習構造
SIMA 2は、自身のプレイ経験とGeminiによるフィードバックを活用し、より複雑なタスクを自律的に学習できる仕組みを持ち、人間によるデモデータに依存しない学習が可能であり、反復的に能力を高めていくループが設計されています。

SIMA 2の安全性・制約
SIMA 2は高度な推論と自己改善機能を備える一方で、その能力を安全に運用するための設計が組み込まれています。本モデルは研究目的で限定公開されており、開発段階での制約や未解決の課題も示されています。
責任ある開発体制
SIMA 2は、自己改善能力を備えるモデルであり、開発プロセスの初期段階からResponsible Development & Innovation Teamが関与。
特に、自己改善に関連するリスク管理が重視され、能力拡張の挙動が無制御にならないよう慎重に調整されています。研究プレビューとして限定的に学術機関やゲーム開発者にのみ公開されているのも、安全性検証を段階的に進めるための措置とされています。※1
SIMA 2の料金
SIMA 2の料金に関する情報は、公開されておらず、本記事執筆(2025年11月)時点ではSIMA 2が「限定リサーチプレビュー」として学術機関や一部のゲーム開発者に早期アクセスとして利用可能。
SIMA 2のライセンス
SIMA 2のライセンスに関する情報は、公式ページにはまだ記載されていません。※1
なお、AIが脆弱性を自動修正するCodeMenderについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

SIMA 2の実装方法
SIMA 2が利用可能になったら追記いたします。ブックマークしてお待ちください
SIMA 2の活用シーン
SIMA 2をまだ利用することはできませんが、公式発表されている内容から、SIMA 2の活用シーンを考えてみました。
仮想空間での教育・トレーニング支援
SIMA 2は、画面上の情報を視覚的に理解し、タスクを分解しながら人間と協働できるため、仮想空間を使った学習支援に応用できるのではないでしょうか。
例えば、ゲームエンジンを使ったシミュレーション内で、初心者ユーザーに対して作業手順を示したり、状況に応じてアドバイスを提供したりするなど。抽象的な概念をスケッチや曖昧な言語から解釈する能力も備えており、学習者の理解度に応じて支援内容を変えられる点が強みになりそうです。
仮想ロボティクスの訓練環境としての活用
SIMA 2は、道具使用や移動、協働タスクといった、ロボットに必要とされる基礎スキルを獲得しており、さらに未知の3D環境でも自己改善しながら適応できる特徴を持っています。
これにより、ロボット開発の初期段階において、仮想環境内でエージェントをプロトタイプとして利用し、複雑なタスクの検証を行う用途も考えられます。実環境での試行回数を減らし、試験コストを削減できる点も実務上の価値となるのではないでしょうか。
SIMA 2を実際に使ってみた
SIMA 2が利用可能になったら追記いたします。ブックマークしてお待ちください
なお、Google発の小型×高性能な埋め込みモデル「EmbeddingGemma-300m」について詳しく知りたい方は、下記の記事を合わせてご確認ください。

まとめ
本記事ではSIMA 2の概要から仕組みなどについて解説をしました。本記事執筆(2025年11月)時点ではまだ利用することができませんが、利用できるようになるのが楽しみなAIエージェントです。
皆さんもぜひSIMA 2が利用可能になったら本記事を参考に利用してみてください!
最後に
いかがだったでしょうか?
弊社ではAIエージェント技術の導入を検討する企業向けに、業務効率化や新たな価値創出につながるAI導入支援を提供しています。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
︎株式会社WEELのサービスを詳しく見る。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。



