【AgentKit】OpenAIのワークフロー構築AIエージェントを含むツール群が登場!特徴や使い方を徹底解説

押さえておきたいポイント
  • OpenAI発のマルチエージェント型AI開発を支援する統合ツール群
  • ChatKit、Agent Builder、Guardrails、Evalsなどのツールで構成される
  • ライセンスはツールによって異なる

2025年10月7日に開催されたOpenAI DevDayで、OpenAIはUIでワークフローを構築しながらAIエージェントを作成できる「AgentKit」を発表しました!

AgentKitは、マルチエージェント型のAI開発を支援する統合ツール群で、視覚的なワークフロー作成ツールや埋め込み型チャットUI、安全性フィルター、評価フレームワークなどを含んでいます。

従来、AIエージェント開発では複雑な連携や手作業が必要でしたが、AgentKitによりその多くが簡略化され、開発や運用の工数を大幅に削減できることが期待されています。

本記事では、AgentKitの概要・性能・使い方まで徹底的にご紹介します。

ぜひ最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

AgentKitとは?

AgentKitの概要
参考:https://openai.com/index/introducing-agentkit/

AgentKitは、エージェント開発をワンストップで行えるツールキットです。

従来、エージェント作成には複数のツールや手作業が必要でしたが、今回発表されたAgentKitは、視覚的なキャンバスでドラッグ&ドロップによって直感的に設計できる「Agent Builder」や、Webサイトやアプリに組み込めるチャットUI「ChatKit」、入出力を検査して安全性を担保する「Guardrails」、性能検証用フレームワーク「Evals」などで構成されています。

これらはすべてOpenAIのAPI上に構築されていて、APIのトークン課金体系で利用することができます。発表時点でChatKitとEvalsは一般提供が開始されており、Agent Builderはβ版で提供されています。

発表直後からDifyやn8nのようなツールに近い存在として話題になっていますが、「Canvas上でエージェントをデザインし、ChatKitで会話体験を簡単に組み込み、Guardrailsで安全性を確保し、Evalsで性能をテスト・改善する」という統合開発フローを実現するのがコンセプトのようです。

なお、n8nについて詳しく知りたい方は、以下の記事も参考にしてみてください。

AgentKitの特徴

AgentKitは、複数の主要コンポーネントを備えており、それぞれがエージェント開発の異なる側面をカバーします。こちらでは、AgentKitに含まれる代表的なツールを4つご紹介します。

ChatKit

ChatKitの特徴
参考:https://chatkit.world/

ChatKitは埋め込み可能なチャットUIコンポーネントで、高度な会話インターフェースをすばやく実装することができます。

レスポンスのストリーミング表示やスレッド管理、ツール連携結果の表示などを標準でサポートしていて、自社サービスのテーマやブランドに合わせてカスタマイズ可能です。

公式サイトでは、例として、CanvaではChatKitを利用してデベロッパー向けサポートエージェントを構築し、「2週間分の工数を節約し、1時間未満で組み込み完了した」と報告されています。

Agent Builder

Agent Builderの特徴
参考:https://platform.openai.com/agent-builder

Agent Builderは、視覚的なキャンバス上でエージェントワークフローを設計するツールです。まさにDifyやn8nのようなツールがこれにあたるイメージです。

ドラッグ&ドロップでエージェントノードや条件分岐を配置して、ツール連携やロジックを直感的に組み立てることができます。

また、プレビュー実行やバージョン管理、チームでの共同編集機能を備え、検証・改良を高速に行えるよう設計されています。

さらにMCPサポート機能も搭載しており、ツール連携の自由度が高い点も魅力です。

Guardrails

Guardrailsの特徴
参考:https://guardrails.openai.com/

Guardrailsは、エージェントの安全性を保つためのガードレール機能で、入力/出力のフィルタリングやモデレーションを行ってくれる機能です。

PII(個人情報)のマスク、内容モデレーション、Jailbreak検出などの複数の組み込みチェックを備え、エージェントの不適切な動作を自動検出・防止してくれます。

OpenAIはGuardrailsのライブラリをPythonおよびJavaScript向けに公開しており、MITライセンスの下で自由に改変・活用できます。

Evals

Evalsの特徴
参考:https://x.com/OpenAIDevs/status/1975269393111421333

Evalsは、エージェント性能を評価するフレームワークで、新たに「データセット構築」「トレースグレーディング」「自動プロンプト最適化」「他社モデル評価」の機能が追加されました。

これによって、一連の対話ワークフロー全体を自動評価し、精度や欠点を可視化することができるようになっています。

エージェント個別の質問応答で発生する誤答の統計や、人間評価との比較などを通じて反復的にエージェントを改善できる点が特徴のようです。

AgentKitのライセンス

AgentKitを構成する各コンポーネントには異なるライセンスが適用されています。

ChatKitはApache-2.0ライセンスの下で提供されていて、商用利用・改変・再配布・特許利用・私的利用を含めて自由に行うことができます。

GuardrailsやEvalsのライブラリはMITライセンスで提供され、同様に広範な利用・改変が許可されています。

一方、Agent BuilderはOpenAIのAPIサービスとして提供されており、そのソースコードは非公開です。以下に各コンポーネントのライセンス上の利用可否をまとめます。

利用用途ChatKitAgent BuilderGuardrailsEvals
商用利用⭕⭕⭕⭕
改変⭕❌⭕⭕
配布⭕❌⭕⭕
特許使用⭕❌⭕⭕
私的使用⭕⭕⭕⭕
AgentKitのライセンス

再掲しますが、ChatKitやGuardrails/Evalsはオープンソースで提供されており、商用利用や改変、再配布が自由に可能です。

一方、Agent BuilderはAPIサービスとして機能を提供するものであり、ライブラリコードの改変や再配布はできないので覚えておきましょう。

AgentKitの利用料金

AgentKitの利用料金は、標準のOpenAI API料金体系に準じています。

つまり、AgentKit自体に固定料金はなく、生成モデルや対話のトークン使用量に応じて従量課金が行われます。具体例として、代表的なモデルの料金は以下の通りです。

モデル入力(100万トークン)出力(100万トークン)
GPT-5$1.25$10.00
GPT-5 mini$0.25$2.00
GPT-5 nano$0.05$0.40
主要モデルのAPI利用料金

すべてのエージェント機能(チャットUI、ワークフロー作成、評価など)は追加の定額料金なしで利用可能で、課金は上記のAPIトークン使用料にのみ基づきます。

モデルごとの具体的な単価は状況に応じて変動する可能性もあるため、詳細はOpenAIの公式API料金ページをご参照ください。

AgentKitの使い方

AgentKitの使い方は大きく分けるとUI(ノーコード)とコード(SDKおよびAPI)の2通りがあります。

UI(ノーコード)

基本的にはUIベースでの利用がスタンダードで、操作も簡単です。

ChatKit

まずはChatKit Studioにアクセスします。

トップのPlaygroundを開くと、チャットウィジェットを確認でき、テーマや外観、メッセージ表示などをブラウザ上で調整できます。以下の画像がPlaygroundのチャット画面です。

試しに「ChatKitとは?」と質問してみると、以下のような回答が返ってきました。(本来の使い方とは異なりますが)

ChatKitでは、ウィジェットビルダーからプリセットを選び、色・フォント・角丸・ロゴなどのブランド要素を反映し、必要に応じて「ウィジェット」や「テーマ」に関する設定ガイドを参照しながら、表示や挙動を仕上げていくような流れになります。自社のサービスにチャットボットを組み込んだりできるのがメリットです。

Agent Builder

OpenAIのプラットフォームにログインし、Agent Builderを開きます。

空のキャンバスから始める(+Createボタン)か、6つ用意されているテンプレートを選んで、ノードをドラッグ&ドロップで並べます。

問い合わせ受け付けの起点だったり、分類用エージェント、外部ツールやファイル検索、条件分岐、最終応答の返却といった処理の導線をつないで、右側のペインで各ノードの設定を行います。

画面上のプレビュー実行で動きを確かめ、うまくいったらバージョンを切って保存することができます。本記事でもご紹介している「Guardrails」ノードを設計の途中に追加しておくと、後段の安全設定も同じ画面で管理することができるようになります。

Guardrails

安全に関するルールをUIで作る場合は、Guardrails Wizardを開きます。初回はOpenAIの規約に同意する旨のポップアップ画面が出るかもしれませんので、同意して進みましょう。

ウィザード上で検査したい内容(個人情報の検知・マスク、プロンプトインジェクションや脱獄の検出、ハルシネーション検知、モデレーションなど)を選んで、しきい値や動作を設定します。

作成した設定はそのまま構成ファイルとして保存できて、Agent BuilderのGuardrailsノードに割り当てれば、ウィザード上で作った安全ルールがワークフロー実行時に適用されるようにできます。

Evals

品質評価はOpenAIのEvalsダッシュボードから始めることができます。

まず評価用データセットを作成して、どの観点で合否やスコアを付けるかを「グレーダー」として画面上で定義します。

続いて「トレースグレーディング」を有効にすると、エージェントの各ステップを追跡しながら、どこで誤りや迷走が起きたのかを可視化することができます。

実行後は結果ビューで不合格ケースを掘り下げて、プロンプト最適化を走らせて改善案を自動生成し、再評価します。

AgentKitの主要ツールの使い方は以上となります。続いては実際にAgentKitを使っていきましょう。

AgentKitを使ってみた

試しに、Agent Builderを使っていきましょう!今回は簡単なチャットボットを作成します。

ワークフローを新規作成すると以下のようにStartノードとMy agentノードが準備されています。

My agentノードの出力部分の導線を引っ張ってノード(今回はEnd)を選択します。

ちなみに、この段階でMy agentノードのInstructions欄には「You are a helpful assistant.(あなたは役に立つアシスタントです。)」と設定されているのでこのまま活用します。

続いてEndノードについても確認しておきます。

Endノードをクリックして、右側のペインの「ResponseSchema」をクリックします。

すると、以下のようなStructured output (JSON)設定画面が表示されるので、ここでアウトプット仕様に関する設定ができます。今回はデフォルトのまま実行に進みます。

以下の画面右上の▷Previewをクリックします。

すると、チャット画面が表示されるので、ここでテキストを入力します。

実行エラーになってしまいました。何度か実行、モデルの変更、入力を英語に変更したりしましたが、結果は変わらず。。有料プランかつクレジット残高も問題ないですが、SNS上でも同様のエラー報告がちらほら出ていますので、初期エラーかアクセスの影響かもしれませんね。復旧・改善を待つこととします。

なお、類似タスクで実行がうまくいくと以下のような出力になるかと思います。

参考:https://x.com/DqluaT3mE6KPKoD/status/1975346255523160579

以上、出力まで正常に完了しなかったため、性能面での評価は難しいものの、機能面としては、input/outputともにJSONスキーマが設定できる点と、MCP連携がデフォルト搭載されている点、あとはOpenAI環境内でワークフロー構築を完結できそうな点はかなり良いと感じています。

一方で、まだ利用可能なノードが少ない点、ノードの並列処理ができない点、非エンジニアにとっては操作ハードルが高い点もあり、今後のアップデートに期待したいところです。

まとめ

AgentKitは、AIエージェント開発をサポートしてくれる包括的なツールセットです。

視覚的なAgent Builderと埋め込み可能なChatKitでエージェント構築を大幅に効率化し、Guardrailsによって安全性を確保しつつ、Evalsで継続的に品質を測定・改善することができます。

すべてがOpenAI API上でシームレスに統合されていて、ユーザーは、複雑なインフラを意識せずにコアロジック設計に集中できます。

今後、AgentKitを利用することで、企業や開発者は迅速に実用性の高いAIエージェントを生み出し、様々な業務効率化や顧客体験向上に貢献できると期待が高まります。

気になった方はぜひ一度試してみてください!

WEELが“失敗しないAI導入”を伴走します。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

タイトルとURLをコピーしました