2025 年に信頼できる AI エージェントを構築するための 10 の実証済みのベストプラクティス

UiPath では、しばらくの間、エージェントの考え方を実践してきました。私たちはデモを構築するだけではありません。私たちは、実際の企業の混乱を出荷し、拡張し、生き残るエージェントを構築します。

大規模言語モデル (LLM) を運用環境に接続したことがある方ならご存知でしょうが、壊れるのはプロンプトではありません。それは彼らの周りのすべてです。エラー処理、コンテキスト管理、ツール契約、トレーサビリティ。そのため、私たちはこれまでと同じ方法で UiPath Agent Builder を Studio で構築しました。 AI エージェントを実際のソフトウェアコンポーネントのように動作させるために必要な制御と可観測性を提供したいと考えました。

エージェント自動化の大規模な構築、テスト、出荷に関して私たちが学んだことは次のとおりです。これらはエージェントビルダーのベストプラクティスであり、「なんとなくうまくいく」から「これは本番環境で午前 2 時に起こさずに実行できる」まで進むのに役立ちます。

1. (速いだけでなく) フェイルセーフなエージェントを設計する

オートメーション内でエージェントを慎重に統合します。非常に強力なユースケースがない限り、REFramework 内にエージェントを埋め込むことは避けてください。エージェントは、慎重に管理する必要がある変数 (エスカレーション、エラー処理など) を導入します。代わりに、可視性と制御性を向上させるために、UiPath Maestro™ の使用をお勧めします。
エージェントの再試行メカニズムを回避します。エージェントの出力は決定的ではないため、再試行しても改善が保証されません。代わりに、エージェントまたはツール自体内でエラーをキャプチャして処理します。
小規模かつ集中的に始めます。単一責任エージェントから始めます。それぞれに 1 つの明確な目標と狭い範囲があります。広範囲にわたるプロンプトは精度を低下させます。範囲が狭いため、一貫したパフォーマンスが保証されます。
複数の特化したエージェントにモジュール化:1 つの「すべてを行う」エージェントではなく、複雑なワークフローに対応するエージェントとロボットを組み合わせてモジュール式システムを構築します。これにより、スケーリングの制御、デバッグの容易化、および柔軟な再利用が可能になります。
確定的なタスクの場合は、ツールを使用します。ユースケースで必要な場合、エージェントに直接動作させるのではなく、実証済みの UiPath オートメーションまたは API をツールとして呼び出すことで、リスクを制限します。これにより、予測可能性と安全性が向上します。
エージェントの目標と測定可能な成果を調整します。設計を開始する前に、明確な目標、パフォーマンス指標、成功基準を定義します。エージェントは測定可能な境界内で動作する必要があります。

2.コンテキストを正しい方法で構成する

エンタープライズコンテキストのインデックスを作成します。エージェントが依存する構造化ソース、ナレッジベース (KB)、およびドキュメントのインデックスを作成します。適切な計画とコンテキストの設定が、信頼性の高い実行の鍵となります。必ず適切な検索戦略を選択してください。セマンティック検索は非構造化テキスト内の意味ベースの一致を見つけ、構造化検索は定義されたスキーマから正確なデータを取得します。 DeepRAG は両方を組み合わせて、大規模、複雑、または混合ソースを深く推論します。
適切なモデルを選択します。Studio の UiPath Agent Builder はモデルに依存しないため、ユースケースに最適なモデルを使用してください。たとえば、GPT-5 は一般に GPT-4 よりも信頼性が高くなります。バイアスを避けるために、エージェント自体とは異なる評価モデルを使用します。
ツール定義の明確さを維持します。小文字の英数字を使用し、スペースや特殊文字を使用しない、シンプルで説明的なツール名を使用します。名前は、プロンプトで参照されているものと正確に一致する必要があります。

3.あらゆる機能をツールとして扱う

すべての外部機能をツールとして扱います。ツールには厳密な入出力契約と明確な成功基準が必要です。可能な限り、UiPath オートメーションをツールとして再利用します。
スキーマ主導のプロンプト:ツールのプロンプトを簡潔かつ構造化したものにします。出力形状を検証し、null または空の結果を明示的に処理します。
ドキュメントおよびバージョンツール:ツールごとに明確なバージョン管理と評価履歴を維持します。評価の実行を特定のバージョンにリンクします。
決定論的なタスクに対するエージェントの信頼性を高めるツールを構築します。LLM は数学や日付の比較などが得意ではありません。エージェントの信頼性に関する問題を回避するには、複雑な操作を実行するツールを構築します。

4.製品仕様のようなプロンプトを作成します (散文ではありません)

反復的な設計とテスト:プロンプトエンジニアリングは反復的な作業であるため、UiPath Agent Builder を使用して、適切な評価セットを構築し、構築時にテストすることで、システムプロンプトとタスクの指示を改良します。
以下を定義するシステムプロンプトから開始します。
- 役割と人物像
- 説明書
- 目標と背景
- 成功指標
- ガードレールと制約
構造化された複数ステップの推論を使用します。複雑なワークフローに思考連鎖スタイルの推論を組み込みます。タスクの分解、推論方法、出力形式を明示的に定義します。
エージェントの望ましい結果について、できるだけ具体的かつ詳細に説明してください。UiPath Data Manager で out 引数の適切な出力スキーマを定義していることを確認してください。例を提供することも役立ちます。
何が起こってはいけないのかではなく、何が起こるべきなのかを説明します。これは、AI エージェントに「個人情報を要求しないでください」というプロンプトを表示するのと、「個人情報の要求を避けて、代わりにユーザーに…を参照してください」というプロンプトを表示するのとの違いです。
同じタスクを達成するために、異なるプロンプトを検討してください。モデルには異なる暗黙的な動作があります。たとえば、不確実な場合にはエラーが発生する傾向があるため、モデルごとに特定の指示が必要です。
評価セットを使用してプロンプトを微調整します。プロンプト最適化ツールを使用してモデルとプロンプトを試します。
マークダウン言語を使用する:この言語を使用すると、プロンプト内の特定の側面を強調できます。例:* *クリティカル:* *
プロンプト内の入力引数をその値で参照することは避けてください。たとえば、{{input}} などです。値は実行時に実際の引数値に置き換えられるためです。

プロンプトスキルを拡張したいですか? UiPath アカデミーでは、「より良いプロンプトの書き方」コースと「エージェントプロンプトエンジニアリング」コースを提供しています。

5.現実世界に合わせて評価する

堅牢な評価データセットを構築します。エージェントごとに少なくとも 30 の評価ケースを用意します。実行をブロックする可能性のあるツールとエスカレーションをシミュレートします。成功事例、エッジケース、失敗シナリオを含めます。
幅と深さを評価します。結果の正確さ、推論、トレーサビリティ、適応性、ツール使用の成功など、複数の側面をカバーします。
エンドツーエンドのテスト:エージェントを単独で評価するだけでなく、完全な自動化コンテキスト内で評価します。統合、通信、回復、および障害モードをテストします。
トレースを使用する:トレースログを定期的に確認して、エージェントの推論ループ、意思決定、ツールの使用状況を検査します。エラー、非効率、予期しない動作を特定します。
指標とガバナンス:ヘルススコアと回帰指標を追跡し、しきい値を超えた場合に公開をゲートします。

6.安全性、ガバナンス、コンプライアンスを組み込む

UiPath Orchestrator または Maestro 経由でエージェントを実行します。ライフサイクル管理、監査、ガバナンスを継承するプロセスとしてエージェントを展開します。
AI Trust Layer を活用する:グループごとの権限、PII 編集、監査ログ、スロットル、使用量制御を適用します。
人間参加型の体制を維持する:リスクの高い決定について人間によるレビューを行うためにエスカレーションを使用します。これらのインタラクションはエージェントの記憶に情報を与え、今後の実行を改善します。
ガードレールを使用する:許容される動作とエスカレーションに関するルールを設定し、適用します。

7.意図的なバージョンとゲートリリース

すべてをバージョン管理する:プロンプト、ツール、データセット、評価の明確なバージョン管理を維持します。
運用リリースのゲート:評価に合格し、ロールアウト計画が完了した後にのみ、エージェントを運用に移行します。
評価をバージョンタグに添付します。設計から展開までのトレーサビリティを確保します。

8.信頼を築く会話をデザインする

明確な期待値を設定します。エージェントができることとできないことを伝えます。透過的なツールアクションを提供し、人間とロボットの明確なエスカレーションパスを提供します。
取り消しできないアクションを確認します。決定的な確認を使用します (「Y フィールドを使用して X を作成します — 続行しますか?」)。
透明性を重視したデザイン:信頼を構築するために、必要に応じてコンテキストや推論のスニペットを表示します。

9.品質を犠牲にすることなくコストとパフォーマンスを管理する

モデルの使用を最適化する:モデルの選択を適切なサイズにします (複雑な推論には大きなモデル、分類またはルーティングには小さなモデル)。
トークンの使用を制限する:取得に重点を置き、長いコンテキストを要約し、安定した応答をキャッシュします。
バッチおよび階層化オペレーション:低リスクの呼び出しをバッチ処理し、必要な場合にのみ高機能モデルにエスカレーションします。

10.トレース、記憶、人間によるフィードバックにより継続的に改善します

トレースして学習:Agent Builder のトレース機能と評価機能を使用して、信頼性を繰り返し向上させます。エージェントのメモリを使用して、AI エージェントが人間によって解決されたエスカレーションから学習できるようにします。
人間によるフィードバックループ:エスカレーション、評価フィードバック、実行ログはすべて、設計の更新とエージェントのメモリにフィードバックされる必要があります。
段階的にスケールします:安定性とパフォーマンスが小規模で証明された後にのみ、エージェントの機能を拡張します。

最初の実稼働エージェントを構築する準備はできましたか?

Agent Builder を使い始めるか、ライブデモをご覧ください。

開発者向けに、エージェントを構築および展開するさまざまな方法について知っておくべき情報をすべて 1 つの便利な場所にまとめました。 ここから始めましょう .

FAQ:Agent Builder と AI エージェント

エージェントビルダーとは何ですか?

エージェントビルダーは、エンタープライズ環境内で推論、決定、および (安全かつ確実に) 行動できる AI エージェントを設計、構成、デプロイできる開発環境です。

汎用 LLM エージェントツールの代わりに UiPath Agent Builder を使用するのはなぜですか?

Studio の UiPath Agent Builder は、プロトタイプではなく実稼働用に設計されています。エンタープライズ対応のためのスコアリングと評価主導の開発を、既存のビジネスシステムへのシームレスな統合と組み合わせます。ローコードでユーザーフレンドリーなインターフェースを通じて、UI オートメーションやインテリジェント文書処理 (IDP) を含む完全なツールセットを利用でき、より広範な UiPath プラットフォーム全体に簡単に拡張してエンドツーエンドのオートメーションを実現できます。

本番前に AI エージェントを評価するにはどうすればよいですか?

評価データセット、トレースログ、回帰メトリクスを使用して、精度、ツールの使用の成功、安全性を検証します。 UiPath の評価およびトレース機能により、これがシンプルかつ再現可能になります。

エージェントは時間の経過とともに改善できるでしょうか?

はい。エージェントの記憶とエスカレーションフィードバックループは、エージェントが人間の介入から学習し、時間の経過とともに安全に進化するのに役立ちます。

変革の加速:プロセスインテリジェンスを活用して、よりスマートで高速な運用を実現 PLC とオートメーションに関する専門家の洞察をPanelShop.comでご覧ください

自動制御システム