本記事は、
ブログ
自動テストに
自動テストに おける AI (コンピュータユー ザーエージェント) モデルの 活用: より 簡単で 迅速な テスト
Scriptide

執筆者
Botond Kovács
(ChatGPT
最終更新日
MAR 02, 2026
トピック
#dev
所要時間
9 min read

AI ベースのエンドツーエンドテスト自動化
簡単なデモ
モデルについて
computer-use-previewモデルを公開しました。このモデルは OpenAI のOperatorや ChatGPT の新しいAgent モードにも利用されています。このモデルは GUI(グラフィカルユーザーインターフェイス)とやり取りするよう設計されています。テストケースの記述
clickOn(description): 画面上に指定された要素をクリックfillIn(fields): フォームなどに指定されたフィールドに入力expectOnScreen(description): 現在画面上に表示されている内容が真実であることを確認
clickOnはどのように動作していることについてご案内します。AI によるクリック操作
- 現在のアプリケーション状態のスクリーンショットを取得
- スクリーンショットとメッセージをモデルに送信
- モデルは次のどちらかを選択
- コンピュータを操作させ、座標にクリックするやテキスト入力などの入力行動を実行
- メッセージで応答 ー タスク完了または自律操作不可能と伝える
- モデルの入力操作を実行し、入力の処理が完了されるまで待機
- モデルがメッセージで応答するまでループを繰り返す
clickOnの例では、プロンプトは以下の通りです:{{targetDescription}}はクリックされた要素の記述に交代されます。(例:送信ボタン)動作の仕組み

実用化
mocha、ブラウザ自動化ライブラリにはpuppeteerを選択しました。これらのツールを活用する小規模なフレームワークを構築し、望ましき高レベル API を取得しました。.test.jsファイルを作成することでテストケースを記述できるようになります。他言語への対応
- テストは 1 回書くだけで、AI が理解するあらゆる言語で動作させたい
- システム挙動の要件を正確に伝えるため、テストを自分の言語またはお客様の言語で記述したい
generateDataFieldという機能を導入しました:- ページの言語を HTML の
lang属性から判定 - AI に指示を出す:提供されていれば、記述に基づくフィールドデータを生成・ 記述の言語に関わらず 、ページの言語 で生成することが必須
aliases.ja.tsとaliases.hu.tsファイルを作成し、以下のように動作します:制約
- プレビュー版モデルにとって非英語のインターフェースを解読するのが時々困難です。日本語の UI の上でもテストを実行して多くの場合機能しましたが、信頼性が低いので手動で確認する必要がある偽陽性や偽陰性が発生しました。
- モデルは構造化出力をまだ対応していないので、応答フォーマットの指示を必ずしも遵守しません。ステップの成否を判定するのが難しいです。その理由で対策として第二モデルを活用し、CUA 出力はレビューされるようになりましたが、その一方費用と複雑性も増加しています。
- 大きな UI 要素ではうまく動作しますが、ピクセル単位の正確さが必要の場合はまだチャレンジです。ビデオゲームでの小さいアイコンの場合失敗率が高いです。
- レイテンシにより、リアルタイム性を着実にテストできません。(例:自動消失するトーストメッセージは検知される以前消失します。)
今後の展望
- 現在実験している手法の一つは、CUA を呼び出す前に、テスト対象の DOM を理解した非 CUA モデルを使用することです。モデルがステップを実行できない場合(例:テスト ID が見つからない場合)、フォールバックとして CUA を呼び出すことができます。その結果、CUA の呼び出し回数がテスト実行にかかるコストや時間とともに削減されます。
- また、偽陽性と偽陰性をより確実に検出するための複数の技術を実験しています。他の AI モデルを使用して、CUA ループ中に取りまとめられた結果(スクリーンショット、ブラウザのログ、アクションなど)を見直したら、CUA の元の結論が正しかったかどうかを判定できます。
- CUA ループのコストを削減するもう一つの方法は、より優れた会話状態管理を実装することです。実際的に最後の少数のメッセージを温存し、それ以前のものは削除すべきです。これにより、ステップに要する文脈の大きさを制限する同時にトーケン数も削減します。
この POC に興味がありますか?
Scriptide は、 テクノロジーパー トナーであり、 複雑な カスタム B2B ソリューションの 提供を 専門と しています。 デジタルトランス フォーメーション、 Web・ モバイル開発、 AI、 ブロックチェーンなど、 幅広い サービスを 提供しています。 無料の IT 相談を 承っております。 ぜひお気軽に お問い 合わせください。
無料のIT相談をぜひご利用ください。。皆さまからのご相談を心よりお待ちしております。
最新の記事や限定コンテンツを購読する。
当社はお客様のデータを最大限の慎重さをもって取り扱います。「最新情報を受け取る」をクリックすると、Scriptide がマーケティング目的でお客様のデータを処理することに同意したものとみなされます。これにはメールの送信も含まれます。詳細は、プライバシーポリシーをご覧ください。
こちらの 記事も おすすめです!
詳細は こちら
Lighthouse スコア改善: Web サイトの SEO スコアを 最大化する 方 法
Google Lighthouse
#dev
•
JUL 01, 2025
•
6 min read
詳細は こちら
フルスタック開発の 利点
フルスタック開発は、
#dev
•
JUN 04, 2025
•
5 min read