ChatGPT Atlasブラウザのエージェントモードを最適化する方法

[レベル: 上級]

OpenAI が昨日公開した ChatGPT Atlas ブラウザでは、Agent Mode(エージェント モード)のプレビュー版を利用できます。

この記事では、Atlas のエージェントモードについて解説します。

エージェントモードでできること

エージェントモードを利用すると、Atlas ブラウザに処理を自動実行させることが可能になります。

たとえば、Amazon のサイトを開いていて次のように命令できます。

1万円以下の防水の Bluetooth スピーカーを探して、特徴を比較して

すると、Amazon 内を巡回(あるいは検索)して、指定した条件の製品を探し出し比較表を自動で作成します。

ChatGPT Atlas エージェントモード

今見ているページに限定せずに、ウェブ全体を対象にしてオープンに自動実行させることも可能です。
Atlas の新規タブではエージェントモードを選択できます。

ChatGPT Atlas エージェントモード

たとえば、大手メディアサイトで公開されている Atlas に関する記事を探して、まとめてもらえます。

ChatGPT Atlas エージェントモード

指示によっては数分かかりますが、完了するのを画面を見ながら待っている必要はありません。
バックグラウンドで実行するので、その場を離れられます。

プレビュー版ということで、複雑な処理は失敗することもあります(Bluetooth スピーカーの例では、比較表はまともだったが Wi-Fi ルーターのページを最後に開いた)。
しかし、性能が向上すれば、指定した条件でのホテルの予約や希望の席でスポーツ観戦のチケット手配を任せられるようになるでしょう。

Atlas エージェントモードの最適化

未来感のある Atlas のエージェントモードでは、エージェントがサイトを理解しやすくする構成が重要になります。

OpenAI は、Atlas のエージェントのパフォーマンスを向上する方法をヘルプドキュメントで説明しています。

What can I do to improve my website performance with ChatGPT agent in Atlas?

Making your website more accessible helps ChatGPT Agent in Atlas understand it better.

ChatGPT Atlas uses ARIA tags—the same labels and roles that support screen readers—to interpret page structure and interactive elements. To improve compatibility, follow WAI-ARIA best practices by adding descriptive roles, labels, and states to interactive elements like buttons, menus, and forms. This helps ChatGPT recognize what each element does and interact with your site more accurately.

Atlas の ChatGPT エージェントでサイトのパフォーマンスを高めるには何ができますか?

ウェブサイトのアクセシビリティを高めることで、Atlas の ChatGPT エージェントが内容をより正確に理解できるようになります。

ChatGPT Atlas は、スクリーンリーダーを支えるのと同じラベルや役割である ARIA タグを用いて、ページ構造やインタラクティブ要素を解釈します。互換性を向上させるには、WAI-ARIA のベストプラクティスに従い、ボタン、メニュー、フォームなどのインタラクティブ要素に記述的な役割、ラベル、状態を追加してください。これにより、各要素の役割を ChatGPT が認識し、サイトとより正確に対話できるようになります。

WAI-ARIA(ウェイ・アリア)は、ウェブページのアクセシビリティを高めるための技術です。
ARIA(アリア) とは、WAI-ARIA で定義されている、HTML 要素に追加する属性の総称です。

ARIA なしの悪いクリックボタンの例です。

<div onclick="doSomething()">
ここをクリック
</div>

ARIA ありの良いクリックボタンの例です。

<div role="button" tabindex="0" onclick="doSomething()">
ここをクリック
</div>

正直にいうと、WAI-ARIA については僕はまったく詳しくないので、知識がなければ詳細は各自で調べてください。

Atlas の ChatGPT エージェントが将来的に幅広く普及すると予想するなら、WAI-ARIA にしたがってサイトを設計するといいでしょう。
Atlas に限らず他社の AI エージェントのパフォーマンス向上にもひょっとしたら役立つかもしれません。