[レベル: 上級]
185 件の高額商品の購入タスクを対象とした最新のユーザビリティ調査を Kelvin Indig(ケルビン・インディグ)氏が実施しました。
結果から、従来の検索エンジンと比較して「AI Mode」を利用する際のユーザー行動に根本的な変化があることが明らかになりました。
消費者は AI 検索を、比較のためのツールとしてではなく、推奨を決定づけるツールとして扱う傾向を強めています。
AI Mode は比較行動を縮小する
調査によると、AI Mode における最終候補リストの 74% は外部確認なしで AI の出力から直接作られていました。
従来の検索では、56% のユーザーが複数の独立した情報源から自分で候補リストを作っていました。
一方 AI Mode では、コード化可能だった 147 件のタスクのうち、本当に自力で作られた候補リストが生まれたのは 8 件だけでした。
つまり、ほとんどのユーザーは、複数の情報源を横断して自分で候補を絞り込むのではなく、検証をほとんどあるいはまったく行わずに AI の推奨をそのまま受け入れていたのです。
こうしたパターンは具体的には次のような例が示しています。
- AI Mode と従来の検索を直接比較したノート PC と保険のタスク全体で測定すると、88% のユーザーが変更も外部検証もせずに AI の候補リストを採用した
- AI Mode の参加者の 64% は、候補を選ぶ前に何もクリックしなかった
- クリックなし率はカテゴリによって異なり、保険 (85%)、ノート PC (69%)、テレビ (67%)、洗濯機 / 乾燥機セット (47%) だった
順位の重要性は非常に高い
参加者の 74% は、AI の回答で 1 位 に表示された項目を最有力候補として選んでいました。
選ばれた順位の平均は 1.35 で、3 位以下 を選んだのは 10% にすぎませんでした。
ただし、順位を無視した参加者が 26% いました。
主な理由は、そのブランドが好きだからというものです。
AI の推奨よりも自分の好みを優先したわけです。
それでも、注目すべき点として、順位を覆した参加者の 81% はそれでもなお AI の候補群の中から選んでいたことが挙げられます。
信頼性の複数ソースによる検証から AI のフレーミングへ
AI Mode では、特に次の 2 つの要因が信頼の度合いを大きく左右していました。
- AI によるフレーミング (37%) ※ AI が商品/サービスをどのように説明しているか
- ブランド認知 (34%)
従来の検索では、37% のユーザーは、複数のソースを調べて総合的に信頼性を判断していました。
一方、AI Mode ではこうした傾向はほとんど見られず、わずか 5% にとどまっていました。
AI の候補リストから漏れているなら実質的に存在しないも同然
AI Mode で提示されなかったブランドは、概して、検討の対象にすらなりませんでした。
また、たとえブランドが表示されたとしても、認知度が低ければ選ばれる確率は低下しました。
もしあなたのブランドが AI の候補リストから漏れているなら、それは実質的に存在しないも同然です。
AI Mode を離れる理由は調査ではなく確認/購入
AI Mode のタスクで少なくとも 1 回外部サイトを訪問したのは 23% にとどまりました。。
標準検索の 67% と比べて低い数字です。
その差は量だけでなく意図にも表れています。
AI Mode から離脱したユーザーは、すでに選ばれた候補の価格や仕様を確認するために小売サイトやメーカーサイトへ行きました。
対して、従来の検索ユーザーは、候補を発見するために離脱していました。
具体的には、Reddit で利用者の意見を確認したり、レビュー系メディアで専門家の見解を読んだり、保険比較サイトで比較したりしていたのです。
ブランドが取り組むべき 3 つの施策
ユーザー調査をもとにインディグ氏は、ブランドが取り組むべき施策として次の 3 つを提案しています。
- 露出:カテゴリ単位の購買プロンプトで AI Mode に表示されるようにし、どのブランドがどの順序で表示されるかを追跡し、AI の回答は時間とともに変化するため、これを定期的に監視すること。
- フレーミング:AI がその商品を具体的かつ明確な属性で説明できるようにすること (具体的なモデル名、明示された用途、具体的な価格など)。一般的な表現でしか説明されないブランドは立場が弱かった。
- 価格データ:構造化され、正確な価格コンテキストを提供すること。保険カテゴリの参加者の 63% は価格について過信しており、AI が提示した見積額が自分の実際の状況に当てはまるかを確認せずに受け入れていた。一方、小売業者によって確認済みの価格がインライン表示されたケース (洗濯機/乾燥機) では、参加者の 85% が価格を明確に理解していた。Merchant Center のフィードや 構造化で設定した価格は、物品の場合に最も直接的に影響する要因である。サービスの場合は、条件付き価格についての編集上のフレーミング (「あなたの場合の料金は X、Y、Z に依存する」など) が同じ役割を果たす。
調査方法
調査は、リモートかつ非対面式のユーザビリティ調査です。
アンケートではなく観察されたユーザーの行動に基づいています。
調査方法の詳細は次のとおりです。
- 参加者: Prolific を通じて募集された 48 名の米国在住ユーザー
- タスク: 参加者 1 名につき最大 4 つの高額商品選定タスク
- カテゴリー: テレビ、ノート PC、洗濯機・乾燥機セット、自動車保険
- 総観察数: タスクレベルで 185 件の観察
- 比較設計: 被験者内 A/B テスト
- 同一の参加者が AI Mode と従来の検索の両方を使用
- これにより、個人間のばらつきを抑えることが可能
- 観察数の内訳: AI Mode タスク 149 件、標準検索タスク 36 件
- データ収集: セッションは画面録画され、思考発話(think-aloud)による音声も記録
- 分析: 専門の分析官が以下の両方をコード化(指標化):
- クリック、リスト作成の起点、信頼の兆候、外部サイトへの訪問などの行動マーカー
- 述べられた理由、ブランドへの言及、不満などの定性的マーカー
ユーザー行動を実際に観察した点において、世論調査よりも信頼性が高いと言えます。
ユーザーが「何をすると言ったか」ではなく、「実際に何をしたか」を捉えられるからです。
ただし、次の理由により、あくまで傾向を示すものであり、母集団レベルの統計ではない点には留意が必要です。
- サンプルサイズが比較的小さい
- 各グループのサイズが不均一である
- そのため、推定値の周囲の幅が広くなる
参加者が 48 名かつ米国のみを対象としているため、今回の知見は市場全体の正確な予測ではなく、行動のシグナルやパターンとして読み取るのが適切でしょう。
◇◇◇
小規模かつ米国での調査ではあるけれど、自分の AI 利用パターンと似ていると感じました。
欲しいものがあるときは、あちこちのサイトを訪問して比較検討するのではなく、AI Mode や Gemini、ChatGPT との会話のなかで目星をつける習慣が確かに僕にはついています。
で、公式サイトあるいは Amazon などに移動して、購入する流れです。
AI Mode を含む AI 検索では、一連の比較プロセスのなかでクリックをもう 1 つ獲得することよりも、次の 3 つの要因が勝敗を左右しそうです。
- 候補リストに入る
- そのなかで高順位を取る
- そしてモデルによって信頼できる形でフレーミングされる
