Amazon QuickSight x 生成AI – Amazon Q in QuickSightを触ってみた

  • データ分析
  • データ加工
  • 生成AI

1. データ分析のエージェントAI

生成AIとは? – 生成AIは企業のデータ活用をどのように進化するのか?」で解説したように、生成AI(ジェネレーティブAI / 生成系AI)は、さまざまな業界で大きな変革をもたらしている。特に最近では、「エージェントAI(Agentic AI)」というキーワードが注目されており、これまで高度な専門教育を受けた人間の専門家しか実行できなかった業務を、AIが自律的に実行する世界が現実のものとなりつつある。例えば、顧客対応の自動化、財務データの異常検知、医療診断の補助など、さまざまな分野でエージェントAIの実用化が進んでいる。各企業はこの分野に注力しており、多くのキーワードやアーリーステージの関連サービスが登場している。

このトレンドは、企業のデータ活用においても例外ではない。生成AIとエージェントAIの発展により、これまで計算機科学(コンピューターサイエンス)の専門教育を受けたデータサイエンティストやデータアナリストが担っていた「データ分析」の業務が、エージェントAIによってコストの削減と自動化が進む可能性が高まっている。特に、BIツールとエージェントAIの融合が進むことで、より直感的な分析が可能になり、データ分析の障壁が大幅に下がると期待されている。

BIサービスの領域では、Amazon QuicksightのエージェントAIを活用することで、従来のBIツールよりも高度なデータ可視化やレポート作成が可能となり、データの活用方法が劇的に変わると考えられている。

本ブログでは、2024年12月のAWS re:Inventで発表されたAmazon Q in Quicksightのクイックレビューを行い、データ分析におけるエージェントAIの現状と今後の可能性について考察する。

2. Amazon Q in Quicksightとは?

Amazon Quicksightは、AWSが提供するBI(ビジネスインテリジェンス)ツールで、Amazon Q in Quicksightは、そのAmazon Quicksightに統合された生成AIベースのアシスタントである。Amazon Quicksight自体は、クラウドネイティブなBIツールとして知られており、企業のデータ可視化やレポート作成を支援するサービスだが、Amazon Qの導入により、従来のBIとは全く異なる体験を提供しようとしている。

Amazon Qは、ユーザーが自然言語で質問を入力することで、BIダッシュボードの作成やデータ分析を支援する。従来であればBIツールの活用において、SQLクエリの記述やデータモデルの理解が必要だったが、Amazon Qを利用することで、データを入力し、簡単な指示を与えるだけで、データの傾向分析や異常値の検出、基本的な要因分析などが自動で実行できるという点を特長としている。また、Amazonのクラウド技術であるAWSサービスを用いて大量のデータ処理を高速かつ効率的に行うことが可能になり、分析環境の最適化を図ることができる。

ユーザーの悩みの種となるBIツールの操作性においても、Amazon Qは直感的なUIを提供し、より多くのビジネスユーザーが活用しやすい設計になっている。

主な機能として、

  • 自然言語クエリ: ユーザーが「今月の売上トレンドを教えて」と入力すると、自動的に関連するデータを抽出し、適切なグラフを作成する。
  • データインサイトの分析: データセットを解析し、異常値の検出やトレンド分析を自動的に提示する。
  • ダッシュボードの作成支援: 自然言語での指示に基づき、ユーザーが希望する視覚的なレポートを簡単に作成できる。さらに、Amazon Quicksightを利用することで、データソースの埋め込みを活用し、BIダッシュボードを外部ポータルサイトや社内システムに統合できる。

このように、Amazon Q in Quicksightは、ユーザーの意図を理解し、適切なデータ処理や視覚化を行うことで、BIの領域におけるエージェントAIの役割を果たしている。これにより、従来はデータアナリストやBIエンジニアが対応していたデータ分析の一部が、より幅広いビジネスユーザーにも開放されることになる。企業は、Amazon Qを活用することで、データドリブンな意思決定を加速させ、競争優位性を高めることが期待されている。Amazon Q in Quicksightの登場は、BIと生成AIの融合の一例として、今後のデータ分析のあり方を大きく変える可能性を秘めている。

次のセクションでは、実際にAmazon Q in Quicksightを試してみた結果を紹介する。

3. Amazon Q in Quicksightを触ってみた

Amazon Q in Quicksightの基本的な使い方は、使いたいデータセット(テーブル)を指定した上で、データに関する質問をAmazon Qに対して問いかける。例えば、以下の例は、クーポン利用に関する3つのCSVファイル(Redemption.csv、Transaction.csv、Customer.csv)を指定し、「Low coupon redemption rate(クーポンの利用率が低い)」と指示を出すと、以下のスクリーンショットにあるように、クーポンの利用率が低い原因についての分析を自動的に実施する。注目すべきは、ユーザーが指示を出さなくても、Amazon Qがデータの読み込み、分析、可視化を自動で実行する点である。

また、必要に応じて、簡単なテーブルの結合を自動的に実施してくれる。以下は、クーポン利用に貢献している要因を問い合わせたところ、「Customer.csv」と「Redemption.csv」を自動的に結合し分析してくれた。結合自体は単なるIDマッチであるが、どのテーブルを組み合わせるべきか?をAmazon Qが自動的に検討している点が興味深い。

しかし、一部の分析結果については検証が必要なケースも多く、誤った解釈を提示する場合もある。例えば以下の例では銅の価格変動について分析をしようとしているが、「The data shows no instances of decreasing copper prices(データソースには銅の価格が下落しているケースが存在しない)」という誤った返答(実際にはCopper.csvが銅の価格変動のデータとなっており、このデータを分析することで、価格の下落要因を分析することができる)をしてしまっている。

また、以下のケースでは、従業員の基本情報(年齢、勤続年数、職種)と離職者のデータを入力して、離職要因の分析を実行しようとしたが、「We need additional information to fully address your request(要望された分析の実行には追加の情報が必要)」として分析が実行できない。このように、Amazon Q in Quicksightは、簡単な分析であっても分析に失敗してしまうケースもまだまだ多いようである。

Amazon Q in Quicksightを触っての総括としては、

  • データを入れるだけで非常に手軽に簡易分析や可視化を、ほぼ工数0で実施できる驚異的な手軽さは魅力。
  • 高度なデータ加工や、データクレンジングなどを実施してくれるわけではないため、入力前に綺麗なデータを準備しておく必要がある。
  • 現状では、分析の失敗や、分析自体の誤り(信頼性)の問題があり、データ分析に詳しくない業務部門が使うツールというよりは、データ分析に詳しい分析者の補助ツール。
  • 現状はベータ版のためレイアウトの乱れや予期せぬエラーが多く、特定のデータセットでは期待した分析結果が得られない場合がある。特に、データの結合や前処理に関する機能が限定的であり、ユーザーが手動で調整する必要があるケースが多い。正式リリースに向けて、分析の精度向上やユーザーインターフェースを期待。

Amazon Q in Quicksight自体は、まだアーリーステージの試行段階という印象であり、特定のデータセットでは期待通りの分析ができないケースや、誤った解釈を提示する場面が見受けられる。特に、データの結合やクレンジング機能が限定的であり、分析の精度や一貫性の面で課題が残る。しかしながら、エージェントAIがデータ分析の在り方を大きく変える可能性を示している点は注目に値する。

4. データ分析におけるエージェントAIの可能性とdotData Insight

上記のクーポン利用率、銅の価格下落、従業員の離職の要因をデータから分析する場合には、一般的には以下のようなステップとなる。

  1. 業務課題を分析して、データを活用した課題解決の企画を実施する(ユースケースの分析)
  2. ユースケースに対して利用可能なデータ(テーブル)を検討し収集する
  3. データの品質や、複数のテーブル間の名寄せ問題など、データクレンジングやデータ加工を実施する
  4. ユースケースで必要な目的がデータ化されていない場合には、目的変数(或いは目的となるKPI)を作成する
  5. 要因の候補の仮説を検討し、データを加工してその仮説を説明変数(特徴量)として作成する
  6. 目的変数と説明変数(特徴量)の間の関係を可視化、統計分析し、要因候補を絞り込む
  7. 要因候補としての説明変数に対して、業務施策として活用する(例えば、クーポン利用率を高めるための施策を検討する)ために、業務観点での解釈を与える

Amazon Q in Quicksightは、ステップ1から5のプロセスを外部で実施した後の、整備されたデータを入力として活用し、主にステップ6(+簡易的なデータ加工)を自動で実施する役割を果たしていると言える。

dotData Insightは、生成AI時代のデータ分析プラットフォームとして、ユースケースの分析から、データクレンジング、特徴量の発見、業務施策の提案までを包括的に支援する。Amazon Qが既に整備されたデータを活用して簡易的な分析を行うのに対し、dotData Insightはデータクレンジングや特徴量の自動生成を含む高度なデータ処理を可能にする。これにより、データ分析のプロセス全体をAIが支援できる点が大きな特長となる(一方で、dotData Insightは、現状ではAmazon Q in Quicksightのような統合的な対話インターフェースは持っていない)。

  • ユースケースアドバイザーによって、AIがユースケースの分析や有効なデータの検討、目的変数の作成方法をアドバイスする(上記のステップ1、ステップ2、ステップ4)
  • AIデータクレンジングによって、AIがデータの品質問題を自動検出し、解決方法を自動的に生成する(上記のステップ3)
  • AIが複数のテーブルの複雑な関係性を網羅的に解析、加工を実施し、特徴量を自動的に発見する(上記のステップ5とステップ6)
  • 統計的な事実としての特徴量に対して、生成AIがビジネス解釈を与え、業務を改善するための施策を提案する

dotData Insightは、これらの非常に強力なAIの要素を統合的に活用し、データ分析を実施するエージェントAIとしての進化を目指していく。

Masato Asahara
Masato Asahara

dotDataの共同創業者で主任ソフトウェアアーキテクト。リアクティブベースのWebアプリケーション、プロセス・リソース管理、分散型AIコアエンジン、Spark / Hadoopベースのシステムプラットフォームなど、dotDataプラットフォームのソフトウェアレイヤー全体の製品設計・管理を指揮。 dotData入社前は、NECでApache Sparkを用いた分散コンピューティングシステムや、AIを活用した業務システムの製品化をリード。 慶應義塾大学にてコンピュータサイエンスの博士号取得。

dotDataのAIプラットフォーム

dotData Insight 業務部門が自ら洞察を導き出す

dotData Insightは、事業部門が主役のビジネスアナリティクスを実現する革新的なデータ分析プラットフォームです。業務データに隠れたパターン(特徴量)を、BIツールのような直感的で使いやすいインターフェースを通じて提供します。dotData独自のAIが解析するデータの特徴を、生成AIの「世界知識」で補完し、実用的なビジネス仮説を生み出します。この融合により、業務部門は、データの洞察を直感的に理解し、新しいビジネス仮説を立て、戦略立案や施策実行をより効果的に行うことができます。

dotData Enterprise データサイエンスのプロセス全体を自動化

dotData Enterpriseは、事業部門やデータ分析部門が、ノーコードで予測AI開発を行うことができるAIプラットフォームです。特徴量自動設計と機械学習自動化(AutoML)によって、AIの専門知識やコーディングなしで、業務データから特徴量の抽出、そして機械学習による予測モデルの構築まで、ワンストップでAIを開発することができます。dotData Enterpriseを使用すると、通常は数か月かかる予測分析を、たった数日で実施でき、素早くビジネスでAIを活用でき、将来の予測やデータからの洞察が得られます。