generative ai

生成AIとは? – 生成AIは企業のデータ活用をどのように進化するのか?

  • データ分析
  • 生成AI
  • DX
  • ビジネスアナリティクス

はじめに

生成AI(ジェネレーティブAI /生成系AI)は、さまざまな業界で大きな変革を起こし始めています。企業における生成AIの活用の鍵となるのは、企業内のデータです。また、データを活用する上で必要とされる人材にも、大きな影響を与えています。

このブログは、企業におけるデータ活用の新しい地平を開く、生成AIの可能性についてのシリーズの第一弾です。どのように生成AIが企業のデータ活用を変える可能性があるのか、そしてそれが企業のデジタルトランスフォーメーション(DX)戦略の核心であるデータ戦略と人材戦略にどのような影響を与えるかについて概説します。

生成AIに関する基本的な解説や画像生成AIとしての解説、識別系AIとの違いなどについては、既に多くの記事で扱われているため、本ブログシリーズでは、今後、生成AIの活用事例や、生成AIの仕組みとしてLLM(大規模言語モデル)、LangChainなどのトピックを、「企業のデータ活用」という切り口に焦点を当てて解説していく予定です。

生成AIを理解する上で重要な3つの「知識」

生成AIとは

生成AI、あるいはジェネレーティブAIとは、大規模言語モデルやLLMと呼ばれる巨大なニューラルネットワークモデルであり、文書や画像など、様々なコンテンツを生成することができるAIモデルで、ユーザーからの自然言語による質疑を入力とする対話型AIです。

生成AIとデータ活用の関係を深く掘り下げるには、理解すべき3つの「知識」があります。

第一の知識は、「世界知識」としての生成AIが学習している情報です。生成AIは、インターネット上などから収集された大量のデータを、巨大なニューラルネットワークモデルに学習させた「世界の知識のデータベース」のようなものです。企業データ活用においては、「外部データ」の利用がしばしば重視されますが、特にインターネット上で入手可能な外部データは、生成AIのもつ「世界知識」を通じてアクセスすることが可能になります。

第二の知識は、「ドメイン知識」としての業務経験や業務マニュアルに記載された情報としての専門知識を指します。生成AIは広範な一般知識を持ち合わせているものの、特定の企業や業界特有の知識は自ら持っているわけではありません。そのため、生成AIを業務に適用するには、ドメイン知識をデータ化し、生成AIと組み合わせる必要があります。ドメイン知識の重要性は、生成AIの登場前から企業のデータ活用において認識されていましたが、生成AIを活用する上ではこの知識のデータ化が不可欠です。

第三の知識は、業務で蓄積されたデータ内に潜むパターンや「データから導き出される知識(特徴量)」です。企業でのデータ分析の目的は、一般的な知識や直感ではなく、データから関連するパターンを発見し、客観的な事実に基づく意思決定を行うことにあります。生成AIはデータ分析を置き換えるものではなく、世界知識、ドメイン知識、そしてデータからの知識(特徴量)を統合することで、企業のデータ活用を進化させる鍵となります。

解約分析を例にすると、生成AIに顧客が解約する理由を問うと、一般的な理由を回答します。しかし、自社の顧客がなぜ解約してしまうのかを明らかにすることは、生成AIでは対応できません。また、営業部門のセールスプレイブックには、「顧客のサービス利用頻度が下がった場合には解約のリスクが高まるため注意が必要」「アカウント営業を通じた顧客エンゲージメントの向上が重要」といった解約防止のための知見や業務の知識(ドメイン知識)が記載されています。一方で、業務データを分析すると、顧客の行動履歴から解約への兆候となる様々なパターンを特定することができます。これにより、データに基づく客観的な解約防止策を策定できるだけでなく、顧客の解約傾向の変化に対する新しい洞察や気付きを得ることが可能になります。

生成AIの世界知識

生成AIによるデータ活用の2つのアプローチ

生成AIを活用したデータの扱い方には、2つの大きく異なるアプローチが存在します。それぞれ異なる用途に適しています。

まず第一のアプローチとして、生成AIにドメイン知識を学習させ、それを基に要約、ドキュメントのドラフト作成、文書検索などのタスクを、特定の業務に応用する方法があります。前述したように、このアプローチでは、ドメイン知識を生成AIが扱いやすい形式で整理し、RAG(Retrieval Augmented Generation)やファインチューニングといった技術を用いて生成AIと統合します。このプロセスで特に重要なのは、生成AIに供給するデータの質です。通常、高品質で構造化された大量のテキストデータや辞書の準備が求められます。

次に、第二のアプローチでは、生成AIに直接データ分析を行わせるか、または分析作業を支援させる方法があります。例として、ChatGPTにCSVファイルを入力すると、データのサマリーや基本的な可視化を自動的に生成してくれます。こうしたデータ分析や可視化は、将来的にはBIツールよりも、瞬時に結果を提供できる生成AIによって行われるようになるかもしれません。ただし、生成AIが大規模な業務データを直接扱うことは難しく、またその利用コストも高くなりがちです。そのため、従来のBIツールによる分析と、生成AIを活用した手軽な分析を、適切に組み合わせて利用することが重要となります。

生成AIのデータ活用におけるハルシネーションの問題

生成AIの活用において直面する課題の一つが、「ハルシネーション」と呼ばれる現象です。これは、生成AIが回答を作り出す過程で、誤った情報を正確なものとして提示してしまう問題を指します。例として、会議の議事録を自動生成する際、実際には合意されていないアクションアイテムを、合意されたかのように記録してしまうケースが挙げられます。統計モデルとしての性質上、生成AIではこの問題を完全に回避することは難しく、ある程度のハルシネーション発生は避けられない現実として受け入れなければなりません。

特に、本ブログで取り上げているデータ分析への生成AIの適用にあたっては、ハルシネーションは無視できない重要な課題です。データ分析では、統計的分析結果の正確性が最も重要であり、そこから導き出されるビジネス上の意味合いや決定に影響を与えます。しかし、生成AIを使った分析では、特にデータが複雑な場合、ハルシネーションによって分析結果そのものが誤って生成される恐れがあります。生成AIをデータ分析に応用する際には、たとえ効率化が可能であっても、ユーザーは生成AIの提供する結果を盲目的に受け入れるのではなく、直感に反する結果が得られた場合は元のデータを検証し、真偽を確かめるための分析スキルやリテラシーが求められます。

生成AIによって変わる「データ人材」

生成AIが台頭する中で、企業内のデータ人材にはどのような変化が求められるのでしょうか?生成AIは、あくまで一つのツールに過ぎず、データ人材を置き換える存在ではありません。しかし、データの可視化やサマリー作成といったシンプルな作業は、生成AIによって自動化されるようになります。このため、分析業務は大幅に効率化されることになるでしょう。重要なのは、生成AIが提供するサマリーや可視化の内容を精査するリテラシーに加え、単に「データを分析するスキル」を超え、「データ分析結果をもとに業務改善策を提案できる能力」がより一層求められるようになります(ビジネスアナリティクスの実現するDX人材とデータドリブンな組織文化の変革)。

また、生成AIを使いこなすためには、1)生成AIに高品質なテキストデータを入力することでドメイン知識を覚えさせる、2)生成AIに対する「プロンプト(Prompt)」と呼ばれる命令文を正しく記述する、ことが必要になります。そのため、生成AIを前提としたデータ整備は、今後ますます重要性がますことになります。プロンプトについては、「プロンプトエンジニア」と呼ばれる役割が出現しています。これは生成AIへの命令文をチューニング可能な人材で、短期的には生成AIのアプリケーションを開発するために企業に必要な人材となります。一方で、データ分析との関連からは、プロンプトエンジニアよりも、業務部門やデータを活用する人材が、生成AIを活用してどのようにデータからの洞察を引き出すか、というプロンプトの使い方を知ることが重要となります。

dotData Insight – 特徴量と生成AIが変革するビジネスアナリティクス

dotDataでは、「データからの知識」である特徴量と、生成AIを融合したdotData Insightによって企業のビジネスアナリティクスを推進しています。dotDataの独自のAIが、従来の手作業による分析では発見することができなかった、或いは、数週間から数ヶ月もの時間がかかっていた、複雑な業務データの重要なパターン(特徴量)を抽出します。そして、データからわかる統計的な事実としての「特徴量」を、生成AIの「世界知識」で補完し、実用的なビジネス仮説の検討を支援します。この融合により、業務部門はデータの洞察を直感的に理解し、新しいビジネス仮説を立て、戦略立案や施策実行をより効果的に行うことができます。

dotData Insight

生成AIに関するブログシリーズ

生成AIブログ – パート1 :生成AIとは? – 生成AIは企業のデータ活用をどのように進化するのか?(このブログ)

生成AIブログ – パート2 :LLMとは? – 大規模言語モデルのデータアナリティクス応用

生成AIに関するウェビナー

生成AIのセキュリティ

dotData
dotData

dotData独自の技術である特徴量自動設計は、データサイエンスおよびAI開発工程の最も難しい部分である特徴量設計と事業適用化を自動化します。それにより、企業のAI・機械学習プロジェクトにかかる時間を短縮させ、より高いビジネス価値を生み出します。詳細はdotdata.com、Twitter、LinkedInからご確認いただけます。

dotDataのAIプラットフォーム

dotData Enterprise データサイエンスのプロセス全体を自動化

dotData Enterpriseは、事業部門やデータ分析部門が、ノーコードで予測AI開発を行うことができるAIプラットフォームです。特徴量自動設計と機械学習自動化(AutoML)によって、AIの専門知識やコーディングなしで、業務データから特徴量の抽出、そして機械学習による予測モデルの構築まで、ワンストップでAIを開発することができます。dotData Enterpriseを使用すると、通常は数か月かかる予測分析を、たった数日で実施でき、素早くビジネスでAIを活用でき、将来の予測やデータからの洞察が得られます。

dotData Insight 業務部門が自ら洞察を導き出す

dotData Insightは、事業部門が主役のビジネスアナリティクスを実現する革新的なデータ分析プラットフォームです。dotDataの隠れたパターン(特徴量)を、BIツールのような直感的で使いやすいインターフェースを通じて提供します。dotData独自のAIが解析するデータの特徴を、生成AIの「世界知識」で補完し、実用的なビジネス仮説を生み出します。この融合により、業務部門は、データの洞察を直感的に理解し、新しいビジネス仮説を立て、戦略立案や施策実行をより効果的に行うことができます。