予測分析をはじめるためのテクニック

  • ブログ

予測分析(Predictive Analytics)は高度な分析(Advanced Analytics)とも呼ばれ、従来のニッチな手法にしか過ぎなかった存在から企業の分析部門に欠かせない存在へと成長を遂げました。市場調査によると分析業界の市場規模は2026年までに3,090億ドル(約45兆円)に達し、その年平均成長率は約40%に達すると予想されています。

新しい予測分析手法やアルゴリズムが利用可能になってきていることで、予測分析の価値が明白になり、分析を行う範囲も広がっています。最近のForbesの記事でもあげられているように、企業はAIの予測力によってパンデミックによる混乱やサプライチェーンの問題を解決し、再び業績を軌道に乗せることが可能です。たとえば予測分析は在庫管理や配送の最適化に特に有用であり、より無駄なく効率的に事業活動ができるようになります。

予測分析とは?

金融メディアサイトのInvestopediaは予測分析手法について、「統計学やモデリング技術を使って将来の結果やパフォーマンスを予測するもの。予測分析は現在と過去のデータパターンを見て、それらのパターンが再び出現する可能性があるかどうかを判断する。」と解説しています。また、IBMはこの技術について「過去のデータを統計的モデリング、データマイニング技術、機械学習と組み合わせ、将来の結果を予測する高度な分析手法の1つである。」と述べています。

ビジネスの観点から見ると、予測分析は大量の過去のデータを分析し、将来のビジネスの成果を約束するあるいは最大化するシナリオを特定するための科学であるといえます。言い換えれば、過去のデータから将来の結果を予測するためのトレンドを示すことで、企業がより積極的にビジネスに取り組むことができるようになるといえるでしょう。

最近のハーバード・ビジネス・レビュー(HBR)の記事では、「予測モデルを取り入れた分析アプローチが、単なる記述的なアプローチに取って代わりはじめている」と解説されています。実際、予測分析は経済予測などカオスシステムの複雑なモデリングが必要な分野で広く利用されているのです。企業は昨今、当て推量への依存を減らすために予測モデリングを採用しはじめています。

予測分析がもたらす代表的な成果は以下の2つです:

たとえば新しい顧客が住宅ローンを申し込んだとき、その顧客が債務不良に陥る可能性はどの程度あるのでしょうか。予測分析は人口統計学、クレジットヒストリー、借入金の程度、収入、その他の要因から新規顧客のリスクスコアを算出できます。類似した顧客から得られた数百万のデータポイントに基づく信用リスクプロファイルは、単なるクレジットスコアに基づく決定に比べ、はるかに精度の高い予測が可能です。

結果予測

サブスク契約の更新など、過去の関与データをチェックすることで、最も収益性の高い顧客が持つ共通要素を特定することができます。例えば、SaaS企業では、サービスの契約を更新する可能性が高い顧客をマーケティング活動のターゲットにしたいと考えるでしょう。予測分析手法を使えば過去の更新データに基づいて更新の可能性が高い顧客の特徴を割り出し、その顧客向けにマーケティング費用をより集中させることができます。

予測分析が一般的に利用する3つの技術:

リスクプロファイリングのための機械学習ベースのソリューションは、一般にルールベースのアプローチよりも優れていますが、機械学習ソリューションの構築には課題があります。たとえば問題の定式化、モデルの開発、利用可能なリソース、対象分野のドメイン知識、モデルメトリクスの検証、そして顧客の採用状況が機械学習プロジェクトの成功を妨げるかもしれません。

機械学習ベースのアルゴリズム開発における課題をより理解するため、あるチェコの銀行から広く入手可能なデータセットに基づくユースケースを考えてみましょう。ここで見積もりたいリスクは、顧客がローンの支払いを不履行にする可能性があるかどうかで、ローンが承認される前にリスクを予測するのが目的です。

1: 分類

分類とは?
分類とは、どの事例がどのカテゴリに所属するか予測することです。

分類の例
AIに既存の融資先と返済実績のデータプールを学習させることで、予測分析によって返済が滞る可能性が高い見込み顧客か否か判断するためのアルゴリズムを開発することができます。

分類のビジネス価値
分類の技術は、収益予測や高いROIを示すマーケティングキャンペーンの決定など、今後取るべき行動の指標を提供するためにも利用可能です。

2: 回帰

回帰とは?
回帰とは、過去のデータを利用して将来の結果を数値で予測することです。

回帰の例
顧客生涯価値(CLV)は収益性を確保するために不可欠です。この情報は過去の顧客データから容易に入手でき、過去の収益データにより、新しい顧客に対してより正確なCLV予測をおこなうことが可能です。

回帰のビジネス価値
過去データから最も高い価値予測を生み出す傾向を見つけることで、よりよい意思決定をおこなうことができるでしょう。改善のために重要なパラメータを特定し、収益の増加を目指せます。また、最も収益を上げる可能性が高い顧客を特定することで、投資の優先順位づけが容易になります。

はじめての予測分析採用前に検討すべき重要なステップ

経営目標を明確にする

自社が保有するデータ、あるいは入手しやすいデータをしっかりと確認しましょう。何年分のデータを有しているのか、データを整理したり最適化したりする必要があるか、アルゴリズムの学習に必要なデータソースをすべて持っているか、などです。
予測分析は過去のパターンに基づいて予測をおこなうため、データ量やデータの多様性は非常に重要です。

3. データの準備とエンジニアリング

データの状態や予測アルゴリズムで使用するデータポイント数にもよりますが、予測分析の中核を担う機械学習のためのデータの整理や準備には、数週間から数カ月かかることもあります。

詳細な情報欠落ができるだけ少なく、かつ数、日付、量が正規化されているか確認する必要があります(通貨単位や日付の書き方が混在しないかなど)。場合によってはデータの一貫性を確保するため人手でデータを再入力する必要があるかもしれませんが、データのクレンジングツールや自動化ツールによってこの処理を加速することもできます。

4. 構築、検証、反復、調整

データの準備が整ったら最初のモデルを作成し、データのサブセットでその有効性をテストします。テスト結果から改善点が見つかれば、モデルを再調整していきます。そして、より広範囲をカバーできるシステムが完成したら、最も有用と考えられる予測を正確に返す、システムになるよう微調整していきます。また、分析結果の表示方法(ダッシュボード、レポート、プレゼンテーション)、誰にアクセスを許可するかについても計画することをおすすめいたします。

5. プロセスと学習の共有

完全に機能する予測分析プロセスが完成したら、あとはその予測を意思決定に取り入れるための方法を考えるだけです。まずは、関係者を研修する時間は確保しておくことが重要です。関係者を巻き込み、この新しいツールの有用性をアピールできるデモを行い、得られた貴重な洞察を取り入れるためのプロセスを構築します。

6. モニタリングと再学習

最初の予測分析モデルの「展開」には必ずしも必要ありませんが、運用中のモデルの精度と妥当性を確認し続けることは非常に重要です。経済状況や市場競争力の変化などの外部要因は、時間の経過とともにモデルの精度を低下させる可能性がある要因の一例です。すべてのモデルはゆくゆくは「調整」、再学習させる必要があるためモデルを再学習の計画をあらかじめ立てておく必要があります。

予測分析導入時に発生する一般的な問題

予測分析の取り組みを遅らせたり停止させたりする技術的な課題は数多くありますが、特に2つの課題がプロジェクトを頓挫させることが良くあります。1つ目はノウハウ不足です。予測分析をはじめて検討する企業は、正確なモデルを構築するために必要なデータエンジニアリング、データサイエンス、機械学習のスキルが不足していることが良くあります。こうしたスキルを持つ人材の採用にはコストと時間がかかるため、中小企業では簡単に実現できません。

2つ目の課題は人材不足であり、こちらは中小企業だけでなく大企業にも関連します。データサイエンスやデータエンジニアリングのスキルを持つ人材の発見は大企業でさえ課題となっています。スキル不足は前述のステップ3と4に対処するために重要です。手作業でデータを準備し、モデルを評価するのには時間がかかりますので、高価な人材に対して大きな投資を必要とします。

dotDataはどのように課題解決に貢献できるのか

dotDataの自動化されたソリューションは、予測分析技術で投資に対するリターンを最大化しようとしている企業にとって理想的なものです。dotData Pyは、加工・処理されていない企業データを自動的に処理するので、データサイエンスチームが機械学習にデータ準備に活用できます。

予測分析をはじめたばかりの企業は、dotData Enterpriseのエンドツーエンドの自動プラットフォームの利用をお勧めいたします。

より詳しい説明は是非、各種製品ページへ。
また、弊社の製品・サービスに少しでも興味を持った方は是非、お気軽にお問いあわせください。

dotData
dotData

dotData独自の技術である特徴量自動設計は、データサイエンスおよびAI開発工程の最も難しい部分である特徴量設計と事業適用化を自動化します。それにより、企業のAI・機械学習プロジェクトにかかる時間を短縮させ、より高いビジネス価値を生み出します。詳細はdotdata.com、Twitter、LinkedInからご確認いただけます。