Blog-Sharada1-1024x637
AIで保険業界の保険解約率を削減

AI自動化によって様々な保険のユースケースに適用し、多様な問題を解決   保険業界は、データドリブンな意思決定と機械学習を先駆けて取り入れてきた業界です。ここ数年で保険会社が扱うデータ量は著しく増え、顧客へよりよいサービスを届けるための革新的な意思決定を行うために、膨大なデータから知見を導き出すAIや機械学習の利用が増えてきました。データの量と種類が増え、保険業界のニーズが高まると共に、AIや機械学習を利用して解決できる問題の種類が飛躍的に増えているのです。 下の図は、機械学習を活用できる事業分野と、どの程度の保険会社が導入を検討しているかを示しています。 様々な問題を機械械学習を使って解決していくとなると、データサイエンティストの工数は限られているため、企業もデータサイエンティストも問題に1つずつ取り掛かるしかありません。しかし、時間がかかれば市場投入が遅れ、機会損失に繋がります。データサイエンティストが、より価値の高いソリューションをビジネスへ届けるために、機械学習のノウハウとベストプラクティスを取り入れてプロセスを加速化することは可能なのでしょうか? 損害保険会社のトップ企業は機械学習とAIの開発の自動化技術を活用して、解約の可能性のある契約者の特定、新規顧客の獲得の予測、クレームへの対応改善するための予測など、様々な問題に6ヶ月足らずで機械学習を導入しました。 このブログでは、どの顧客が契約継続をしどの顧客が解約に至る傾向があるのか事例を交えて紹介いたします。 データ 契約者が保険を解約するかどうかを予測するためには、まず、解約した契約者に関する過去のデータが必要です。予測に使うデータは、契約者の基本情報、契約内容や過去のトランザクション、人口統計情報を含む、過去4年間に更新及び解約に至った数十万の保険契約者のデータです。 課題 アンバランスなデータとは: 予測対象となる事例の発生件数が少なく、サンプル数が不均等になるという問題です(事例の発生データに対して、事例が発生していないデータが圧倒的に多い)。データの不均等は様々な業界で散見されますが、保険業界では、例えば保険契約の解約件数が少ない場合がこれにあたり、機械学習のモデルを開発する際にの課題となります。どういった契約者が解約する傾向があるか?という点について、サンプル数が少ないためにデータからパターンを読み取るのが困難になるからです。データサイエンティスト達はデータのバランスを取るため様々なテクニックを試し、モデルがなるべく効率よく学習できるよう工夫しなくてはいけません。ここでdotDataはアンバランスなデータの問題に対処するために、層別サンプリングなどの手法を自動的に適用し、不均等なデータに対しても高い精度で解約を予測することを可能にしました。 データの前処理: 精度の高いモデルを開発するためには、さまざまなデータを掛け合わせる必要があり、機械学習モデルを開発する前に、データを統合・整理の上、適切なフォーマットに落とし込む必要があります。この作業は「データ準備」とも言い、機械学習モデルの開発で一番時間を要する厄介なプロセスで、入力データである「特徴量設計」を作成するために、数ヵ月も要する場合があります。 そこで、データサイエンティストはdotData独自の特徴量自動設計を使い、必要最低限のデータの前処理のみを行い、dotDataが自動で生成した特徴量を活用して、モデルの精度を向上させることができました。 ソリューション 機械学習モデル構築の加速:dotaDataを利用して、データサイエンティストは最小限の処理で生のデータから数十万の特徴量と、数百の機械学習モデルを2時間程度で探索しました。これらのモデルは、特徴量選択、データバランシング技術、アルゴリズムの種類、ハイパーパラメータ等の様々な組み合わせを検証しており、データサイエンティストは、最適なモデルと特徴量を素早くに選出することができました。 精度の向上:最終的にdotDataが構築したモデルは既存のソリューションより20%も精度が高く、結果として大幅な解約率の提言に繋がりました。 トライアンドエラーの簡易化容易に検証可能:dotData は様々な特徴量やモデルを探索し、問題を解決するための最適な組み合わせを見つけだします。自動適用します。これによって、データサイエンティストは様々なデータセットの組み合わせを取り込み、dotDataの特徴量をビジネスにどのように活用するかに集中することができます。…