Blog 2021-5-10
2021年以降のAI・機械学習のトレンドトップ5

2020年は新型コロナウイルスの影響により世界が激動した一年でした。2021年は世界経済の流れに楽観的な見方も出てきていますが、ビジネスには、新しい現実に適応して方向転換することが求められています。新型コロナウイルスによって起きた危機的状況は、特にデジタルトランスフォーメーションによるイノベーションの大きな影響力を実感させるものとなりました。このブログでは、人工知能(AI)・機械学習(ML)に関して、2021年以降にその勢いが加速しそうなトレンドのいくつかをご紹介します。 拡張分析(Augmented Analytics)で事業部門が変わる ‐ 拡張分析とは、データ準備、インサイト(ビジネスの知見)の提供、分析結果の解釈など、データの探索や分析を、AIやML技術によって強化・自動化・支援します。近年、この拡張分析を実現するBIプラットフォームが登場してきています。AIは、企業のデジタルトランスフォーメーションを実現するために不可欠な技術ですが、企業はビジネスにAIをどのように取り入れて業務を革新することができるのか、その効果的な方法を模索しています。組織の業務効率化が状況の中、事業部門がAI・MLモデルを開発し、そして運用していくことが必要になってくるでしょう。事業部門主導のAI開発は、次の二つの理由から存在感を増しつつあります。第一に、機械学習自動化プラットフォームの出現によって、専任のデータサイエンティストを持たない事業部門であっても、AI開発が可能となってきています。第二に、事業部門は、データサイエンティストよりもビジネス現場のユースケースを熟知しているため、「要件」から実際の現場で必要とされるモデルに至るまでのサイクルを短縮できることです。AIを活用した自然言語処理、テキスト分析、予測ダッシュボードなどの機能を提供できる事業部門のビジネスパーソンが増えていけば、「事業部門における拡張分析」が新しい標準になるでしょう。 ノーコードAIにより誰でもAI/MLが利用可能に。AIを利用したアプリケーションの需要が高まるにつれ、世界中の企業がデータサイエンスプロセスの加速と民主化を促進する技術に投資しています。民主化とは、プログラミングを必要としない「ノーコードAI」によって、データサイエンスの専門知識がない業務部門が高度な分析ができるようになることを意味します。ノーコードAIプラットフォームの多くはワークフロー主体で、視覚的なドラッグ&ドロップのツールにより、専門的な知識を持たない人にとっても使いやすいということを売りにしています。一方で、一見すると簡単な操作ですむように見えても、実際のAI / MLを開発するワークフローの多くは、大規模で複雑で、実際には非常に高度かつプログラミングが必要となることが多い点には注意が必要です。企業におけるデータサイエンティストが担当する業務は、機械学習モデルの作成などの統計や最適化よりも、特徴量設計をはじめとするデータと業務知見に関することがほとんどです。その意味で、ノーコードAIは、機械学習のモデルを自動生成するだけではなく、自動的に多彩な業務データを分析し、数千もの特徴量の仮説を設計・評価し、運用のためのエンドポイントを生成する、さらに広い自動化が必要とされます。そのような「ノーコードAI 2.0」プラットフォームの到来によって、企業における分析の民主化は新しい段階に入るでしょう。 リアルタイムAIとIoTがスマートマニュファクチャリングを実現。新型コロナウイルス危機ではサプライチェーンが乱れ、中小企業が破綻し、食料品店の品薄や、オンラインストアでは必需品が在庫切れになる事態が起きました。製造業は急速に変化する環境に柔軟に対応するために高度な技術を積極的に導入し、業務を改革することが急速に求められ、いよいよIndustry 4.0の取り組みは、PoCから製造現場へ移ってきました。サプライチェーンの乱れを予測したり、生産現場における計画外のダウンタイムの防止など、リアルタイムAIによって製造業は柔軟で素早い意思決定を行うことができるようになります。製造業界が予測分析と処方分析を導入していくことで、ユビキタスセンサーやリアルタイム品質監視により製品リコールは大きく減少することになるでしょう。リアルタイムAIとIoTの融合で、より効率的で、強靭かつ柔軟な製造業へと進化するでしょう。 AIによる自動化がデジタルトランスフォーメーションを加速する。デジタルトランスフォーメーションのテーマは、組織効率の最適化、データに基づいたより深いビジネスの洞察、ビジネスの意思決定の自動化に向けたAI活用です。AIで可能になるデジタルトランスフォーメーションは、金融サービス、保険、製造業といった「アーリーアダプター」から他の業界に拡大していくでしょう。そして、効率化を推進させ、新しい製品やサービスを創出するため、AIとMLはビジネス分野全体に渡る複数の業務に組み込まれるでしょう。AutoMLプラットフォームを利用すれば、AIの導入の敷居を下げ、時間のかかるAI導入へのリードタイムを短縮し、より素早く、そして正確な将来予測を実現し、デジタルトランスフォーメーションの取り組みを加速させます。 責任あるAI、説明可能性、モデルの解釈可能性がより重要に。AIにおけるバイアス、規制、プライバシー情報の重要性が高まり、透明性の高いAIや倫理的で信頼できるAIは、AIを活用する全ての企業にとって重要な課題となります。より多くの企業がAIをビジネスプロセスに導入していくにあたり、ML/AIモデルによって自動化される決定に対する説明責任やリスクを考える必要があります。そのなかで、解釈可能な特徴量は、企業がデータに基づいて下す決定の説明責任を確保し、コンプライアンス要件を満たすために役立ちます。ホワイトボックスモデルは、モデルがどのように振る舞い、予測を生成し、どのような変数が結果に影響を与えるのかを説明します。モデルをホワイトボックス化することで、説明責任のあるAIが実現でき、企業のAI/MLモデルの開発者、モデル利用者、ビジネスチームは複雑なAI案件を十分な自信と確実性を持って実行し、信頼を築くことができます。


Blog-Sharada1-1024x637
AIで保険業界の保険解約率を削減

AI自動化によって様々な保険のユースケースに適用し、多様な問題を解決   保険業界は、データドリブンな意思決定と機械学習を先駆けて取り入れてきた業界です。ここ数年で保険会社が扱うデータ量は著しく増え、顧客へよりよいサービスを届けるための革新的な意思決定を行うために、膨大なデータから知見を導き出すAIや機械学習の利用が増えてきました。データの量と種類が増え、保険業界のニーズが高まると共に、AIや機械学習を利用して解決できる問題の種類が飛躍的に増えているのです。 下の図は、機械学習を活用できる事業分野と、どの程度の保険会社が導入を検討しているかを示しています。 様々な問題を機械械学習を使って解決していくとなると、データサイエンティストの工数は限られているため、企業もデータサイエンティストも問題に1つずつ取り掛かるしかありません。しかし、時間がかかれば市場投入が遅れ、機会損失に繋がります。データサイエンティストが、より価値の高いソリューションをビジネスへ届けるために、機械学習のノウハウとベストプラクティスを取り入れてプロセスを加速化することは可能なのでしょうか? 損害保険会社のトップ企業は機械学習とAIの開発の自動化技術を活用して、解約の可能性のある契約者の特定、新規顧客の獲得の予測、クレームへの対応改善するための予測など、様々な問題に6ヶ月足らずで機械学習を導入しました。 このブログでは、どの顧客が契約継続をしどの顧客が解約に至る傾向があるのか事例を交えて紹介いたします。 データ 契約者が保険を解約するかどうかを予測するためには、まず、解約した契約者に関する過去のデータが必要です。予測に使うデータは、契約者の基本情報、契約内容や過去のトランザクション、人口統計情報を含む、過去4年間に更新及び解約に至った数十万の保険契約者のデータです。 課題 アンバランスなデータとは: 予測対象となる事例の発生件数が少なく、サンプル数が不均等になるという問題です(事例の発生データに対して、事例が発生していないデータが圧倒的に多い)。データの不均等は様々な業界で散見されますが、保険業界では、例えば保険契約の解約件数が少ない場合がこれにあたり、機械学習のモデルを開発する際にの課題となります。どういった契約者が解約する傾向があるか?という点について、サンプル数が少ないためにデータからパターンを読み取るのが困難になるからです。データサイエンティスト達はデータのバランスを取るため様々なテクニックを試し、モデルがなるべく効率よく学習できるよう工夫しなくてはいけません。ここでdotDataはアンバランスなデータの問題に対処するために、層別サンプリングなどの手法を自動的に適用し、不均等なデータに対しても高い精度で解約を予測することを可能にしました。 データの前処理: 精度の高いモデルを開発するためには、さまざまなデータを掛け合わせる必要があり、機械学習モデルを開発する前に、データを統合・整理の上、適切なフォーマットに落とし込む必要があります。この作業は「データ準備」とも言い、機械学習モデルの開発で一番時間を要する厄介なプロセスで、入力データである「特徴量設計」を作成するために、数ヵ月も要する場合があります。 そこで、データサイエンティストはdotData独自の特徴量自動設計を使い、必要最低限のデータの前処理のみを行い、dotDataが自動で生成した特徴量を活用して、モデルの精度を向上させることができました。 ソリューション 機械学習モデル構築の加速:dotaDataを利用して、データサイエンティストは最小限の処理で生のデータから数十万の特徴量と、数百の機械学習モデルを2時間程度で探索しました。これらのモデルは、特徴量選択、データバランシング技術、アルゴリズムの種類、ハイパーパラメータ等の様々な組み合わせを検証しており、データサイエンティストは、最適なモデルと特徴量を素早くに選出することができました。 精度の向上:最終的にdotDataが構築したモデルは既存のソリューションより20%も精度が高く、結果として大幅な解約率の提言に繋がりました。 トライアンドエラーの簡易化容易に検証可能:dotData は様々な特徴量やモデルを探索し、問題を解決するための最適な組み合わせを見つけだします。自動適用します。これによって、データサイエンティストは様々なデータセットの組み合わせを取り込み、dotDataの特徴量をビジネスにどのように活用するかに集中することができます。…


AI Time Journal logo
Interview with Ryohei Fujimaki, CEO & Founder at dotData