Al/機械学習を導入した企業の8割が失敗。成功させる5つのコツとは?

調査会社のGartnerによれば、データ分析やビジネスインテリジェンス(BI)を活用している企業のうち、2022年までにビジネス上の成果を出せる見込みがあるのはたったの20%であるというデータが出ているのはご存じでしょうか? また、北米大手のVentureBeat AIによれば、データサイエンスの導入を検討した企業のうち、実用までに至っているのは13%しかありません。 とりわけ、AI/MLのプロジェクトにいたっては、12%とさらに低い数字となっています。 こうした事実は、データ分析、データサイエンス、機械学習の導入が難しいことを物語っています。 しかし、なぜ多くのプロジェクトが失敗に終わるのでしょうか? この記事では、AI/MLを活用してビジネスで成功させるためのコツを5つご紹介します。   問題とゴールを明確にして、データ分析を行うものに優先順位を付ける データ分析を検討する際にまず考えるべきことは、「どの問題をデータ分析で解決するのか」という取捨選択とその優先順位の決定です。 理由は3つあります。 たいていの会社では、同時に多くの問題を抱えているため 問題すべてを同じタイミングで対処できることはまずありません。 したがって、まず「何を行うべきか(そして、何を行わないのか)」を決める必要があります。 人工知能は万能薬ではないため 「どんな問題もAIに任せれば解決する」というわけではありません。 AIが得意とするのは、いわゆる「ビッグデータ」と呼ばれる巨大なデータ群から、人の目では発見の難しいデータの共通性や特徴を分析する作業です。 また、AIはあくまで分析のみを行います。 分析した結果をもとに意思決定を行うのはあくまで人間であるということを理解する必要があります。 データ分析はとても時間がかかるため…



AMP – データサイエンティストの価値をさらに向上。特徴量設計をAIで自動化するdotDataのユニークネス



AutoMLによる多次元時系列予測への挑戦

背景 世界最大のデータサイエンスコミュニティであるKaggleとニコシア大学は、世界最大の小売業者であるウォルマートが販売する何千もの商品の売り上げを予測する国際コンペを主催し、4カ月間にわたるコンペには世界中から5,500以上のチームが参加しました。課題は米国3州にあるウォルマート10店舗における3000種類の商品の日次売り上げを予測するというもので、利用可能なデータは、商品レベル、部門、商品カテゴリー、カレンダー、販売価格と店舗詳細です。 今回、「M5 Forecasting – Accuracy」で公開されているデータにdotDataのAI自動化を適用したところ、上位1.8%(5,500以上の参加チーム中102位)相当のスコアを自動的に得ることができました(注:dotDataがチームとしてコンペに参加したわけではなく、コンペ終了後に公開されたデータによる検証となります)。できる限り自動的に実施するために、データの前処理はほとんど実施せず、作業そのものは、dotData社員が一人で1時間程度でした。このブログでは、dotDataプラットフォームによって、ビジネスアナリストや業務部門のメンバーのような市民データサイエンティストであっても、最小限の作業によって世界レベルのデータサイエンティストとも競い合えるレベルの結果を出せるということをお伝えします。   タスク:超高次元時系列予測 需要予測、収益予測、売上予測といった時系列予測は多くのビジネスに共通する最も基本的な問題です。予測手法は多数ありますが(例:標準的な自己回帰モデルや状態空間モデル、最近では、長短期記憶ニューラルネットワーク(LSTM)など)、実世界の時系列予測問題は簡単なものではありません。 このコンペの課題はSKU(Stock Keeping Unit、最小在庫管理単位)レベルの商品需要を予測することで、これは小売業者が在庫管理を最適化するために非常に重要となります。データを扱う際に直面するいくつかの課題は次のとおりです。 データは基本的に超高次元時系列で構成されている(商品3000品目以上×10店舗で30000系列を超える時系列データ) 店舗・商品レベルの時系列の多くはスパースでノイズが大きい データは階層的な構造を持っており(州レベル – 店舗レベル – 商品カテゴリーレベル –…


Blog 2021-5-10
2021年以降のAI・機械学習のトレンドトップ5

2020年は新型コロナウイルスの影響により世界が激動した一年でした。2021年は世界経済の流れに楽観的な見方も出てきていますが、ビジネスには、新しい現実に適応して方向転換することが求められています。新型コロナウイルスによって起きた危機的状況は、特にデジタルトランスフォーメーションによるイノベーションの大きな影響力を実感させるものとなりました。このブログでは、人工知能(AI)・機械学習(ML)に関して、2021年以降にその勢いが加速しそうなトレンドのいくつかをご紹介します。 拡張分析(Augmented Analytics)で事業部門が変わる ‐ 拡張分析とは、データ準備、インサイト(ビジネスの知見)の提供、分析結果の解釈など、データの探索や分析を、AIやML技術によって強化・自動化・支援します。近年、この拡張分析を実現するBIプラットフォームが登場してきています。AIは、企業のデジタルトランスフォーメーションを実現するために不可欠な技術ですが、企業はビジネスにAIをどのように取り入れて業務を革新することができるのか、その効果的な方法を模索しています。組織の業務効率化が状況の中、事業部門がAI・MLモデルを開発し、そして運用していくことが必要になってくるでしょう。事業部門主導のAI開発は、次の二つの理由から存在感を増しつつあります。第一に、機械学習自動化プラットフォームの出現によって、専任のデータサイエンティストを持たない事業部門であっても、AI開発が可能となってきています。第二に、事業部門は、データサイエンティストよりもビジネス現場のユースケースを熟知しているため、「要件」から実際の現場で必要とされるモデルに至るまでのサイクルを短縮できることです。AIを活用した自然言語処理、テキスト分析、予測ダッシュボードなどの機能を提供できる事業部門のビジネスパーソンが増えていけば、「事業部門における拡張分析」が新しい標準になるでしょう。 ノーコードAIにより誰でもAI/MLが利用可能に。AIを利用したアプリケーションの需要が高まるにつれ、世界中の企業がデータサイエンスプロセスの加速と民主化を促進する技術に投資しています。民主化とは、プログラミングを必要としない「ノーコードAI」によって、データサイエンスの専門知識がない業務部門が高度な分析ができるようになることを意味します。ノーコードAIプラットフォームの多くはワークフロー主体で、視覚的なドラッグ&ドロップのツールにより、専門的な知識を持たない人にとっても使いやすいということを売りにしています。一方で、一見すると簡単な操作ですむように見えても、実際のAI / MLを開発するワークフローの多くは、大規模で複雑で、実際には非常に高度かつプログラミングが必要となることが多い点には注意が必要です。企業におけるデータサイエンティストが担当する業務は、機械学習モデルの作成などの統計や最適化よりも、特徴量設計をはじめとするデータと業務知見に関することがほとんどです。その意味で、ノーコードAIは、機械学習のモデルを自動生成するだけではなく、自動的に多彩な業務データを分析し、数千もの特徴量の仮説を設計・評価し、運用のためのエンドポイントを生成する、さらに広い自動化が必要とされます。そのような「ノーコードAI 2.0」プラットフォームの到来によって、企業における分析の民主化は新しい段階に入るでしょう。 リアルタイムAIとIoTがスマートマニュファクチャリングを実現。新型コロナウイルス危機ではサプライチェーンが乱れ、中小企業が破綻し、食料品店の品薄や、オンラインストアでは必需品が在庫切れになる事態が起きました。製造業は急速に変化する環境に柔軟に対応するために高度な技術を積極的に導入し、業務を改革することが急速に求められ、いよいよIndustry 4.0の取り組みは、PoCから製造現場へ移ってきました。サプライチェーンの乱れを予測したり、生産現場における計画外のダウンタイムの防止など、リアルタイムAIによって製造業は柔軟で素早い意思決定を行うことができるようになります。製造業界が予測分析と処方分析を導入していくことで、ユビキタスセンサーやリアルタイム品質監視により製品リコールは大きく減少することになるでしょう。リアルタイムAIとIoTの融合で、より効率的で、強靭かつ柔軟な製造業へと進化するでしょう。 AIによる自動化がデジタルトランスフォーメーションを加速する。デジタルトランスフォーメーションのテーマは、組織効率の最適化、データに基づいたより深いビジネスの洞察、ビジネスの意思決定の自動化に向けたAI活用です。AIで可能になるデジタルトランスフォーメーションは、金融サービス、保険、製造業といった「アーリーアダプター」から他の業界に拡大していくでしょう。そして、効率化を推進させ、新しい製品やサービスを創出するため、AIとMLはビジネス分野全体に渡る複数の業務に組み込まれるでしょう。AutoMLプラットフォームを利用すれば、AIの導入の敷居を下げ、時間のかかるAI導入へのリードタイムを短縮し、より素早く、そして正確な将来予測を実現し、デジタルトランスフォーメーションの取り組みを加速させます。 責任あるAI、説明可能性、モデルの解釈可能性がより重要に。AIにおけるバイアス、規制、プライバシー情報の重要性が高まり、透明性の高いAIや倫理的で信頼できるAIは、AIを活用する全ての企業にとって重要な課題となります。より多くの企業がAIをビジネスプロセスに導入していくにあたり、ML/AIモデルによって自動化される決定に対する説明責任やリスクを考える必要があります。そのなかで、解釈可能な特徴量は、企業がデータに基づいて下す決定の説明責任を確保し、コンプライアンス要件を満たすために役立ちます。ホワイトボックスモデルは、モデルがどのように振る舞い、予測を生成し、どのような変数が結果に影響を与えるのかを説明します。モデルをホワイトボックス化することで、説明責任のあるAIが実現でき、企業のAI/MLモデルの開発者、モデル利用者、ビジネスチームは複雑なAI案件を十分な自信と確実性を持って実行し、信頼を築くことができます。