dotData Ops:

データ、特徴量、モデル全体の運用自動化がMLOpsを革新

dotData Ops: データ、特徴量、モデル全体の運用自動化がMLOpsを革新

データ、特徴量、ML予測のパイプライン全体を自動化

dotData Opsは、データ、特徴量、予測パイプラインを分析チームがセルフサービスで実ビジネスで運用するための環境を提供します。dotDataの特徴量自動設計が、特徴量とモデルのビジネス価値の検証、特徴量ドリフトの根本原因となるソースデータの診断、モデルの再学習だけでなく特徴量の再設計による予測精度の継続的な改善など、MLOpsに革命をもたらす機能を実現します。

セルフサービスで特徴量とモデルのビジネス価値を素早く検証

概念実証(PoC)からモデルを実際の業務で活用するまでには、システム統合、データ移行、ビジネス・ワークフローの変更など、モデルの開発にとどまらない多大な労力が必要となります。dotData Opsは、MLモデルに加えて、データ加工と特徴量計算のパイプラインのシンプルで迅速なデプロイを可能にすることで、これらの課題に対処します。dotData Opsは、分析チームがパイプラインをセルフサービスでデプロイしてビジネス価値を検証できるプラットフォームを提供し、意思決定者からの信頼を高め、本番運用への投資判断を加速します。

数秒でモデルをデプロイ
ステップ1

数秒でモデルをデプロイ

モデルパッケージをアップロードして、迅速かつ簡単にパイプラインをデプロイ

  • シンプルなGUIによるデプロイにより、データ、特徴量、ML予測の一連のパイプラインを自動的にデプロイ
  • データ型の自動検出とデータスキーマの自動推論
  • データの格納場所を指定し、特徴量計算と予測を実行
数クリックで予測ジョブをスケジュール
ステップ2

数クリックで予測ジョブをスケジュール

GUI上でスケジュールを設定するだけで、モデルの定期予測を実行

  • 日次、週次、月次、またはカスタムのスケジュールで定期的な予測ジョブを設定
  • 定期実行される予測に対して動的に計算クラスタを立ち上げ、インフラコストを最適化
  • 特徴量とモデルの劣化時にアラートをSlackやMicrosoft Teamsへ通知
Gain Insights
ステップ3

特徴量とモデルのビジネスインパクトを監視

特徴量とモデルの劣化・変化に伴うビジネスへの影響を監視・可視化

  • 特徴量ドリフト、モデル精度とビジネス指標の変化をダッシュボード上で比較して分析
  • 特徴量とモデルの劣化を自動検知しアラートを通知
Extract Features
ステップ4

モデル・特徴量ドリフトの要因を診断

特徴量とモデルが劣化時の要因をソースデータまで遡って診断

  • モデルの精度劣化の要因となっている特徴量を特定し、その分布と統計指標の時系列変化を分析
  • 特徴量ドリフトの要因をソースデータまで遡って分析し、ドリフトの根本原因となっているデータを特定
Feature Pipeline
ステップ5

特徴量の再設計によるデータドリフトへの対処

モデルの再学習だけでなく、特徴量の再設計によって、パイプライン全体を継続的に改善

  • データドリフトに対して、自動で特徴量を再設計しモデルと特徴量の品質を維持
  • データの変化に対して、新たな特徴量とインサイトを継続的に発見

三井住友銀行どのようにして導き出される特徴量を100倍に増やしたのか

世界最大の銀行の1つである三井住友銀行は、特徴量設計への投資を検討していました。そして、投資の費用対効果を最大限まで高めたいと考えていたことから、dotDataの採用に至りました。その結果、導き出される特徴量の数が年間2,000個から200万個まで増加しました。三井住友銀行で何を具体的に行ったのかについては、 ケーススタディからご確認いただけます。

read-the-report@2x

特長

モデルの自動デプロイ

モデルパッケージをアップロードするだけで、特徴量とモデルを本番環境へ自動デプロイ

予測・評価の定期実行

日次、週次、月次、またはカスタムスケジュールで定期的な予測と評価のスケジュールを設定し実行

エンド・ツー・エンドのパイプライン管理

時間がかかり、ミスの発生しやすいデータ加工を、分析データベースに手順として記述し、自動のデータクレンジングによってデータ準備を自動化

ビジネスインパクトの監視

ビジネスKPIを登録し、特徴量とモデルのビジネスへの影響を監視

モデル・特徴量ドリフトの監視

モデルの劣化、特徴量ドリフトを監視し、ダッシュボード上で時系列変化を可視化

劣化の検知・アラート

ビジネス指標、モデル精度、特徴量分布のドリフトに対する監視閾値を設定し、劣化を自動検知してSlack・MS Teamsにアラートを通知

ソースデータ診断

モデル精度や特徴量ドリフトの要因をソースデータまで遡って分析し、根本原因となっているデータのテーブルとカラムを特定

モデル再学習と特徴量再設計

モデルの再学習だけでなく、特徴量の再設計まで自動化し、データの変化に対して予測精度を継続的に改善