概念実証(PoC)からモデルを実際の業務で活用するまでには、システム統合、データ移行、ビジネス・ワークフローの変更など、モデルの開発にとどまらない多大な労力が必要となります。dotData Opsは、分析チームがデータ加工、特徴量、機械学習のパイプラインをセルフサービスでデプロイしてビジネス価値を検証できるプラットフォームを提供し、意思決定者からの信頼を高め、本番運用への投資判断を加速します。
データサイエンス、機械学習のビジネス価値を
セルフサービスで素早く検証
データ、特徴量、予測モデルのパイプライン
全体を自動化
dotData Opsは、AI・機械学習に必須のデータ前処理に加えて、機械学習モデルによる予測実行、特徴量計算のパイプラインのシンプルで迅速なデプロイを可能にすることで、これらの課題に対処します。分析チームがセルフサービスで、データ、特徴量、予測モデルのパイプラインを実ビジネスで運用することを実現します。dotDataの特徴量自動設計が、特徴量とモデルのビジネス価値の検証、特徴量ドリフトの根本原因となるソースデータの診断、モデルの再学習だけでなく特徴量の再設計による予測精度の継続的な改善など、MLOpsに革命をもたらす機能を実現します。
製品の特長
一般のMLOpsによる機械学習パイプライン管理では、データ加工と特徴量計算は、独自に開発、運用、保守までの対応が必要ですが、dotData Opsのパイプラインは、データ処理から、特徴量計算、そして予測までの一連のパイプラインを自動化し、効率的かつワンストップで管理できる運用、管理機能を提供します。
モデルの自動デプロイ
モデルパッケージをアップロードするだけで、特徴量とモデルを本番環境へ自動デプロイします。
予測・評価の定期実行
日次、週次、月次、またはカスタムスケジュールで定期的な予測と評価のスケジュールを設定し実行します。
ビジネスインパクトの監視
ビジネスKPIを登録し、特徴量とモデルのビジネスへの影響を監視します。
モデル・特徴量ドリフトの監視
モデルの劣化、特徴量ドリフトを監視し、ダッシュボード上で時系列変化を可視化できます。
劣化の検知・アラート
ビジネス指標、モデル精度、特徴量分布のドリフトに対する監視閾値を設定し、劣化を自動検知してSlack・MS Teamsにアラートを通知します。
ソースデータの診断
モデル精度や特徴量ドリフトの要因をソースデータまで遡って分析し、根本原因となっているデータのテーブルとカラムを特定します。
モデル再学習と特徴量再設計
モデルの再学習だけでなく、特徴量の再設計まで自動化し、データの変化に対して予測精度を継続的に改善します。
エンド・ツー・エンドの
パイプライン管理
データ加工、特徴量計算、ML予測のパイプライン全体を管理します。
利用のステップ
モデルパッケージをアップロードして、迅速かつ簡単にパイプラインをデプロイします。
- シンプルなGUIによるデプロイにより、データ、特徴量、ML予測の一連のパイプラインを自動的にデプロイ
- データ型の自動検出とデータスキーマの自動推論
- データの格納場所を指定し、特徴量計算と予測を実行
GUI上でスケジュールを設定するだけで、モデルの定期予測を実行します。
- 日次、週次、月次、またはカスタムのスケジュールで定期的な予測ジョブを設定
- 定期実行される予測に対して動的に計算クラスタを立ち上げ、インフラコストを最適化
- 特徴量とモデルの劣化時にアラートをSlackやMicrosoft Teamsへ通知
特徴量とモデルの劣化・変化に伴うビジネスへの影響を監視・可視化します。
- 特徴量ドリフト、モデル精度とビジネス指標の変化をダッシュボード上で比較して分析
- 特徴量とモデルの劣化を自動検知しアラートを通知
特徴量とモデルが劣化時の要因をソースデータまで遡って
診断します。
- モデルの精度劣化の要因となっている特徴量を特定し、その分布と統計指標の時系列変化を分析
- 特徴量ドリフトの要因をソースデータまで遡って分析し、ドリフトの根本原因となっているデータを特定
モデルの再学習だけでなく、特徴量の再設計によって、パイプライン全体を継続的に改善します。
- データドリフトに対して、自動で特徴量を再設計しモデルと特徴量の品質を維持
- データの変化に対して、新たな特徴量とインサイトを継続的に発見
お客様の声
三井住友信託銀行株式会社
専門スキルがなくても仮説検証が行いやすいdotDataは、現場主導によるAI活用を進める上で非常に有用なツールです。
Sticky.io
全体の95%の時間がデータラングリング(前処理)に費やされ、プロセスの最後のわずか5%のみを自動化することに価値を見出せませんでした。今ではその作業のほとんどがdotDataによって自動化されたので、素早く試行を繰り返し有用なモデルを見つけることに注力できるようになりました。
三井住友海上火災保険株式会社
dotDataの特徴量を通じた営業活動や顧客接点におけるデータの有効性が実感できたことで、データドリブンな発想を持つ風土が醸成されつつあり、社員・代理店のDXが飛躍的に進んでいます。
ユースケース
dotDataのAIプラットフォーム 特徴量がデータ活用の成否を決める
dotDataは、独自の特徴量自動設計技術をコアとして、機械学習でAIモデルを構築する、特徴量をアセットとして蓄積しデータを強化する、データインサイト(洞察)を抽出して業務をデータドリブンに変革するといった、様々なシーン毎に最適なAIプラットフォームを提供し、データ活用、AIによるビジネスのDXを支援します。
お問い合わせ・
資料ダウンロード
気軽に話を聞いてみたい、ユースケースを知りたいなど、お客様のニーズに合わせてサポート致しますので、まずはお気軽にお問い合わせください。また、資料ダウンロードもご利用ください。
よくある質問
機械学習パイプラインとは、業務データを収集・前処理し、学習済みの機械学習モデルの入力となる特徴量を算出し、特徴量をモデルに入力して予測スコアを算出する一連の処理のことを指します。一般のMLOpsは、上記のパイプラインの最後のステップ(特徴量をモデルに入力して予測スコアを算出)を運用管理します。一方で、dotData Opsは、データ前処理から特徴量の算出までの、パイプライン全体を運用管理できる点に大きな特長があります。これによって、パイプライン全体の運用管理をシンプルにするとともに、モデルに劣化が発生した際に業務データ(ソースデータ)まで遡った診断や、特徴量の再学習といった、通常のMLOpsにはない優れた機能を提供します。
dotData Opsで運用管理する機械学習パイプラインを構築する最も簡単な方法は、dotData EnterpriseまたはdotData Feature Factoryを利用することです。これらのAIプラットフォームは、dotData独自の特徴量自動設計技術によって、業務データを入力として、データの前処理、有効な特徴量の設計、機械学習モデルの構築を実行し、それをdotData Opsで運用可能な機械学習パイプラインとして生成することができます。
dotData Opsでは、パイパーパラメータの調整を含む、定期的な機械学習モデルの再学習に加えて、運用中のモデル(チャンピオンモデル)に対して、チャレンジャーモデルを比較することで、精度劣化をトリガーとしてモデルを更新するといった、アドバンストな機械学習モデルのメンテナンス機能を提供します(本機能は、2024年リリース予定です)
dotData Opsでは、機械学習モデルの標準フォーマットであるONNXフォーマットに変換可能な機械学習モデルを運用可能です。例えば、高度なスキルを持ったデータサイエンティストがPythonで開発したモデルと、ノーコードの機械学習プラットフォームであるdotData Enterpriseを利用して開発したモデルを、一つのプラットフォーム上で運用可能です。また、dotData Feature Factoryと組み合わせることで、PythonやSQLで書いたデータ前処理をパイプラインに組み込んでdotData Opsで運用管理することができます(本機能は、2024年リリース予定です)。