概念実証(PoC)からモデルを実際の業務で活用するまでには、システム統合、データ移行、ビジネス・ワークフローの変更など、モデルの開発にとどまらない多大な労力が必要となります。dotData Opsは、分析チームがデータ加工、特徴量、機械学習のパイプラインをセルフサービスでデプロイしてビジネス価値を検証できるプラットフォームを提供し、意思決定者からの信頼を高め、本番運用への投資判断を加速します。
                      データサイエンス、機械学習のビジネス価値を
セルフサービスで素早く検証
          
                  
      
              
                      データ、特徴量、予測モデルのパイプライン
全体を自動化
          
                  
      
              dotData Opsは、AI・機械学習に必須のデータ前処理に加えて、機械学習モデルによる予測実行、特徴量計算のパイプラインのシンプルで迅速なデプロイを可能にすることで、これらの課題に対処します。分析チームがセルフサービスで、データ、特徴量、予測モデルのパイプラインを実ビジネスで運用することを実現します。dotDataの特徴量自動設計が、特徴量とモデルのビジネス価値の検証、特徴量ドリフトの根本原因となるソースデータの診断、モデルの再学習だけでなく特徴量の再設計による予測精度の継続的な改善など、MLOpsに革命をもたらす機能を実現します。
製品の特長
一般のMLOpsによる機械学習パイプライン管理では、データ加工と特徴量計算は、独自に開発、運用、保守までの対応が必要ですが、dotData Opsのパイプラインは、データ処理から、特徴量計算、そして予測までの一連のパイプラインを自動化し、効率的かつワンストップで管理できる運用、管理機能を提供します。
モデルの自動デプロイ
モデルパッケージをアップロードするだけで、特徴量とモデルを本番環境へ自動デプロイします。
予測・評価の定期実行
日次、週次、月次、またはカスタムスケジュールで定期的な予測と評価のスケジュールを設定し実行します。
ビジネスインパクトの監視
ビジネスKPIを登録し、特徴量とモデルのビジネスへの影響を監視します。
モデル・特徴量ドリフトの監視
モデルの劣化、特徴量ドリフトを監視し、ダッシュボード上で時系列変化を可視化できます。
劣化の検知・アラート
ビジネス指標、モデル精度、特徴量分布のドリフトに対する監視閾値を設定し、劣化を自動検知してSlack・MS Teamsにアラートを通知します。
ソースデータの診断
モデル精度や特徴量ドリフトの要因をソースデータまで遡って分析し、根本原因となっているデータのテーブルとカラムを特定します。
モデル再学習と特徴量再設計
モデルの再学習だけでなく、特徴量の再設計まで自動化し、データの変化に対して予測精度を継続的に改善します。
      エンド・ツー・エンドの
パイプライン管理
          
  
      データ加工、特徴量計算、ML予測のパイプライン全体を管理します。
利用のステップ
モデルパッケージをアップロードして、迅速かつ簡単にパイプラインをデプロイします。
- シンプルなGUIによるデプロイにより、データ、特徴量、ML予測の一連のパイプラインを自動的にデプロイ
- データ型の自動検出とデータスキーマの自動推論
- データの格納場所を指定し、特徴量計算と予測を実行
GUI上でスケジュールを設定するだけで、モデルの定期予測を実行します。
- 日次、週次、月次、またはカスタムのスケジュールで定期的な予測ジョブを設定
- 定期実行される予測に対して動的に計算クラスタを立ち上げ、インフラコストを最適化
- 特徴量とモデルの劣化時にアラートをSlackやMicrosoft Teamsへ通知
特徴量とモデルの劣化・変化に伴うビジネスへの影響を監視・可視化します。
- 特徴量ドリフト、モデル精度とビジネス指標の変化をダッシュボード上で比較して分析
- 特徴量とモデルの劣化を自動検知しアラートを通知
特徴量とモデルが劣化時の要因をソースデータまで遡って
診断します。
- モデルの精度劣化の要因となっている特徴量を特定し、その分布と統計指標の時系列変化を分析
- 特徴量ドリフトの要因をソースデータまで遡って分析し、ドリフトの根本原因となっているデータを特定
モデルの再学習だけでなく、特徴量の再設計によって、パイプライン全体を継続的に改善します。
- データドリフトに対して、自動で特徴量を再設計しモデルと特徴量の品質を維持
- データの変化に対して、新たな特徴量とインサイトを継続的に発見
お客様の声
三井住友信託銀行株式会社
専門スキルがなくても仮説検証が行いやすいdotDataは、現場主導によるAI活用を進める上で非常に有用なツールです。
 
    Sticky.io
全体の95%の時間がデータラングリング(前処理)に費やされ、プロセスの最後のわずか5%のみを自動化することに価値を見出せませんでした。今ではその作業のほとんどがdotDataによって自動化されたので、素早く試行を繰り返し有用なモデルを見つけることに注力できるようになりました。
 
    三井住友海上火災保険株式会社
dotDataの特徴量を通じた営業活動や顧客接点におけるデータの有効性が実感できたことで、データドリブンな発想を持つ風土が醸成されつつあり、社員・代理店のDXが飛躍的に進んでいます。
ユースケース
dotDataのAIプラットフォーム 特徴量がデータ活用の成否を決める
dotDataは、独自の特徴量自動設計技術をコアとして、機械学習でAIモデルを構築する、特徴量をアセットとして蓄積しデータを強化する、データインサイト(洞察)を抽出して業務をデータドリブンに変革するといった、様々なシーン毎に最適なAIプラットフォームを提供し、データ活用、AIによるビジネスのDXを支援します。
      お問い合わせ・
資料ダウンロード
    
          気軽に話を聞いてみたい、ユースケースを知りたいなど、お客様のニーズに合わせてサポート致しますので、まずはお気軽にお問い合わせください。また、資料ダウンロードもご利用ください。
よくある質問
機械学習パイプラインとは、業務データを収集・前処理し、学習データとして加工し、学習済みのモデルを用いて推論データを出力する一連の流れのことを指します。一般的なMLOpsでは、こうしたパイプライン処理のうち、最後のステップ(特徴量をモデルに入力して予測スコアを算出)にフォーカスしています。一方、dotData Opsの機械学習パイプラインは、データ前処理から特徴量設計、モデル構築、推論、監視までを自動化されたパイプラインとしてオーケストレーションしており、MLシステム全体を効率的に運用管理できます。これにより、モデルに劣化が発生した場合も、データの変化に基づいてソースデータまで遡った診断や特徴量の再設計を行うことができます。
dotData Opsで運用管理する機械学習パイプラインを構築する最も簡単な方法は、dotData EnterpriseまたはdotData Feature Factoryを活用することです。これらのAIプラットフォームは、dotData独自の特徴量自動設計技術により、業務データを入力として自動化されたデータ前処理、特徴量設計、モデル構築(トレーニング)を実行します。生成されたモデルはそのままdotData Opsで運用可能な学習済みモデルのパイプラインとして展開でき、パイプラインの構築からデプロイまでがワンストップで完結します。このように、dotData製品群を組み合わせることで、機械学習を支えるコンポーネント全体の流れが効率化され、データと特徴量の一貫性が保たれたMLシステムを構築できます。
はい。dotData Opsでは、定期的な再学習(リトレーニング)を自動スケジュール化できるパイプライン処理機能を備えています。さらに、運用中のチャンピオンモデルに対してチャレンジャーモデルを比較・検証し、精度劣化をトリガーとしてモデルを自動更新する仕組みも提供します。このように、データに基づいたモデル評価が自動的に行われており、学習データが変化した場合にも最適なモデルが選択されるようオーケストレーションされています。
はい、可能です。dotData Opsでは、ONNX形式に変換された外部の機械学習モデルを使用した運用に対応しています。たとえば、高度なスキルを持つデータサイエンティストがPythonで開発したモデルや、他社のMLシステムで作成されたモデルを、自動化されたパイプラインの中に統合して運用管理することができます。さらに、dotData EnterpriseやdotData Feature Factoryと組み合わせることで、PythonやSQLで書かれたデータ前処理ロジックをパイプラインに組み込み、特徴量計算から予測までの流れをデータに応じて動的に最適化します。
 
       
       
      
               
      
               
      
               
      
               
      
              