dotData Ops 特徴量と機械学習パイプラインの
運用自動化

データ、特徴量、モデル全体の運用自動化がMLOpsを革新します。

データサイエンス、機械学習のビジネス価値を
セルフサービスで素早く検証

概念実証(PoC)からモデルを実際の業務で活用するまでには、システム統合、データ移行、ビジネス・ワークフローの変更など、モデルの開発にとどまらない多大な労力が必要となります。dotData Opsは、分析チームがデータ加工、特徴量、機械学習のパイプラインをセルフサービスでデプロイしてビジネス価値を検証できるプラットフォームを提供し、意思決定者からの信頼を高め、本番運用への投資判断を加速します。

データ、特徴量、予測モデルのパイプライン
全体を自動化

dotData Opsは、AI・機械学習に必須のデータ前処理に加えて、機械学習モデルによる予測実行、特徴量計算のパイプラインのシンプルで迅速なデプロイを可能にすることで、これらの課題に対処します。分析チームがセルフサービスで、データ、特徴量、予測モデルのパイプラインを実ビジネスで運用することを実現します。dotDataの特徴量自動設計が、特徴量とモデルのビジネス価値の検証、特徴量ドリフトの根本原因となるソースデータの診断、モデルの再学習だけでなく特徴量の再設計による予測精度の継続的な改善など、MLOpsに革命をもたらす機能を実現します。

機械学習パイプライン

製品の特長

一般のMLOpsによる機械学習パイプライン管理では、データ加工と特徴量計算は、独自に開発、運用、保守までの対応が必要ですが、dotData Opsのパイプラインは、データ処理から、特徴量計算、そして予測までの一連のパイプラインを自動化し、効率的かつワンストップで管理できる運用、管理機能を提供します。

モデルの自動デプロイ

モデルの自動デプロイ

モデルパッケージをアップロードするだけで、特徴量とモデルを本番環境へ自動デプロイします。

予測・評価の定期実行

予測・評価の定期実行

日次、週次、月次、またはカスタムスケジュールで定期的な予測と評価のスケジュールを設定し実行します。

ビジネスインパクトの監視

ビジネスインパクトの監視

ビジネスKPIを登録し、特徴量とモデルのビジネスへの影響を監視します。

モデル・特徴量ドリフトの監視

モデル・特徴量ドリフトの監視

モデルの劣化、特徴量ドリフトを監視し、ダッシュボード上で時系列変化を可視化できます。

劣化の検知・アラート

劣化の検知・アラート

ビジネス指標、モデル精度、特徴量分布のドリフトに対する監視閾値を設定し、劣化を自動検知してSlack・MS Teamsにアラートを通知します。

ソースデータの診断

ソースデータの診断

モデル精度や特徴量ドリフトの要因をソースデータまで遡って分析し、根本原因となっているデータのテーブルとカラムを特定します。

モデル再学習と特徴量再設計

モデル再学習と特徴量再設計

モデルの再学習だけでなく、特徴量の再設計まで自動化し、データの変化に対して予測精度を継続的に改善します。

エンド・ツー・エンドのパイプライン管理

エンド・ツー・エンドの
パイプライン管理

データ加工、特徴量計算、ML予測のパイプライン全体を管理します。

利用のステップ

数秒でモデルをデプロイ

モデルパッケージをアップロードして、迅速かつ簡単にパイプラインをデプロイします。

  • シンプルなGUIによるデプロイにより、データ、特徴量、ML予測の一連のパイプラインを自動的にデプロイ
  • データ型の自動検出とデータスキーマの自動推論
  • データの格納場所を指定し、特徴量計算と予測を実行

数クリックで予測ジョブをスケジュール

GUI上でスケジュールを設定するだけで、モデルの定期予測を実行します。

  • 日次、週次、月次、またはカスタムのスケジュールで定期的な予測ジョブを設定
  • 定期実行される予測に対して動的に計算クラスタを立ち上げ、インフラコストを最適化
  • 特徴量とモデルの劣化時にアラートをSlackやMicrosoft Teamsへ通知

特徴量とモデルのビジネスインパクトを監視

特徴量とモデルの劣化・変化に伴うビジネスへの影響を監視・可視化します。

  • 特徴量ドリフト、モデル精度とビジネス指標の変化をダッシュボード上で比較して分析
  • 特徴量とモデルの劣化を自動検知しアラートを通知

モデル・特徴量ドリフトの要因を診断

特徴量とモデルが劣化時の要因をソースデータまで遡って
診断します。

  • モデルの精度劣化の要因となっている特徴量を特定し、その分布と統計指標の時系列変化を分析
  • 特徴量ドリフトの要因をソースデータまで遡って分析し、ドリフトの根本原因となっているデータを特定

特徴量の再設計によるデータドリフトへの対処

モデルの再学習だけでなく、特徴量の再設計によって、パイプライン全体を継続的に改善します。

  • データドリフトに対して、自動で特徴量を再設計しモデルと特徴量の品質を維持
  • データの変化に対して、新たな特徴量とインサイトを継続的に発見

お客様の声

三井住友信託銀行株式会社

三井住友信託銀行株式会社

専門スキルがなくても仮説検証が行いやすいdotDataは、現場主導によるAI活用を進める上で非常に有用なツールです。

個人企画部 データ・マネジメントチーム 調査役 近藤敬佑氏
Sticky.io

Sticky.io

全体の95%の時間がデータラングリング(前処理)に費やされ、プロセスの最後のわずか5%のみを自動化することに価値を見出せませんでした。今ではその作業のほとんどがdotDataによって自動化されたので、素早く試行を繰り返し有用なモデルを見つけることに注力できるようになりました。

ディレクター データサイエンス&データアナリティクス Justin Shoolery氏
三井住友海上火災保険株式会社

三井住友海上火災保険株式会社

dotDataの特徴量を通じた営業活動や顧客接点におけるデータの有効性が実感できたことで、データドリブンな発想を持つ風土が醸成されつつあり、社員・代理店のDXが飛躍的に進んでいます。

ビジネスデザイン部 データサイエンスチーム シニアアドバイザー 松村隆司氏

特徴量+機械学習パイプラインの業界・業務別運用事例

dotDataのAIプラットフォームは、顧客のペルソナ分析やLTVの向上、商品の需要予測、解約防止製造工程の効率化、製品の品質向上、サプライチェーンの最適化、リスク管理、従業員採用や定着率の向上、パフォーマンス評価など、さまざまな目的に対してデータに隠れたパターン、すなわち特徴量を抽出し、企業におけるデータ活用を圧倒的に加速するとともに、特徴量のもたらすビジネスインサイトとデータに基づく洞察が、データドリブン経営と、ビジネスの各領域で迅速な意思決定と戦略の実行を支援します。

ユースケース

横浜ゴム株式会社

「人とAIの協奏」で目指すものづくり革命
dotDataで、タイヤの性能と開発・製造プロセスを改善

エレコム株式会社

顧客訪問と売上げの相関をデータで解明
AIによる営業力強化で新市場を切り拓く

dotDataのAIプラットフォーム 特徴量がデータ活用の成否を決める

dotDataは、独自の特徴量自動設計技術をコアとして、機械学習でAIモデルを構築する、特徴量をアセットとして蓄積しデータを強化する、データインサイト(洞察)を抽出して業務をデータドリブンに変革するといった、様々なシーン毎に最適なAIプラットフォームを提供し、データ活用、AIによるビジネスのDXを支援します。

dotData Insight 業務部門が自ら洞察を導き出す

dotData Insightは、事業部門が主役のビジネスアナリティクスを実現する革新的なデータ分析プラットフォームです。業務データに隠れたパターン(特徴量)を、BIツールのような直感的で使いやすいインターフェースを通じて提供します。dotData独自のAIが解析するデータの特徴を、生成AIの「世界知識」で補完し、実用的なビジネス仮説を生み出します。この融合により、業務部門は、データの洞察を直感的に理解し、新しいビジネス仮説を立て、戦略立案や施策実行をより効果的に行うことができます。

dotData Enterprise データサイエンスのプロセス全体を自動化

dotData Enterpriseは、事業部門やデータ分析部門が、ノーコードで予測AI開発を行うことができるAIプラットフォームです。特徴量自動設計と機械学習自動化(AutoML)によって、AIの専門知識やコーディングなしで、業務データから特徴量の抽出、そして機械学習による予測モデルの構築まで、ワンストップでAIを開発することができます。dotData Enterpriseを使用すると、通常は数か月かかる予測分析を、たった数日で実施でき、素早くビジネスでAIを活用でき、将来の予測やデータからの洞察が得られます。

dotData Feature Factory 特徴量をアセット化し全てのAI/BIを強化

dotData Feature Factoryは、データサイエンティストやIT部門が、企業がキュレーションされたデータ(すなわち特徴量)を開発するために、データ加工に関するノウハウを再利用可能なアセットとして蓄積する仕組みを提供します。データ中心に構築される特徴量空間から、アルゴリズムによってデータに隠れたパターン(特徴量)を発見し、特徴量発見のスピードと効率、再利用性と再現性、専門家間の連携、品質と透明性を向上させます。dotData Feature Factoryは、機械学習モデルによる予測、ビジネスインテリジェンス(BI)によるデータ可視化、或いはマーケティングオートメーションのような、全てのデータアプリケーションを強化します。

dotData Cloud フルマネージド、SaaSでビジネスの成果に注力

dotData Cloudは、dotDataの各AIプラットフォームを、dotDataがフルマネージドでSaaS提供します。データ分析を行う環境のための大規模なインフラ構築や管理が必要なく、TOC(Total Cost of Ownership: 総保有コスト)を最小化するとともに、AI開発をすぐに試行し、重要な課題に集中して取り組むことができます。dotData Cloudのアーキテクチャは、AWS技術パートナーの最高位である「コンピテンシーパートナー」として認定を受けており、また、データセキュリティを高めるために、日本リージョンでシングルテナント方式を採用しています。

dotData Stream リアルタイム予測を実現するAIコンテナ

dotData Streamは、リアルタイム・ストリーム予測を実現するプラットフォームです。dotData EnterpriseとFeature Factoryで開発したモデルを、コマンドひとつで直ちにコンテナ化・マイクロサービス化された予測に展開することができます。オンプレミス、クラウド、さらには、IoTのエッジサーバーといったような幅広い環境でのAIの予測を活用することができます。

お問い合わせ・
資料ダウンロード

気軽に話を聞いてみたい、ユースケースを知りたいなど、お客様のニーズに合わせてサポート致しますので、まずはお気軽にお問い合わせください。また、資料ダウンロードもご利用ください。

よくある質問

機械学習パイプラインとは、業務データを収集・前処理し、学習済みの機械学習モデルの入力となる特徴量を算出し、特徴量をモデルに入力して予測スコアを算出する一連の処理のことを指します。一般のMLOpsは、上記のパイプラインの最後のステップ(特徴量をモデルに入力して予測スコアを算出)を運用管理します。一方で、dotData Opsは、データ前処理から特徴量の算出までの、パイプライン全体を運用管理できる点に大きな特長があります。これによって、パイプライン全体の運用管理をシンプルにするとともに、モデルに劣化が発生した際に業務データ(ソースデータ)まで遡った診断や、特徴量の再学習といった、通常のMLOpsにはない優れた機能を提供します。

dotData Opsで運用管理する機械学習パイプラインを構築する最も簡単な方法は、dotData EnterpriseまたはdotData Feature Factoryを利用することです。これらのAIプラットフォームは、dotData独自の特徴量自動設計技術によって、業務データを入力として、データの前処理、有効な特徴量の設計、機械学習モデルの構築を実行し、それをdotData Opsで運用可能な機械学習パイプラインとして生成することができます。

dotData Opsでは、パイパーパラメータの調整を含む、定期的な機械学習モデルの再学習に加えて、運用中のモデル(チャンピオンモデル)に対して、チャレンジャーモデルを比較することで、精度劣化をトリガーとしてモデルを更新するといった、アドバンストな機械学習モデルのメンテナンス機能を提供します(本機能は、2024年リリース予定です)

dotData Opsでは、機械学習モデルの標準フォーマットであるONNXフォーマットに変換可能な機械学習モデルを運用可能です。例えば、高度なスキルを持ったデータサイエンティストがPythonで開発したモデルと、ノーコードの機械学習プラットフォームであるdotData Enterpriseを利用して開発したモデルを、一つのプラットフォーム上で運用可能です。また、dotData Feature Factoryと組み合わせることで、PythonやSQLで書いたデータ前処理をパイプラインに組み込んでdotData Opsで運用管理することができます(本機能は、2024年リリース予定です)。