〜SQLによるデータ前処理や特徴量生成から、Pythonで開発された機械学習モデルによる予測まで、パイプライン全体を一元管理〜
世界最先端のAI技術「特徴量自動設計」で、企業のデータ分析・利活用を革新する業界リーダーのdotData, Inc.(本社:米国 カリフォルニア州、CEO:藤巻 遼平、以下 dotData社)は、データ前処理から特徴量生成、予測スコア算出までのパイプライン運用を支援する「dotData Ops」のバージョン1.4を発表しました。この新バージョンでは、SQLでのデータ加工や特徴量生成、さらにPythonで開発された機械学習モデルを含むパイプラインの運用を、dotData Ops上で一元管理できるようサポートが強化されました。これにより、データエンジニアが構築するSQLベースのデータパイプライン、データサイエンティストがPythonで開発する機械学習モデル、そして市民データサイエンティストがdotDataのAI技術を活用して作成する予測モデルを、統合された環境で効率的に管理できるようになります。
dotData社のCEO兼創業者である藤巻遼平は、今回のリリースに際し、次のようにコメントしています。「今回のアップデートは、データエンジニアやデータサイエンティストとの連携を強化するための重要なステップです。SQLやPythonで独自に構築されたパイプラインと、dotData Feature Factoryによるデータ主導の特徴量設計を組み合わせることで、モデル構築から運用まで、チーム全体のワークフローをスムーズにサポートできるようになります。」
dotData Ops 1.4の主要な機能強化は以下の通りです。
SQLによるデータ前処理と特徴量生成のサポート
バージョン1.4では、SQLで記述されたデータ前処理や特徴量生成をdotData Opsで運用することが可能です。これにより、ユーザーはドメイン知識に基づく独自の特徴量と、dotDataのAIが自動で抽出する特徴量の両方を、機械学習パイプラインに組み込むことができます。これらの機能は、dotData Feature Factoryとのシームレスな連携により実現され、より高度な次元でのデータ分析と予測モデルの構築が可能となります。
Pythonで開発した機械学習モデルのサポート
バージョン1.4では、Pythonで開発された機械学習モデルがサポートされます。これにより、ユーザーは独自に作成した特徴量と、dotDataの特徴量を組み合わせ、任意のPython機械学習ライブラリを活用してモデルを学習させることができます。学習されたモデルはONNX形式に変換され、dotData Ops上で運用可能になります。この機能により、SQLを用いたデータ前処理からPythonベースのモデルまで、ユーザー独自のパイプライン全体をdotData Opsで一元管理できるようになります。
Python SDKによるdotData Opsの自動化とdotData Feature Factoryの統合
バージョン1.4では、データサイエンティストの生産性向上を目的に、Python SDKが導入されました。このSDKを使って、ユーザーはPythonから直接dotData OpsのAPIにアクセスし、データの前処理、特徴量生成、予測までの機械学習ライフサイクルを自動化できます。これにより、ワークフローの効率化と迅速化が図られます。また、ユーザーはわずか数行のコードでdotData Feature Factoryのデータおよび特徴量パイプラインをdotData Ops上で展開することが可能です。
製品に関する情報
- dotData Enterprise(予測分析の自動化):https://jp.dotdata.com/dotdata-enterprise/
- dotData Feature Factory(AIによるデータ中心の特徴量自動設計):https://jp.dotdata.com/feature-factory/
- dotData Ops(データ、特徴量、予測のパイプライン全体の運用):https://jp.dotdata.com/dotdata-ops/
- dotData Insight(特徴量によるビジネスインサイト):https://jp.dotdata.com/dotdata-insight/
製品・サービスに関するお問い合わせ先
E-mail: contact-j@dotdata.com
本件に関する報道関係からのお問い合わせ先
E-mail: pr-j@dotdata.com
dotDataについて
dotDataは特徴量自動発見・抽出プラットフォームのリーダーとして、企業のデータ利活用において最も難しいと言われる特徴量の発見・抽出の課題を解決します。dotDataの特徴量自動設計技術は、わずか数時間で、大規模で複雑な関連性を持つデータの関係性を分析し、人間のバイアスにとらわれることなく、自動的に透明性の高い説明可能な特徴量を抽出し、お客様のビジネスにとって重要なインサイトを導き出します。このAI技術は、dotDataの全てのAIプラットフォームの基盤であり、データから自動でインサイトを引き出すだけでなく、機械学習や生成AIと組み合わせることで、予測分析からビジネスアナリティクスまで、企業の幅広い課題に応えるAIソリューションを提供します。変化の激しい現代において、どの業界や業務においても、AIが生み出すインサイトは、ビジネスの成長やイノベーションのためのゲームチェンジャーとなります。ここにこそ、多くのフォーチュン500の企業がdotDataを選ぶ理由があります。