dotData Feature Factory1.1は、データ品質の向上、特徴量への意思入れ、AutoMLの強化、生成AIによる特徴量設計支援など、革新的な機能を追加
企業のデータサイエンスの自動化・運用化の業界リーダーであるdotData, Inc.(本社:米国 カリフォルニア州、CEO:藤巻 遼平、以下 dotData)は、本日、「dotData Feature Factoryバージョン1.1」を発表しました。dotData Feature Factoryバージョン1.1は、データの品質向上、ユーザー定義の特徴量、対話形式での特徴量選択、生成AIによる特徴量設計支援(プレビュー)、PyCaret AutoMLとの連携など、革新的な新機能を追加しました。
「dotData Feature Factoryバージョン1.1は、特徴量設計における我々の革新的な取り組みをさらに加速するものです。」と、dotData社CEO&Founderの藤巻遼平は述べています。「dotData Feature Factoryバージョン1.1では、生成AIを活用してデータ知識(AIによる特徴量)とドメイン知識(ユーザー定義の特徴量)を融合する革新的なメカニズムを導入しています。このアプローチは、ユーザーに、より高い次元のデータインサイトを提供します。」
データの品質を自動的に評価し、改善案を提示
dotData Feature Factory バージョン1.1は、データの品質を向上する評価機能を大幅に強化しました。これにより、ユーザーはデータ自体の信頼性や、メタ情報などデータに関する設定の有効性を確保することができます。具体的には、目的変数の分布の偏り、目的変数のリーク、複数テーブル間のデータ範囲、エンリッチメント率、レコードの重複、文字列の正規化など、データの品質に関するさまざまな評価を自動的に実行しユーザーへ結果をレポートします。データ品質の問題を検出すると、問題を解消するための対策と実行可能なコードを、dotData Feature Factoryが自動的に提示します。ユーザーは、潜在的なデータ品質の問題を迅速に特定、修正し、品質の高い入力データで特徴量を設計することが可能になります。
PyCaret連携によるAutoMLの強化
dotData Feature Factoryバージョン1.1では、PyCaret(Pythonベースの最先端AutoMLライブラリ)が組み込まれ、機械学習自動化(AutoML)のサポートが強化されました。この新しい連携によって、ユーザーはdotData Feature Factoryで発見した特徴量を迅速に評価し、最先端のAutoML機能を活用して、機械学習による予測モデルを最適化することができます。PyCaretは、dotData Feature Factoryのワークフローの一部として統合されています。これによって、ユーザーはAutoML機能の設定を調整し制御できる柔軟さと、データ加工から特徴量設計、そして機械学習というプロセス全体を素早く検証する自動化の利点を両立することができます。
ユーザー定義の特徴量をサポート
dotData Feature Factoryバージョン1.1は、ユーザー自身がもつ特徴量のアイデアを取り入れるための、2つの革新的な方法を公開しました。一つ目は、dotData Feature Factoryが提供する特徴量記述言語で、ユーザーは直感的かつ宣言的に独自の特徴量を定義し、特徴量空間に追加、統合することができます。二つ目は、SQLトランスフォーマーです。ユーザーは、SQLで表現可能な任意のデータ変換を、SQLトランスフォーマーとして、dotData Feature Factoryのデータパイプラインの一部として登録することができます。これらの新機能によって、ユーザーは、dotDataのAIによる特徴量に加えて、独自の特徴量を一つのプラットフォーム上で統合し、AIによる網羅性と、ドメイン知識による専門性を同時に活用することができるようになります。
生成AIによる特徴量設計支援機能をプレビューサポート
dotData Feature Factoryバージョン1.1は、自然言語を使用して独自の特徴量を定義する特徴量設計のAIアシスタント機能をプレビューサポートします。ユーザーは、特徴量のアイデアを文書として入力するだけで、生成AIのアシスタントが自動的に分析データベースを勘案して、特徴量を生成するためのコードを提案します。入力の仕方が不明瞭である場合や追加のデータ知識が必要な場合は、AIアシスタントはユーザーにさらなる情報を求めます。この対話的なダイアログにより、ユーザーはコーディングすることなく特徴量を定義することができます。アシスタントによって生成される特徴量は、バージョン1.1でサポートされるユーザー定義の特徴量へと自動的に変換され、特徴量空間へ追加、登録することができます。
対話形式での特徴量選択
dotData Feature Factoryバージョン1.1は、対話形式での特徴量選択という強力な新機能により、ユーザーによる特徴量への意思入れのプロセスを強化します。ユーザーは、直感的かつ対話的なインターフェース上で特徴量を可視化しながら、予測力と解釈性のトレードオフを勘案し、特徴量を評価、選択することができます。この機能により、ユーザーは、dotDataによって生成された特徴量に対して、自身のドメイン知識とデータ分析の経験を反映して、調整、最適化することが可能になります。
Feature Factory 1.1について、まずはお気軽にお問い合わせください。
製品・サービスに関するお問い合わせ先
E-mail: contact-j@dotdata.com
本件に関する報道関係からのお問い合わせ先
E-mail: pr-j@dotdata.com
dotDataについて
dotDataは特徴量自動発見・抽出プラットフォームのリーダーとして、企業のデータ利活用において最も難しいと言われる特徴量の発見・抽出の課題を解決します。dotDataの特徴量自動設計技術は、わずか数時間で、大規模で複雑な関連性を持つデータの関係性を分析し、人間のバイアスにとらわれることなく、自動的に透明性の高い説明可能な特徴量を抽出し、お客様のビジネスにとって重要な洞察を導き出します。このAI技術は、dotDataの全てのAIプラットフォームの基盤であり、データから自動で洞察を引き出すだけでなく、機械学習や生成AIと組み合わせることで、予測分析からビジネスアナリティクスまで、企業の幅広い課題に応えるAIソリューションを提供します。変化の激しい現代において、どの業界においても、AIが生み出す洞察は、ビジネスの成長やイノベーションのためのゲームチェンジャーとなります。ここにこそ、多くのフォーチュン500の企業がdotDataを選ぶ理由があります。