dotData Py

世界をリードする特徴量自動設計

dotData Py AutoFE for Data Scientists

AI自動化により従来の100倍の特徴量を探索

dotDataは、AI・機械学習プロジェクトで最も手間と時間のかかる工程である特徴量設計を自動化します。dotData独自のAI技術で、複雑な関係を持つ数十億レコード・数十テーブルの背後にある隠れたパターンを検出し、AI・機械学習アルゴリズムによって導き出された特徴量を自動的に生成します。dotData Pyを使用すると、数時間で従来の100倍以上の特徴量を探索し、AIで作成した特徴量と業務知見に基づく特徴量を掛け合わせることで、AIのモデルを強化することができます。

Python Based AI Automation

AIから導き出された特徴量で機械学習モデルを強化する

優れた機械学習モデルを作るための鍵は、高品質な特徴量にあります。 dotData Pyは、AIアルゴリズムを使用して、特徴量の仮説を設計、探索、検証します。AIから導き出された特徴量により、特徴量空間を拡張してより優れた予測モデルを構築できます。

マルチモーダルパターンを発見

関係データ、トランザクションデータ、時間データ、位置情報データ、テキストデータなどを自動的に掛け合わせて加工することにより、マルチモーダルなデータから重要なパターンを発見します。

複数表をそのまま入力

複雑に関連している数十億のレコードを含む数十のテーブルを入力し、機械学習の入力となる特徴量テーブルを自動的に構築できます。

Pythonワークフローに統合

dotData Pyは、Python環境でライブラリとして機能します。dotDataのAIにより特徴量テーブルを作成し、既存の機械学習ワークフローに簡単に組み込むことができます。

データサイエンスのプロセスを自動化

dotData-Py_transperancy-New

三井住友銀行どのようにして導き出される特徴量を100倍に増やしたのか

世界最大の銀行の1つである三井住友銀行は、特徴量設計への投資を検討していました。そして、投資の費用対効果を最大限まで高めたいと考えていたことから、dotDataの採用に至りました。その結果、導き出される特徴量の数が年間2,000個から200万個まで増加しました。三井住友銀行で何を具体的に行ったのかについては、 ケーススタディからご確認いただけます。

read-the-report@2x

特長

特徴量自動設計

AIから導き出された特徴量で、モデルの予測精度を高め、マルチモーダルなデータからビジネスの深い洞察を導き出します。

特徴量の最適化

最先端の機械学習アルゴリズムと予測精度指標に合わせて特徴量を最適化します。

数十億行を変換

複雑な関係テーブルや数十億行に及ぶ大規模なデータを処理できます。

説明可能なAI

人間に理解しやすい形で特徴量とモデルを作成し、AIモデルがより実用的なものになります。

Pythonエコシステムと統合

AIから導き出された特徴量をPythonの既存の機械学習ワークフローに簡単に組み込むことができます。

本番適用がすぐに可能

バッチ処理またはリアルタイム環境のどちらでも、特徴量と予測モデルをすぐに本番環境へ移行することができます。