dotData、企業データを革新する「dotData Feature Factory」を発表

dotData、企業データを革新する「dotData Feature Factory」を発表

プレスリリース

特徴量抽出をアセット化し、企業における全てのデータソリューションを強化

企業のデータサイエンスの自動化・運用化のリーダーであるdotData, Inc.(本社:米国 カリフォルニア州、CEO:藤巻 遼平、以下 dotData社)は、「dotData Feature Factory」をリリースしました。この新たなリリースにより、データサイエンティストは特徴量抽出にデータ中心のアプローチを適用し、データ加工から特徴量抽出のプロセスを再利用可能なアセットとして蓄積することができます。これにより、企業におけるデータを活用するアプリケーション開発全体に変革をもたらします。 dotData Feature Factoryは、既存製品であるdotData Pyの後継製品として提供されます。

 dotData社CEO & Founderの藤巻遼平は、次のように述べています。「dotData Feature Factoryは、我々のコアである特徴量自動設計を、新たなビジョンのもと、独立した製品として提供するものです。我々は、ユーザーとの協業を通じて、企業のデータソリューションにおける最大の課題はビジネスデータからの特徴量の発見と抽出であることを改めて認識しました。dotData Feature Factoryは、あらゆる企業の全データソリューションを変革することを目的に開発されています。」

特徴量探索の第一歩を踏み出す

特徴量の発見は、業務とデータの深い知識が必要となり、非常に時間と工数のかかる工程です。企業には、何十テーブル、数千カラム、数十億レコードという膨大なデータが蓄積されています。この大規模なデータと深い業務知見の理解が必要なため、特徴量発見は、その第一歩を踏み出すことにさえ大きな労力がかかります。dotData Feature Factoryは、関係データ、トランザクションデータ、時間データを含む企業の業務データから自動的に特徴量空間(特徴量の候補)を生成し、ユーザーは特徴量発見の第一歩を踏み出し、分析の初日からビジネスに役立つパターンをデータから発見することができます。

データ中心の特徴量設計を実現する

従来、特徴量の発見と設計は、職人芸とも言える、経験と勘による手作業が中心でした。データサイエンティストやドメインエキスパートは、データのパターンに関する数多くの素晴らしいアイデアを持っていても、時間やリソースの制約から、多くは単にアイデアとして検証されずに終わります。Feature Factoryは、特徴量設計をデータ中心のアプローチへと発展させます。特徴量空間をプログラム的に定義することで、手作業では不可能な圧倒的に広い範囲の特徴量仮説を自動生成し、ユーザーのデータや業務に関する知識をデータから補完します。

特徴量抽出を再利用可能なアセット化する

特徴量設計は、簡単なSQLクエリを書くだけではなく、ETLやデータクレンジング、特徴量変換など、複雑なデータ操作と変換を、繰り返し作業によって導き出すプロセスです。発見した特徴量はデータマートや特徴量ストアに蓄積することができますが、特徴量設計のプロセスは、ほとんどのケースで蓄積、管理されずに、捨てられてしまいます。dotData Feature Factoryは、特徴量設計のステップを蓄積し、データサイエンティストが自分自身やチームのために、データ変換や特徴量抽出のノウハウを再利用可能なアセット化します。

ノートブック上の特徴量を、本番用の特徴量パイプラインに変換

データサイエンティストは、一般的に、特徴量探索をPythonなどのNotebook上で行います。これらの大量のNotebookとコードは、標準化され、管理されておらず、本番環境で求められるエッジケースのカバレッジ、保守性、拡張性などを満たさないことがほとんどです。dotData Feature Factoryは、生成した特徴量を、本番環境のためのパイプラインとして自動的に生成するため、実験環境から本番環境への移行が迅速かつ簡単になります。

企業におけるデータアプリケーションを変革する

dotData Feature Factoryは、データや業務に関する「ノウハウ」を再利用可能なアセットへと変換し蓄積することで、企業の全てのデータアプリケーションを強化します。データ中心かつ体系化された特徴量抽出によってビジネスに重要な情報を発見し整理することで、チーム間連携の強化、データアプリケーション開発効率の向上、モデル品質の向上、特徴量とデータの再利用性、再現性、拡張性、透明性の向上を実現します。また、データサイロを取り除くことで、企業は保有するすべてのデータを最大限に活用し、データアプリケーションに変革をもたらします。

詳細はwww.jp.dotdata.comをご覧ください。

製品・サービスに関するお問い合わせ先

E-mail: contact-j@dotdata.com

本件に関する報道関係からのお問い合わせ先

E-mail: pr-j@dotdata.com

dotDataについて

dotDataは特徴量自動発見・抽出プラットフォームのリーダーとして、企業のAI・機械学習プロジェクトにおいて最も難しいと言われる特徴量の発見・抽出の課題を解決します。dotDataの特徴量自動設計技術は、わずか数時間で、大規模で複雑な関連性を持つデータの関係性を分析し、人間のバイアスにとらわれることなく、自動的に透明性の高い説明可能な特徴量を抽出し、お客様のビジネスにとって重要な洞察を導き出します。データサイエンティストは、dotDataを活用することで、従来に比べ100倍以上もの特徴量を自動探索できるようになり、そこには今まで人間が想像もしなかったような貴重なインサイトも隠れています。これにより、企業はAI・機械学習プロジェクトを強化し、よりアジャイルに回せるようになり、迅速にビジネス価値を創出することができるようになります。変化の激しい現代において、どの業界においても、AIが生み出す洞察は、ビジネスの成長やイノベーションのためのゲームチェンジャーとなります。ここにこそ、多くのフォーチュン500の企業がdotDataを選ぶ理由があります。

dotData
dotData

dotData独自の技術である特徴量自動設計は、データサイエンスおよびAI開発工程の最も難しい部分である特徴量設計と事業適用化を自動化します。それにより、企業のAI・機械学習プロジェクトにかかる時間を短縮させ、より高いビジネス価値を生み出します。詳細はdotdata.com、Twitter、LinkedInからご確認いただけます。