世界最先端のAI技術「特徴量自動設計」で、企業のデータ分析・利活用を革新する業界リーダーのdotData,Inc.(本社:米国 カリフォルニア州、CEO:藤巻 遼平、以下 dotData)は、本日、「dotData Feature Factory 1.3」を発表しました。dotData Feature Factory 1.3は、最新のAI技術とシームレスに連携し、特徴量の発見を加速させることで、データサイエンティストの機械学習モデルの開発や深いインサイトを導出を支援します。
dotData Feature Factory 1.3は、AIによる特徴量発見の強化、テキスト特徴量への対応、さらにLLM(大規模言語モデル)のサポート強化などの新機能により、AI、データサイエンス、機械学習チームを強化し、企業における高度な分析やデータ利活用を加速します。
dotData Feature Factory 1.3の新機能
特徴量の段階的拡充
dotData Feature Factory 1.3は、ユーザーがもつ既存の特徴量を補完し、また予測の残差にフィットする新たな特徴量を段階的に発見できる機能を提供します。この新機能により、既存の特徴量や予測スコアといったアセットを最大限に活用し、冗長な特徴量の再発見を防ぎながら、より予測精度の高い特徴量を反復的に構築することが可能になります。
LLMによる組み合わせ特徴量の発見
dotData Feature Factory 1.3は、LLMが複数のカラムの組み合わせ方を発見し、より予測精度の高い特徴量を生成できるようにします。従来の統計に基づいた組み合わせの発見は、疑似相関が発生したり、 解釈が困難な組み合わせが多数発生するという問題があります。dotDataは生成AIを活用し、統計的な有意性に加え、ドメインの文脈やカラムの組み合わせの解釈性も考慮しながら、特徴量を抽出することができます。
テキストデータの特徴量自動設計
dotData Feature Factory 1.3は、NLP(自然言語処理)技術を活用し、売上レポート、顧客レビュー、コールセンターの通話記録、従業員インタビューなどの非構造化テキストから自動的に特徴量を抽出します。さらに、抽出したテキスト特徴量を数値、カテゴリ、タイムスタンプデータと組み合わせることで、これまで埋もれていたインサイトを引き出し、より精度の高い分析を実現します。
LLM対応の強化
dotData Feature Factory 1.3は、特徴量設計を強化するために、新たに2つのLLM(大規模言語モデル)フレームワークをサポートしました。
- Amazon Bedrock: Claude 3.5をはじめとする最新のLLMにアクセス可能。
- vLLM: 特定のドメイン向けにファインチューニングされた独自のLLMを活用可能。
幅広いデータサイエンス環境への対応
dotData Feature Factory 1.3は、最新のデータサイエンス環境をサポートし、ユーザーが最新技術を最大限に活用できるようになりました。
- Python 3.11(Python 3.8はサポート終了)
- Databricks Runtime 14.3 および 15.4(Apache Spark 3.5.2対応)
- Amazon EMR 7.5.0
- Azure Snowpark Container Services
dotData Feature Factory 1.3により、データサイエンスチームがより価値のある特徴量を発見し、特徴量設計にかかる時間を大幅に短縮しながら、AIを活用したワークフローを、これまでにない柔軟性で飛躍的に向上させます。新たな特徴量の発見、テキストデータの活用、最新のAI・LLM技術との融合により、dotData Feature Factory 1.3は革新的な特徴量自動設計を実現します。
dotData Feature Factory 1.3について、まずはお気軽にお問い合わせください。
dotData Feature Factoryの詳細ページ
https://jp.dotdata.com/feature-factory/
dotData Feature Factoryに関するお問い合わせ先
E-mail: contact-j@dotdata.com
製品・サービスに関するお問い合わせ先
E-mail: contact-j@dotdata.com
本件に関する報道関係からのお問い合わせ先
E-mail: pr-j@dotdata.com
dotDataについて
dotDataは特徴量自動発見・抽出プラットフォームのリーダーとして、企業のデータ利活用において最も難しいと言われる特徴量の発見・抽出の課題を解決します。dotDataの特徴量自動設計技術は、わずか数時間で、大規模で複雑な関連性を持つデータの関係性を分析し、人間のバイアスにとらわれることなく、自動的に透明性の高い説明可能な特徴量を抽出し、お客様のビジネスにとって重要なインサイトを導き出します。このAI技術は、dotDataの全てのAIプラットフォームの基盤であり、データから自動でインサイトを引き出すだけでなく、機械学習や生成AIと組み合わせることで、予測分析からビジネスアナリティクスまで、企業の幅広い課題に応えるAIソリューションを提供します。変化の激しい現代において、どの業界や業務においても、AIが生み出すインサイトは、ビジネスの成長やイノベーションのためのゲームチェンジャーとなります。ここにこそ、多くのフォーチュン500の企業がdotDataを選ぶ理由があります。