AIライフサイクルの各ステップを一元管理する

データリテラシーを改善する「AIデータ ALM」

データサイエンティストやデータエンジニアだけでなく、プロジェクトに関わる全てのメンバーのデータリテラシーの改善がAIプロジェクトの成功には欠かせません。

高品質なデータ収集とモデリングと、評価の改善を繰り返すAIライフサイクルでは、安全で効率の良いデータ管理システムが重要です。サイロ化されないAIのためのデータ共有プラットフォームで、高いパフォーマンスの学習データを素早く、大量に収集•管理することが可能です。

「AIデータALM」のトライパッドソリューション

AIライフサイクルマネジメントのためのデータバージョン管理システムとして、「AIデータ ALM」は開発されました。「AIデータ ALM」のキーコンセプトとインサイトは、データサイエンティストとデータエンジニアと外部の提携企業の三角関係が最大の満足度となるようにすることです。私たちはこれを「AIデータ ALM」のトライパッドソリューションといいます。

データサイエンティストの解決

AIプロジェクトの多岐に渡る
各部門とのデータ連携を強化したい

✔︎ ファイルの共有と同期
✔︎ リモート/モバイル環境での業務
✔︎ どこからでもコンテンツにアクセス

データエンジニアの解決

セキュリティマネジメントの向上
コンプライアンスの統一

✔︎ 暗号化によるセキュリティの向上
✔︎ 権限管理によるコンプライアンス統一
✔︎ 監査機能による保守業務改善

外部の提携企業の解決

社内外の提携企業の関係者と
効率よくデータを共有、保管したい

✔︎ AI開発プロセスのデジタル化
✔︎ プロジェクトのデータ共有の迅速化
✔︎ コスト削減

AIデータ ALMの機能

AIライフサイクルのための安全で効率的なデータ収集と管理をデータバージョン管理システムで実現します。

Function① データの保護

Life cycle Data収集

データの再収集 → リアルデータの収集 → アノテーション

AI学習データにおけるデータのバージョン管理は要となります。誤った時期のデータを使用することにより誤ったAIシステムの結果を得ることになります。互いに相関を持ったデータを正しく管理することで、データの上書きによるデータ喪失を防ぎ、Raw Data、アノテーションデータ、さまざまな大量の学習データも最大10世代まで保存することができ、万が一の場合に、どの世代にも復元することができます。また、完了済みのプロジェクトにおいても、教育目的においても以前の資料やデータが必要なケースが出てきます。そのために低コストで中長期にデータ保管ができるコールドドライブ機能が非常に役に立ちます。

データ暗号化

バージョン管理

コールドドライブ

Function② メンバー管理

Life cycle モデル構築

モデルの重み付け → パイプラインを設定

AIプロジェクトでは多数の社内外のメンバーが参画をすることで、権限を厳格にしたデータの管理が求められてきます。他部門との安全なファイル共有ができるとともに、一方で権限がないフォルダは、存在していることもわからないためプロジェクトを秘密裏に進めることも可能です。監査機能により、メンバーの履歴を確認することができるので、ログイン、ダウンロードアップロードなど、AIプロジェクトメンバーの行動履歴も管理できます。また、必要なファイルを探し出す際にもメタデータ検索機能で、ファイル名、フォルダ名や、保存場所がわからないメンバーも閲覧を許可されたファイルであれば、キーワードから瞬時に該当ファイルを探し出すことができます。

チームドライブ

ファイルリクエスト

メタデータ検索

Function③ BCP対策

Life cycle トレーニング

モデルのトレーニング → トレーニング追跡とハイパーパラメータバージョン

プロジェクトの遂行にあたって、AIデータの保存先を常に意識してバックアップを取ることは困難です。個人のデバイスから簡単にWebブラウザからアップロードをしたり、クライアントプログラムでデータをバックアップすることで、負荷が大きく軽減されるとともに、万が一のときにデータを喪失することなく保持することができます。企業、病院施設、公共機関など、大掛かりなシステムをもつ組織を狙ってくるランサムウェア攻撃(身代金強奪マルウェアによる暗号化)からもデータを守ることが可能です。

個人ドライブ

フォルダーコピー

自動バックアップ

Function④ アクセス権限

Life cycle 展開

計算および評価指標 → 個々の失敗事例を抽出→本番の結果を反映したデータ

学習データを本番環境に展開し、エラー/更新した新しいデータを収集しても、データの管理共有のプロセスにおいて、漏えいリスクを排除することは、AIライフサイクルマネジメントにとって重要な課題です。AIライフサイクルの中で収集されるローデータ、アノテーション済みデータ、更新されたデータなどの膨大な量のデータを厳格なアクセス権限を持って管理し、共有することができます。さらに、セキュリティレベルの向上やコンプライアンス統一、ガバナンス体制の強化を実現する保護機能が満載です。

2段階認証

透かし機能

権限管理

AIの生涯データメンテナンスに役立つ機能

メターデータ管理/検索機能

AI学習データは膨大なデータとなり、探すことが大変困難です。そのための属性管理が重要です。メタタグを自由な形式で付与することで、その後の検索性が大幅に向上します。これにより従来は、活用方法が限られていたようなAI学習データに対しても、検索性と利便性が大きく向上をします。

✔︎ メタデータカテゴリー登録·修正·削除
✔︎ メタデータカテゴリー下位の項目設定
✔︎ メタデータ検索

独自カスタムブランド機能

AI生涯学習用データを専門的に管理する「AIData ALM」では、各企業の顧客のロゴを搭載し、自社ブランドシステムとして、プラットフォームを提供することができます。生涯のデータをシステムで管理するにあたって、顧客に企業ブランドの安心感を与えることに効果があります。

✔︎ システムトップ画面に自社のロゴ設定
✔︎ 操作画面に自社ブランドのロゴ設定