AIプロジェクトを加速するシンセティックデータサービス

AIプロジェクトの成功には、優れたAI向けデータの入手が鍵となります。
リアルな世界における画像や動画データを正確にアノテーションを行うことでAI開発を成功に導くことはできますが、元となるデータの入手において、危険を伴う状況や、現実では発生しにくい状況、多大な時間を要することで、困難なケースがあります。

そこで、仮想世界において、現実世界をシミュレーションすることで、実際のデータと同様、もしくはそれ以上に優れたデータの生成が可能になります。
データをAI向けデータとして加工をし、トレーニングに活用することで、AIプロジェクトにおいて、多くのデータを利用することができるようになります。

シンセティックデータ(合成データ)とは

合成データとは、実世界のデータをもとに生成されたデータのことです。合成データは、実データに基づいて作成されるため、同じような意味を持ちます。つまり、オリジナルと同じ洞察力や相関関係を含んでいるため、オリジナルの完璧な代理となります。

これらの合成データは、元データから機密情報を除いたデータの価値がすべて含まれています。合成データは、現実の世界を忠実に再現します。そのため、実データの代わりに使用することが可能となります。

良質な合成データセットは、プライバシーを保護しながら、様々なタスクに利用することができます。GDPR、HIPAA、CCPAやCPAなど、あらゆるデータプライバシー法に準拠している為、合成データは、センシティブなデータセットを安全に生成するための完璧なツールです。プライバシーに準拠した方法で、知識や洞察力を引き出すために使用します。

合成データは、ますます重要な役割を果たしています。特に、シミュレーションから生成されたデータは、より正確なAIモデルを構築上で、実世界のデータに代わり、様々な分野で積極的に活用されるようになっています。合成データの活用はAI開発を加速するための最も有用な手段の一つであり、AIモデルの性能向上やAI製品のテストを検討している企業にとって、大事な役割を担う生成方法でもあります。

何故シンセティックデータ(合成データ)が必要なのか?

1

柔軟性が高い

合成データは、自由に作成・共有・破棄することができます。また、既存のデータセットを修正することも可能です。また、機密情報を取り除いたリアルなデータを用意することもできます。

2

リアルデータに取って代わる

AIが生成した合成データは、主に機械学習モデルのトレーニングに使用されています。さらにソフトウェアの開発やテストにおいても登場し始めています。合成データの登場によって市場投入までの時間を大幅に短縮することが可能となる時代がすぐそこまで来ています。

3

データの可能性

AIが生成した合成データは顧客の行動を予測することができます。ここから生まれるビジネスチャンスは無限大です。

合成データは人工的なものですが、現実世界のデータを反映しています。AIモデルの学習に合成データを用いることは、実際の物や出来事、人から収集したデータと同等、あるいはそれ以上の有用性があるという研究成果も報告されています。

ガートナーは下記のように未来を提言しています。

Synthetic Data

「2024年には、AIや分析プロジェクトの開発に使用されるデータの60%が合成的に生成されるようになります」

https://blogs.gartner.com/andrew_white/2021/07/24/by-2024-60-of-the-data-used-for-the-development-of-ai-and-analytics-projects-will-be-synthetically-generated/

シンセティックデータ生成について

照明、物理、天候、重力など無限の環境シナリオを用いて、現実を超えた合成3D環境を作成します。

屋外環境

屋外環境

衛星写真や地図情報等、現実世界から得た元データを用い、実在する都市や建物空間を3Dで再現します。

屋内環境

消費者や企業のデータプライバシーを保護しながら、様々な視点で多様なシナリオを生成します。

屋内環境

様々な業界で活用されているシンセティックデータ

私たちは、様々な業界のユニークなデータニーズをサポートします。

スマートシティー

スマートシティ

バーチャル空間上に再現された都市の上で、市民の生活改善のための各種施策や、企業によるロボットロジスティクスのシミュレート、セキュリティの評価、交通渋滞の改善などに応用できます。

農業

農業

天候や雑草、害虫の影響など、常に変化し続ける様々なパラメータを環境条件として適用することで、植物の生育段階から収穫予測等に活用いただけます。作物の品質やコストへの影響を、早い段階で予測・対策をすることができます。

小売業

店舗における商品のサイズ、向き、重複なども含めた陳列を再現することができます。照明や天候、人流や動線も含めることができます。商品売上に貢献をすることができます。

製造業

製造業

気象、地理などを含めた監視画像などを活用して、複雑な自動運転や航空機、工場内の環境を再現することができます。これにより障害の発生を予測し、予防することができます。

AOSデータが提供するシンセティックデータサービス

自動運転とシミュレーションに必要なツールとソリューションを提供します。
複雑な交差路・テストトラック環境を用意し自動運転の検証や学習を行います。
プロジェクトの開始段階からテストや受け入れ試験の段階まで、自動運転開発プロセスを各ステップに応じて提供します。

シンセティックデータサービス

ツールの特長

自動運転における環境構築およびシナリオをご提供しています。

Scenario Description Language (SDL)

自動運転のテストシナリオ、テストスクリプトを記述するフォーマットであるOpenScenarioをベースにしており、シナリオ生成に必要な様々な条件を作成することができます。

Scenario Description Language
シナリオ編集

シナリオ編集

シミュレータでは、使いやすいGUI(Graphical User Interface)により、天候、車両、障害物、軌道など様々な条件を生成・編集することができます。

Virtual 3D Model List

道路の運行状況・天気などの環境はもちろん、道路とその周りを歩いてる人、キックボード、2輪車、ベービーカー、パトロールカーなどを指定が可能で、より現実と近いシナリオの指定が可能です。

Virtual 3D Model List

シンセティックデータサービスご提供例

以下は道路交通情報からテストアプリケーションを作成する場合の作業の一例です。

シンセティックデータサービスご提供例
資料ダウンロード