今週のAI関連ニュース:Google、産業用ロボ制御ソフト参入
アノテーションツールLabelMe
LabelMeはMITよって開発された画像アノテーションツールです。画像認識、物体検出、セマンティックセグメンテ―ション、インスタンスセグメンテーションという色ろなタスクに向け、アノテーションを実行できます。
https://qiita.com/chiba1sonny/items/9a16fbb3e8136e3f983c
Google持ち株会社、産業用ロボ制御ソフト参入 AI活用
産業用ロボットは設定が煩雑で利用拡大の妨げになっているという。また、軟らかいコードなどの組み付けを不得手とすることが多い。AIの中核技術である深層学習や強化学習などを活用し、こうした問題を解決したい考えだ。
https://www.nikkei.com/article/DGXZQOGN240830U1A720C2000000/
アングル:五輪テレビ観戦支える最新技術、センサーやAIで選手を可視化
毎秒約2000ものデータを収集するセンサーと位置を把握するシステムによって実現される。今大会では陸上選手全員がゼッケンに小型のモーションセンサータグを装着し、タグがコース周辺に設置された多数の受信機と交信する。システムは各選手の位置を認識する。
https://jp.reuters.com/article/tokyo-2020-tech-idJPKBN2EU04I
機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス
教師なし学習には近寄るな。それは大きな時間の浪費であった。AIの博士号取得者のみんなが助言してくれたにもかかわらず、教師なし学習を何度試しても価値はゼロであった。この分野では学術的な研究が盛んに行われているのだろう。そうでなければ、このパラドックスを説明できない。
https://ainow.ai/2021/07/23/256845/
AIプロジェクトを価値創出に結びつける–「ModelOps」とは
ModelOpsは「Model Operationalization(モデルの運用化)」を短くしたもので、 モデルのライフサイクルとガバナンスに注目して、開発から展開までのプロセスを加速することを目的として、データサイエンスのラボで生み出されたAIのモデルを、できる限り短時間でIT部門で運用できるようにするためのアプローチだといえる。
https://japan.zdnet.com/article/35173953/
アノテーション済自動車走行画像データセットのサンプル無料提供のお知らせ
多くの企業でAI活用が進められている中で、AIモデル開発における課題のひとつ、「POC地獄」の解決方法として、株式会社ブライセンはアノテーション済みデータセットの提供を検討しております。事前に用意されたデータセットを活用することでPDCAを迅速かつ安価に回すことが可能となります。
https://www.brycen.co.jp/topics/2021/210721
量子コンピュータは「過学習」しにくい グリッドが量子AIの研究結果を「ACM」で発表 量⼦機械学習器のVC次元を初めて確立
今回の発表は、量子コンピュータを用いた機械学習では、量子の特性によって「過学習」が抑制される性質があることを実証実験と理論で検証した。従来から量子では過学習が抑えられる傾向が示唆されていたが、それを裏付ける結果を示した。今回の論文では、電気通信⼤学の協力のもと、量子機械学習器は過学習しにくいという性質を詳細な数値実験を通して示し、その根拠となる理論を世界で初めて提示したことになる。
https://robotstart.info/2021/07/26/grid-qcvc.html
車の番号AIで読み取り、リサイクルの会宝産業
システムは2020年秋に開発を開始、機械学習などを繰り返した。21年5月にテスト運用を実施、目でみても不明な文字でなければ、すべて認識できたという。入力などの作業時間が3分の1以下になった。年間5000台の使用済み自動車を扱う事業者の場合、約150万円の経費削減ができるという。
https://www.nikkei.com/article/DGXZQOCC130L70T10C21A7000000/
人工知能で亡くなった婚約者を再現した男性… 専門家はデマの拡散に使われかねない危険な技術と警鐘
悪意ある主体がこの技術を使って「ソーシャルメディアの悪意あるコンテンツや偽のコンテンツ」「誤解を招く恐れのある報道記事」「オンライン上での他者のなりすまし」を自動化する恐れがあるとOpenAIは予想していた。
https://www.businessinsider.jp/post-239198
機械学習 アルゴリズム 、米 FTC が規制強化に乗り出す:「不正収集したデータに基づくアルゴリズムも不正だ」
機械学習アルゴリズムは大量のデータを処理するごとに洗練されていく。すなわち、この種のアルゴリズムはユーザーデータの産物と言っても良い。つまり、企業が不正に収集したデータを完全に取り締まるにあたっては、不正に収集されたデータを取り込んだアルゴリズムそのものも取り締まる必要があると判断された。
https://digiday.jp/platforms/why-the-ftc-is-forcing-tech-firms-to-kill-their-algorithms-along-with-ill-gotten-data/
AIモデルの長年の課題「過学習」に見いだした世界初の知見とは?
さまざまな量子アルゴリズムで採用されている汎用的な量子回路について、量子ビットの数と量子回路の深さなどがモデルの表現力と過学習にどう影響するかを研究した。その結果、「量子回路の深さを増してパラメーターを増加させると、ある地点でモデルの表現力が飽和する」ことを数値実験で見いだした。
https://newswitch.jp/p/28132