Imaging AI

MV_イメージ
MV_イメージ

画像を中心とした高速・高精度なAI処理の技術群

Imaging AIは、コニカミノルタ独自の画像を中心とした高速・高精度なAI処理の技術群です。
主に「AIアルゴリズム」「AIアクセラレーター」の2つの技術で構成されています。

AIアルゴリズム

コニカミノルタのAIアルゴリズムは「人行動」「先端医療」「検査」の3つのカテゴリーに絞って必要なAI技術開発が行われています。
この3つのカテゴリーはエッジ戦略をとるコニカミノルタと整合が高く、応用範囲が広いことが特徴です。
画像・動画は、大量のデータを学習する必要があるため、コニカミノルタではこの3つのカテゴリーに特化して、最適化のための独自の学習環境を整備しています。
画像・動画のAI処理は、クラウドの豊富なリソースで実施するやり方もありますが、コニカミノルタは情報機器や医療機器の画像処理を高速に行ってきた経験と、メーカーの強みを生かして、エッジ側 (組み込み機器やオンプレミスのサーバーなど) に、低消費電力で高速なAI機能を実装します。
すなわち、End To EndでAIシステムを最適化できる技術を持っていることが強みであり、コニカミノルタの画像 IoT戦略の基本になります。

認識精度の高さと高速処理を両立した「人行動」認識技術

コニカミノルタの「人行動」カテゴリーにおける AI 技術開発では、Deep Learning を活用した人検知・姿勢推定・行動認識などのアルゴリズム開発を進めています。大量の現場画像を学習させることで、どのような環境でも誤認識しない、ロバストな「人行動」認識技術の開発を行っています。
実際に、単眼静止画像からの人検知・2D姿勢推定において、認識精度の高さと高速処理の両立を実現し、すでに製造・リテール・ヘルスケアなど様々な事業に活用しています。

動きを抽出・可視化する「先端医療」技術

FORXAI_E05-2
コニカミノルタの「先端医療」技術は、医用動画像中の組織の動きや信号変化を認識し、抽出・可視化することが可能です。ドメインナレッジ、信号処理技術と機械学習を組み合わせることにより、生体内の様々な動き情報を抽出することができます。これまで経験に頼っていたり、微細で見過ごされていた動きの変化を定量化することにより医療に貢献しています。
実際に、すでにX線動態解析システムにおいて肺野の動きの計測、呼吸器および循環器に関連した生体生理機能の視覚化・定量化に活用されています。

多種多様な欠陥に対応可能な「検査」技術

FORXAI_E04-2
コニカミノルタの「検査」技術は、多種多様な欠陥の有無や位置・種別を割り出し検査することが可能です。アルゴリズムのカスタマイズ性が高いため、顧客が学習させたり、顧客ごとの判定ニーズに対応できたり、良品画像のみで学習させて欠陥の有無を検知できます。
実際に、デジタルマニュファクチャリングにおける良品/不良品識別や自動車塗装面内の欠陥の種類の自動判別などに活用しています。

AIアクセラレーター

AI技術の1つであるディープラーニングはGPU上で推論させることが一般的ですが、高価かつ高消費電力の推論専用のハードウェアが必要となる課題があります。また、大きさもネックとなりエッジデバイス上への実装は困難となります。
一方アクセラレーターと呼ばれる専用ハードウェアで実行することで、精度を維持したまま低コストや省電力を実現できます。また、省スペース化を可能としエッジデバイスへの組み込みにより、通信環境に依存しないリアルタイム性が求められるシステムに最適化できます。ただしディープラーニングのアルゴリズムをハードウェアの回路データに変換するには、精度を維持するために複雑な設定の調整などに多くの期間を有します。
コニカミノルタではハードウェアの回路データに変換する過程において、高速・高精度に変換する独自技術を保有しています。その結果、開発効率を高め現場からのフィードバックを受けてのアルゴリズムの更新が迅速に行うことができ、顧客課題を解決するまでのサイクルをより高速に回すことができます。

FPGA用の高位合成コンパイラ「NNgen」

コニカミノルタでは、ディープラーニング(深層学習)の学習済みモデルをFPGA(Field Programmable Gate Array)上に手軽に実装するための高位合成コンパイラ「NNgen(エヌエヌジェン)」を東京大学の高前田 伸也准教授と共同で開発し、オープンソースで一般公開しています。

NNgenを使うと、ハードウェアのチューニングに関する深い知識がないエンジニアやデザイナーでも、ディープラーニングの学習済みモデルから、FPGAで高速に動作するアクセラレーターを効率的に開発できます。

 

その結果、FPGAが搭載されたデバイス機器などのエッジサイドで、AI処理をリアルタイムに実施する製品やサービスが実現できるようになります。

またNNgenはオープンソースで一般公開されているので、利用者は無償で利用したり、開発に貢献したりできます。

NNgenはGitHubで公開されています。

NNgen:ディープラーニングのアクセラレーター向け高位合成コンパイラ

 

開発経緯と技術概要

 

AIの中でも、ディープラーニングに大きな注目が集まっています。ディープラーニングにより、画像処理や音声処理など様々な分野で劇的な精度向上が実現されてきました。一方でその計算には膨大なコンピューターリソースが必要で、省電力・高性能な専用ハードウェアの重要性が増してきています。

このような専用ハードウェアの一つに、回路構成を変更可能なハードウェア「FPGA」を用いる方法があります。処理内容に応じて回路構成をカスタマイズできるFPGAの特性を生かして、学習済みのディープラーニングモデルに特化した回路構成を採用することで、小型かつ高速なアクセラレーターを実現できる所がメリットです。

NNgenは、用途に応じて構築・学習済みのディープラーニングモデルを高速に処理できる専用アクセラレーターを、FPGA上に手軽にかつ効率的に実装するためのドメイン固有型の拡張可能な高位合成コンパイラです。モデルに特化したハードウェアアクセラレーターのハードウェア記述(Verilog HDL)およびIPコア設定ファイル(IP-XACT)を生成します。

「NNgen」の主な特徴

 

1.高い抽象度で手軽に実装できる

  • 一般的な深層学習フレームワークと同様のPythonによるモデル構造記述から自動的にアクセラレーター回路記述を生成
  • ONNX入力にも対応
  • ハードウェアパラメータを設定するだけで性能最適化が可能

2.様々な粒度でコンパイラを機能拡張できる

  • コンパイラ・バックエンドには、高前田 伸也准教授が開発したマルチパラダイム型高位合成フレームワーク「Veriloggen」を用いており、カスタムレイヤーの追加などの拡張が可能

3.様々なFPGA環境に対応できるポータビリティ

  • 学習済みのディープラーニングモデルからVerilog HDLを直接生成

※記載されている会社名、製品名は各社の登録商標または商標です。

FORXAI Recognition

上記人行動認識のAIアルゴリズムとAIアクセラレーターを組み合わせた、省リソースなエッジデバイスやクラウドサーバ上で、映像中の⼈物や物体を高速に認識する画像認識技術を提供します。
お客様の課題に合わせたAIの学習や実装の最適化が可能です。​

活用事例

【丸紅ネットワークソリューションズ株式会社】TRASCOPE-AI(商業DX:人流マーケティングソリューション)

商業施設に設置するカメラ(既存カメラ含む)の映像に対し、人行動分析アルゴリズムで解析した動線分析、属性分析をお客様にダッシュボードで提供

エッジAIカメラ MOBOTIX 7

カメラのエッジ処理により画像から物体の種類・位置・移動方向を検知でき、音声発報や他デバイスとの連携をサーバーレスで実現

Runalytic

高速かつ高精度な独自の姿勢推定アルゴリズムを開発、市民ランナーに向けた効率的なフォーム改善指導を実現

AI外観検査ソリューション

X線画像診断・産業印刷で培った画像処理の知見を活かした独自の外観検査アルゴリズムを開発、検査自動化による人手不足解消を実現

HitomeQケアサポート

天井位置からの撮影でも認識可能な独自の人物領域切り出し及び姿勢推定アルゴリズムを開発、介護施設での転倒検知を実現

DXを加速させるFORXAIをもっと知る
資料ダウンロード
※現在準備中
CTA_X_画像
FORXAIのソリューションについて


pagetop