SKY NOTE

skymouseが思った事考えた事を記したもの

Pref..
Speech
STOP
Follow..
QR Code
|◀
▶|
QR
×
voice
volume
0
rate
0
pitch
0

CES2014:Intel、「Real Sence」3Dカメラで顔認識、音声認識、ゼスチャー操作

インテルが2014年1月6日(米国時間)CES 2014でステレオカメラと、それを使った顔認識や音声認識タッチせずに操作できる。ゼスチャー機能を盛り込んだソフトウェア、ユーザーインターフェース技術を発表した。

 Intel、次世代UI技術「RealSense」を正式発表
 ――3D Systemsと協業し3Dスキャン技術の提供も
 http://monoist.atmarkit.co.jp/mn/articles/1401/08/news075.html

 引用:インテル Real senseパーツ(ステレオカメラ)
 

3Dステレオカメラに深度センサで立体物を認識できるRealSense

  • ハード構成は…
  • フルHD(1920×1080)×2
  • ・深度センサー(恐らく赤外線センサー)
    • 赤外線センサーの深度情報は解像度が低いので、それをソフトでどう補完するかがポイント
  • ・マイク(多分ステレオマイク)
  • これをノートPCやタブレットのモニタのベゼル部分に装着する。仕組みとして想定できるのは、低解像度な赤外線センサーで大まかな奥行き情報を得て、それをフルHDのステレオカメラで細部を補完し、正確な立体モデルを作成、それを元に顔認識、ゼスチャーの認識を行うのだろう。それを示したものが、以下のデモ動画
  • Gaming mit Intels 3D-Kamera Real Sense (CES 2014)
  • 手のゼスチャーを認識しているゲーム画面が出てくる。これからみると、結構リアルタイムで認識できていることが分かる。たいてい、この種のセンサーというのは遅延が出てしまうと使い物にならないのだが、Real senseは、その問題をクリアしているようだ。(しかし、ソフトウェアがプロトタイプっぽく、若干のタイミングのズレ、認識解像度の低さを感じる。個々のセンサの精度を補完するソフトはまだまだと感じる→実際プロトタイプなので、当たり前といえば当たり前、これから最適化なり、改良が加えられるだろう。奥行き情報の精細度という点では、Leap motionの方が一日の長があると思う)

多くの有名メーカーがサポートするRealSense

  • かなりのメーカーが、今年下半期に、この技術を採用する事が予定されている。つまり、今年下半期から、多くのPCにステレオカメラが装備される。しかも、深度センサ付きで、協賛企業のリストにSONYがないのが残念だが、広く普及する前提条件は満たしているといえる。そして、この立体映像を使って、顔認識、音声認識、ゼスチャーなどを行うという。例えば、奥行き情報が手に入ると。テレビ電話の背景を映さないように出来たり、顔認識ではAIがカメラの前の人の感情を読み取ったり、ゲームのアバターに表情を入れられたりするだろう。ゼスチャーで触らずに操作できるのでモニターに手の油をつけずに操作できたりする。
  • もちろんステレオカメラで立体映像を撮影することも出来るだろう。そうなれば、立体ディスプレイが普及するかもしれない。せっかく立体カメラがあっても、見れなければ魅力が半減するからね。

音声認識はネット接続が不要 音声認識技術「Dragon Assistant」

  • そして、音声認識では、米Nuance Technologyの音声認識技術「Dragon Assistant」をタブレットやUltraBookなどに展開するという。しかも、これはネット接続をしなくても音声認識が出来るという。つまり、ネット機能のないPCでも、音声メモや機器の管理などが手軽にできるというわけである。コチラのほうが結構、便利かも。

ソフトウェアの協賛企業も豊富

  • このRealSenseを生かす肝とも言えるソフトウェアの協賛企業
  • 3D Systems、Autodesk、DreamWorks、Metaio、Microsoft、Tencent
  • 3D映像ソフトの3D Systems、設計ソフトでシェアをとっているAutodesk、映画の3D映像で有名なDreamWorksKinectを作ったMicrosoftなど、協賛企業も揃っている。
  • ・RealSenseで3Dスキャンし、3Dプリンタでプリントも出来る
  • 3Dスキャン、編集、プリント機能を提供する(3D Systems)
  • 3D Systemsが「Intel RealSense SDK」の一部に、3Dスキャン技術を提供
  • ・RealSenseを使ったビデオチャットSkype:Microsoft、Lync)
  • 人物の背景を編集除去できるビデオチャット(早ければ2014年下期に提供)

 (背景を壁紙に出来たたりするんだろうな)

RealSenseについての感想

  • 自分がCES2014で、一番目に止まったのが、このRealSenseだ。3Dカメラを顔認識に使うというが、実質、フルHDのステレオカメラが多くのPCに深度センサー付きで販売されるというわけで、基本的に立体カメラがPCやタブレットを介して普及すると考えていいと思う。そうなると、世の中に立体映像コンテンツが溢れることになり、3Dモニタの需要も増えると思う。んでもって、デジタルカメラも3Dカメラになるかもしれない。とにかく、ソフトウェアやフォーマットが揃わないと、このタイプのことは行き詰まるのだが、それは、多くの協賛企業が揃っていることから言って大丈夫だと思われる。
  • 奥行き情報がある程度の精度でわかると、例えば、近距離の立体物との距離が分かり、その結果、正確な物体のサイズも分かるはずである。つまり、アマゾンで物を買うときに、写真で写した物体の大きさが正確に表示できるようになるかもしれない。立体カメラで写した映像と深度センサによる奥行き情報から、映像を3Dモデルに起こして、その3Dモデルをモニターを見ている人の目の位置を追尾して、その位置に合わせて、3Dモデルを傾かせることで、擬似立体表示が可能になる。もちろん、3D表示ができれば、より立体的な表現が可能だ。そういう立体画像でSkypeビデオチャットをやると、より「会っている」状況に近いコミュニケーションが出来るだろう。もちろん、背景は3Dで作った擬似喫茶店なんかにしてもいいだろう。考えると色々面白いことが出来そうなので、今年の下半期が楽しみ。