SKY NOTE

skymouseが思った事考えた事を記したもの

Pref..
Speech
STOP
Follow..
QR Code
|◀
▶|
QR
×
voice
volume
0
rate
0
pitch
0

フラクタル画像を使った画像認識

フラクタル画像圧縮を用いた類似画像検索システム
圧縮符号データベースを対象とした画像の検索手法について
横山貴紀:電気通信大学 大学院情報システム学研究科
http://sd.is.uec.ac.jp/research/intro/cbir/fractal/

ちょっと昔だが、CEATECで類似画像検索を見て、驚いた事がある。この技術とソニーのメガネ型ディスプレイを繋ぐと面白そうだ。似ている画像が認識できるという所がミソで、大抵の画像は、どこかしか違っており、その違いを巧く吸収できる事が、認識率のアップに繋がるからだ。ちなみに、こういう技術にありがちな遅さがなく、極めてスピーディーだった事も驚いた理由の一つだった。
 
似ている画像が認識できれば、柔軟な認識が出来るので、画像的に多少違っても、同じものだと認識できれば、コンピューターに概念を教える事が出来るのである。つまり、りんごの画像とりんごという言葉(概念)の相関関係を教える事が出来る。
 
それができれば、スーパーに行くと、りんごの山がある。それをカメラでかざすと、りんごの山のところに、りんごと文字が表示される。りんごをクリックすると、りんごに関する情報、例えば、栄養バランスの表示が現れる。つまり、いちいちタイピングしなくても、かざして文字を浮き出させてタッチパネルでクリックすればいいわけだ。これなら誰でも使える。かざして押すだけなんだから。
これを「ビジュアルタイピング」と呼ぶ事にする。
 
そういう道具があるとクールだと思う。OpenCLのような標準技術があるので、こういう技術を使って画像認識技術が広まれば面白い。人の顔で人を認識し、モノの画像からモノを認識し、それを文字に直して検索する。結構面白いと思うのだがどうだろうか?