原子力基盤技術データベースのメインページへ

作成: 1999/01/12 喜多 伸之

データ番号   :120009
中心窩両眼能動視覚システム
目的      :広い視野をカバーし、かつ、対象を高解像度で観測できるロボット搭載型の視覚システムの開発
研究実施機関名 :電子技術総合研究所知能システム部自律システム研究室
応用分野    :屋内移動ロボット、巡回点検、監視システム

概要      :
 広い視野を持った視覚センサは動的な環境下で働くロボットに有用である。しかし、既存のシステムでは広い視野を得るために解像度を犠牲にするか、さもなくば、非常に大掛かりなシステム構成にならざるを得なかった。そこで我々は、人間の網膜特性に類似した投影像を得るためのレンズを設計し、それを装着したカメラと高速姿勢制御装置を組み合わせ、広い視野の画像を適切な情報量に圧縮して得るコンパクトな視覚センサを開発した。
 

詳細説明    :
 広い視野を実現するアプローチに、魚眼レンズや鏡を用いて1台のカメラで広い視野の画像を入力する方法がある。ところが、このアプローチでは、水平視野角がたとえば120度だとすると、1000x1000画素で入力しても1画素0.12度程度(これは前方1mで約3.5mm)で、1cm四方の文字も読めないほど解像度が低くなる。別のアプローチとして、複数台のカメラにより広い視野をカバーする方法がある。逆にここでは精細な画像を得ることは可能だが、結果として画像情報は膨大な量となり、その処理を実時間で行なうには高速画像処理装置が何台も必要で実装のコンパクト性を欠いてしまう。そこで、我々は人間の視覚システムと同様に、画像の中心付近では解像度が高く、周辺に行くに従い解像度が低下する画像を撮像面上に投影するレンズを設計・製作した。
 
 図1(a)に画像の中心から周辺部分にわたる解像度変化を示した。得られた画像に多くの既存の画像解析アルゴリズムが適用できるよう、中心近傍では高い解像度の中心投影像、その周囲で対数状に解像度が減少する画像、さらに周辺では解像度の低い球面投影像となる設計とした。一般に普及している512x480画素程度の1/3インチCCD撮像素子に投影することにより、中心付近では約0.05度/画素の解像度で、最大視野角120度の画像(図1(b))を得ることが可能となった。


図1 (a) Spatial resolution curve: Pixel coordinate - resolution [pixel/deg] (原論文1より引用。 Copyright 1995 IEEE.). (b) Test image from the real lens (原論文3より引用).

 さて、このようなレンズで環境を適切に観測するためには、詳しい観察が必要な部分を適時視野の中心で捉える、つまり、そちらにカメラの視軸方向を向ける必要がある。このために、入力した画像を高速に解析する画像処理装置と、その解析結果によりカメラの視軸方向を変化させるカメラ姿勢制御装置を備えた両眼能動視覚システムを構築した(図2)。


図2 Overall architecture of the tracking system.

 両眼ヘッド部分(図3)は、左右カメラ独立のパン、共通のチルト、そしてステレオ台一体のパンの4自由度を持ち、左右各カメラの視軸方向をパン方向に300度、チルト方向に90度の範囲で約0.01度の精度で制御できる。画像から3次元計測を簡単にするためにカメラのパン、チルトの回転軸はレンズ中心と一致するよう配慮している。姿勢駆動にはハーモニックドライブ機構付きの小型DCモーターを用い、位置センサには光学的エンコーダーを採用することにより、ノイズの影響を受けにくい高速高精度の姿勢制御を可能としている。コントローラにはトランスピュータ2台を用いており(1台は左右カメラのパン、もう1台がチルトと首のパン)、30Hzで与えられる位置、速度命令を補間して500HzのPID制御を行なっている。ホスト計算機や画像処理装置とはトランスピュータリンクを介した高速な通信を確保している。性能を向上させつつ軽量化を保持することを追求した結果、重さ約2.0kgのシステムで人間と同等あるいはそれ以上の運動性能を得ることができた。


図3 ESCHeR: ETL Stereo Compact Head for Robot Vision.

 画像処理部分には市販のパイプライン型の汎用画像処理装置を用いている。さらに、フーリエ変換など実数演算を要する画像処理能力の拡充と、駆動系のコントローラとの通信を確保するために、トランスピュータを使ったマルチCPU画像処理装置も導入している。ホスト計算機はVMEボード計算機で、実時間UNIXであるLynxOSを採用している。これにより、例えばオプティカルフローと両眼視差を並列に実時間で計算し、動く対象を視野中心で捉え続けるための実時間視線制御を実現している。
 

コメント    :
 製作したレンズは大きく歪んだ投影曲線を実現するために最前面に凹レンズを配置し、2枚の非球面レンズを含んだ11枚のレンズで構成した。設計に際してレンズ全体の大きさと重量に厳しい制約を課したこともあり、現試作品では投影曲線に理論曲線からわずかながらずれが生じている、周辺において明るさが充分得られない、投影曲線の変化領域付近で結像不良が生じるなど、いくつか改善すべき点が残されている。別のアプローチとして、網膜と同様に撮像面上の受光素子の密度を変えた撮像素子を製作する試みがあるが、注目に値する。
 

原論文1 Data source 1:
A Foveated Wide Angle Lens for Active Vision
Y. Kuniyoshi, N. Kita, K. Sugimoto, S. Nakamura and T. Suehiro
Electrotechnical Laboratory, 1-1-4 Umezono, Tsukuba, Ibaraki 305-8568
Proc. of IEEE Int. Conf. on Robotics and Automation (1995) pp. 2982-2988.

原論文2 Data source 2:
Active Stereo Vision System with Foveated Wide Angle Lenses
Y. Kuniyoshi, N. Kita, S. Rougeaux and T. Suehiro
Electrotechnical Laboratory, 1-1-4 Umezono, Tsukuba, Ibaraki 305-8568
Proc. of Asian Conf. on Computer Vision (1995) pp. 359-363.

原論文3 Data source 3:
中心窩両眼能動ビジョンシステムにおける注視制御についての考察
喜多 伸之
電子技術総合研究所知能システム部、茨城県つくば市梅園1-1-4、305-8568
情報処理学会研究会報告 97-CVIM-103 (1997) pp. 131-138.

キーワード:ロボット視覚、能動視覚、中心窩画像、画像処理
robot vision, active vision, foveated image, image processing
分類コード:120202, 120201, 120204

原子力基盤技術データベースのメインページへ