800万画素の超高精細ロボットビジョン開発


情報通信研究機構(NICT)と日本ビクター(JVC)は共同で、ハイビジョンの4倍の解像度を持つ800万画素超高精細画像技術と、5本指分身ロボットを統合したネットワークロボットビジョンの開発に成功、視覚限界に迫る800万画素超高精細ロボットビジョンを開発した。

これにより、遠隔操作するロボティクス空間のリアリティ・臨場感を飛躍的に高め、ロボットの操作性・実用性を格段に向上させた。

この技術は将来、遠隔医療・介護などへの応用が有望視される。

■ロボットの目となる超高精細カメラ

NICTとJVCは、21世紀の基幹となる情報通信技術として、ICT(情報通信技術)とロボティクスを融合する「ネットワークロボットプロジェクト」を推進している。

この中で、ロボットの視覚能力・画像認識能力および、それに伴う性能・機能を飛躍的に向上させるには、ロボットの目となる超高精細カメラが必要であり、カメラの小型化が重要な課題となっている。しかし、従来の超高精細カメラは大きくて重く、ロボットの目としては使用できなかった。

ロボットの目としての超高精細カメラの小型化は、JVCが800万画素のカラーCMOS撮像素子を搭載した小型カメラヘッド(従来カメラとの重量比1/18、体積比1/19)を開発、このカメラをNICTが開発した両腕・触覚付き5本指ハンドのネットワーク分身ロボットと組み合わせることによって、人間の視覚限界に迫るロボットビジョンを世界で初めて実現した。

■ロボットビジョン

開発したロボットビジョンは、人間の目に迫る視力を持ち、同時に広い視野(超広視野角)を備えている。これにより、数多くの乱雑に置かれた多種多様なペットボトルから、それらに書かれた小さな文字を識別し、特定のものをつかむことを可能にした。

また、活字だけでなくクセのある手書き文字も容易に判読しながら作業を進めることもできる。ハイビジョンクラス(200万画素)の画像では、このレベルの解像度と広視野角を両立することは難しかったが、このロボットビジョンでは、人間の視力に一段と近づいたものとなっている。

■超高精細ロボットビジョン

NICTとJVCは共同で、以下のシステムをいずれも世界で初めて開発することに成功した。

2001年にハイビジョンの4倍の解像度である800万画素(3,840×2,048画素)を持つ超高精細プロジェクタを開発している。表示素子には、超高密度D-ILAを採用している。そして2002年に800万画素(3,840×2,048画素)の超高精細カラー動画像カメラ(写真1)を開発した。


〔写真1〕従来の800万画素超高精細CMOS動画像カメラと、
   開発した小型カメラシステム(右)の大きさ比較


このカメラは、撮像センサーにそれまでの主流であったCCD撮像素子ではなく、JVCが超高精細動画像用として世界に先駆けて開発に成功したCMOS撮像素子を採用している。

しかし、このカメラシステムは大型で据え置き型であり、この大きさではロボットの目としてロボットに搭載することは不可能であった。

■動画像カメラシステム

今回、この800万画素CMOS超高精細カラー動画像カメラを、RGB3板(CMOS撮像素子3枚)から単板化(CMOS撮像素子1枚)するとともに、レンズなど光学系の小型化をはかり、カメラヘッドの小型化・軽量化を行うことで、ロボットに搭載可能なレベルにまで小型化・軽量化した(写真2)。


〔写真2〕超高精細ロボットビジョン

サイズは、従来のカメラヘッドが幅279×高さ364×長さ540mm、重さ29kgに対し、今回開発したものは幅130×高さ105×長さ220mm、重さ1.5kgとなっている。これは以前に開発した800万画素カメラと比べ、体積で約1/18、重さで約1/19に小型化・軽量化している。

この小型・軽量800万画素超高精細カメラをロボットの目として、ロボットの頭部に搭載し、人間の視覚限界に迫るロボットビジョンを持つネットワークロボットのプロトタイプとして完成させた。

■ネットワーク分身ロボット

NICTは、これまでに人間の腕・手が持つ機能に限りなく近いヒューマノイドアームおよび触覚付き5本指ハンドを開発、このヒューマノイドアーム(両腕)およびハンド(両手)で構成されるネットワーク分身ロボット(両腕・触覚付き5本指ハンド)のプロトタイプを開発した(写真3)。


〔写真3〕ネットワーク分身ロボット

このネットワーク分身ロボットは、ネットワークを介して自分の分身(自分の手)のように操作・動作することができる。人間の視覚限界に迫る800万画素超高精細ロボットビジョン、触覚付き5本指ヒューマノイドハンド、データグローブを用いた人にやさしい操作インターフェイスといった特徴を持つ。

操作は、800万画素超高精細ロボットビジョン画像を、800万画素超高精細プロジェクタ(200インチリアスクリーン)に表示し、データグローブを用いて、分身ロボットをネットワークを介して遠隔操作する(写真4)。


〔写真4〕遠隔操作システム

多くの乱雑に置かれた多種多様な日用品(ペットボトル等)から、それらに書かれた小さな文字(タイトル、説明文)、ノートに書かれたクセのある手書き文章を容易に判読しながら、遠隔地から5本指ハンドで特定のものをつかみ移動させている(写真5)。


〔写真5〕分身実証実験

ハイビジョンクラス(200万画素)の画像では、このレベルの解像度と広視野角を両立することはできず、このような作業をすることは難しかった。

NICTでは今後、超高精細ロボティクス技術の研究開発をさらに進め、ネットワークロボットを、人間の能力により近づけて「ネットワーク分身」の実現を目指すことにしている。

<用語説明>
*D-ILA=Direct Image Light Amplifierの略。一般的なTFT構造とは異なり、配線やトランジスタを画素の下に配置することにより、高い開口率と従来の透過型液晶表示素子では難しかった超高密度画素構造を実現。表示デバイスの中で最も高精細な映像を表示可能な素子。

*データグローブ=手袋に指の関節の曲がり角度を検出するセンサーを組み込んだもの。5本の指すべての動きを検出することができる。

<資料提供:独立行政法人情報通信研究機構>