|
顔検出機能「顔キメ」 |
|
|
|
画像A |
ソニーに聞く
インタビューに応えてくれた、ソニー株式会社 デジタルイメージング事業本部 パーソナルイメージング事業部 商品企画部 商品企画課 越智 龍氏。 |
|
|
画像B |
ソニーのコンパクトデジカメ
光学式手ブレ補正付きモデルで世界最薄ボディの『DSC-T77』(手前)と約4GBの内蔵メモリを搭載する『DSC-T700』(奥)。
|
|
|
画像C |
ソニーの顔検出機能「顔キメ」
「膨大な人物の写真や画像を解析して、総合的に顔を判断する技術がベースになっている」
|
|
|
画像D |
カラフルスリム『DSC-T77』
ソニーらしくカラーラインアップも豊富。日常のファッションと合わせて選べる5カラー。
|
|
|
画像E |
顔検出の機能をデモ
自分撮りで、顔の正面、斜め、横、と「顔キメ」の認識を実演しながら説明してくれる越智氏。 |
|
|
画像F |
複数の人がいても子どもと大人を自動判別
「顔キメ」ではこども優先を設定したり、最大 8 人まで顔を検出して、ピントが合うように撮影できる。 |
|
|
解説
2008年秋モデルでソニーが発表したコンパクトデジタルスチルカメラ“サイバーショット” 『DSC-T77』は、光学式手ブレ補正機能を装備しながら世界最薄を実現しました。
厚さはなんと 15 mm、レンズカバーを除くと 13.9 mm しかありません。編集部スタッフの名刺ケースのような、いや、それより薄いボディです。それでいて光学4倍ズームレンズを搭載。
それだけの高機能なメカニズムがこの薄いボディのどこにどのように凝縮して積まれているのでしょうか。興味津々です。
T77の上位機種、『DSC-T700』も発表。
T77と比べると 1.4 mmほど厚いのですが、それでも薄さが際だっています。この機種の特長はボディ内に約4 GBの大容量メモリを搭載していることです。「デジタルフォトアルバム」として、撮った写真をデジカメに保存したまま持ち歩くことができます。
そして、この 2 機種で注目したいのは顔検出機能「顔キメ」と「スマイルシャッター」が強化されたことです。
「顔キメ」は、液晶画面に映った人物の顔をカメラが見つけ、顔を基準にしてピントや明るさ、肌の色などをキレイに自動調整してくれる機能です。
「スマイルシャッター」は人が笑顔になると自動でシャッターが切れて撮影できる機能です。
※「世界最薄」は、光学式手ブレ補正機能搭載のデジタルスチルカメラとして( 2008年8月時点、ソニー調べ。)
Q:
顔検出機能の概要としくみを教えてください。
顔認識の基本は、マルを描いて目と鼻とクチがあればそれは顔だと判別するところから始まっていますが、オモチャやイラストではなく、リアルな人間の顔だけを判別するにはどうしたらいいか、どう精度を上げるかの手法は各社メーカーによって異なります。
Q.
顔検出、顔認識のしくみは秘匿性が高い分野なので、残念ながら各社とも詳しい仕組みは教えてくれませんが、御社ではどのような方式で、精度を上げていったのですか?
詳しい話はできませんが、膨大な数の、実際の人間の顔写真を解析し、その情報や顔の定義を凝縮してカメラに覚えさせました。顔写真の情報やパターンの数が多ければ多いほど検出の精度は上がるので、日本はもちろん海外の関係者にも協力していただき、たくさんの人の膨大な数の画像を集めて解析しました。
解説
コンパクトデジカメを中心に、各社が「顔検出」の技術開発にしのぎを削っています。ソニーの場合は、膨大な写真画像をサンプリング、解析して顔を総合的に判断しているようですが、他社では、目やクチ、歯などの特定のパーツを検出して、顔や笑顔を判別する技術を採用しているところもあるようです。
Q.
もし、被写体の後ろにリアルな顔写真のポスターがあれば、ポスター写真であっても顔として認識してしまいますか?
ポスターの顔が大きくてリアルで目立てば、カメラはそれを人の顔と認識する可能性があります。被写体までの距離を考慮するなどして、本物の人の顔がどうかを見分ける方法は、各社とも次の開発テーマになっていると思います。
ただ、弊社製品の場合、複数の顔があった場合…ひとつがポスターだったとしても…複数の顔を認識したマークが画面に表示されますので、タッチパネルを採用したモデルであれば、どれを優先にするかを指でタッチして簡単に選択できるように工夫しています。もちろんこの方法は、簡単ですけれどもオートではないので、ベストだとは思っていません。 将来的には被写体選択の精度を上げて選択いらずにしたいものです。
Q.
複数の人の顔を認識した場合はどちらを優先するか選択できるということでしょうか。
大人と子どもの顔を判別できますので、子どもの顔を優先的に判別する設定もできます。また、集合写真の場合は、最大 8 人まで同時に検出し、みんなの顔にピント合わせたり、一度検出した顔は動いても追尾して、一人ひとりの表情をキレイに撮影します。
Q.
横顔は認識できませんか?
例えば、こうして(画像E)顔を正面にしてカメラを向けると、カメラは私の顔を認識したと思います。
Q.
自分撮りですね…あ、顔を認識しましたね。
正面で認識すればこうして顔を横に向けていっても、斜めに向けたぐらいではまだ検出していますよね。
Q.
斜め45度に向けたくらいでは、顔として認識しますね。
実は2007年春に搭載した頃は、だいたいこのあたりの角度が検出する限界でした。最新機種では更に斜めでも検出できるように改良しました。ただ、このように完全に横顔になると認識できません。斜めから見ても顔として検出する技術、それと、検出した顔が動いたり横顔になっても、ねばり強く追尾する技術を更に改良しました。
Q.
顔と認識するには、最初から横顔や斜めよりは、正面で顔をカメラに向けて検出させておいて、斜めや横顔近くに向いていった方が追尾なり、再検出なりで認識しやすいんですね。ところで、追尾には顔の色も判別の対象になっていますか?
技術的に詳しいことは申し上げられないんですが、一般的に類推されることとすれば、色や形など総合的な要素として顔だと判断しているカメラもあるのではと思われます。
Q.
帽子やサングラス、マスクなどを着用している場合、検出率は下がりますか?
マスクをしている場合の検出は難しいですね。帽子やメガネはある程度、膨大な情報の中には入っていますが、検出率は落ちてしまいますね。メガネは目が見えていれば良いのですが、目が隠れるサングラスなどですと認識率はかなり下がることがあります。
Q.
顔検出機能として、ソニーの技術が最も優れている点はどこでしょうか?
「速度」です。顔を認識するまでの時間が短いので、お客様にはぜひその点に注目していただきたいですね。次に「耐性」といいますか、動いたり、横顔や斜めになったりなど、どこまで追尾できるか、ですね。
瞬時に顔をみつけ、見つけた顔は追尾して、プロが撮るように最適な設定で顔をきれいにキメて撮る、という意味を込めて「顔キメ」という名前にしました。
Q.
ちなみに、犬の顔は検出しないですよね?
しません。ヒトの顔だけです。ただし、犬の画像も膨大に解析して覚え込ませれば、技術的には同様に実現できるでしょうね、もちろん将来の仮定の話ですが(笑)。
Q.
スマイルシャッターも顔検出と同様の技術ですか。
技術的には顔検出の延長で、同様の技術を使っています。まず顔検出でどの辺が顔だということは解っていますから、次は笑っているかどうかを判断する技術ですね。
|