2020年9月26日土曜日

iPhone向け物体認識アプリ「Vhista」でちょっとだけ未来を感じたかも。

視覚障害者にとって、周囲にある物言わぬオブジェクトを認識するのは難易度の高いクエストだ。

手探りで恐る恐る触れてみるか、誰かに教えてもらわなければそのオブジェクトは存在しないも同じ。でもこのご時世、ぺたぺた者に触れるのもはばかられるし、常に新設な人がそばにいてくれるとは限らないのが現実。

そんな悩みを解消してくれるかもしれないときたいされているのが、コンピュータビジョン(CV)すなわちAIによる画像認識技術。

スマートフォンで周囲をぐるりと撮影すれば、周りにある者を目で見たように教えてくれる………視覚障害者が待ち望んでいる未来だ。


「Vhista」はコロンビアのエンジニアであるJuan David Cruz氏。によって開発された、iPhone用物体認識アプリ。現在App Storeから無料でダウンロードできる。

このアプリは、リアルタイムに物体を解析するARモードと、撮影した写真やフォトライブラリの画像をじっくり解析する「クラウドモード」の2つのモードを搭載している。いずれもiPhoneノカメラが捉えた映像をCVを用いて解析し、画像に含まれる物体の名前を音声で読み上げてくれる。


アプリを起動すると「ARモード」になり、iPhoneをかざした先の物体をリアルタイムに検出し読み上げる。解析処理はiPhone内で行っているようでオフラインでも動作する。

このモードではオブジェクトの名前だけでなく、物体までのおおよその距離も教えてくれるので、周囲の環境をイメージする助けにもなる。


また「Take Picture」で写真を撮影するか「Choose from Photo library」から写真をインポートすると、クラウドを利用した、より高精度な解析が実行される(インターネット接続が必要)。

ARモードと比べ処理時間はかかるが得られる情報量は圧倒的に多い。このモードでは解析結果の精度がパーセントで表示されるのも特徴。個人的には画像解析中の効果音が可愛くて好みだ。

解析結果から前の画面に戻った時「Take Picture」ボタンが「Cancel recognition」と読み上げられてしまうのはBugかな? 筆者だけかも。


インターフェイスや音声は全て英語だが、認識精度はSeeing AIやiOS 14の物体検知と比較しても、正確さや詳細度において遜色ない。まあ得手不得手はあると思うが、少なくとも少し前までのこの手のアプリのような明らかに的外れな結果は少ない気がする。

なによりリアルタイムでもそこそこ的確な情報が得られるのは、従来のアプリではあまり経験できなかったように思う。


とはいえVhistaはまだ情報量もレスポンス的にも目で見渡すようにはいかず、理想のアプリにはまだ力不足なのは否めない。だがCVの進化を実感できるとともに今後に期待を持たせてくれるアプリでもあると感じた。今後AIへの学習が進み、端末の性能がアップしていけば結構良い線まで到達するのではないか。そんなワクワク感がある。

インターフェイスは非常にシンプルでVoiceoverでの操作も全く問題ない。リアルタイムとクラウドで認識を使い分けられるのも理にかなっているし、英語さえ苦にならなければ体験して見るのも面白いと思う。過剰な期待は禁物だけど。


このジャンルはまだまだ発展途上。実用的になるにはまだ時間が必要だろう。

でも「Vhista」でちょっとだけ未来を垣間見た気がするな。


参考:Vhista App Helps Blind People Move Around the World | Digital Trends


0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...