2019年12月5日木曜日

Seeing AI 3,3リリース。待望の日本語化だけど……。


Microsoftは2019年12月3日の国際障害者デーに合わせ、視覚障害者を支援するiPhone用画像認識アプリ「Seeing AI」の最新版であるバージョン3.3をリリースした。iOS10以降のiPhone、iPad、iPod touchに対応し、現在App Storeから無料でダウンロードできる。
Seeing AIは、カメラで捉えた書類や人物、風景などを画像認識AIで解析し、何が写っているかを音声で読み上げることで、視覚障害者の「目」の代わりをしてくれるアプリだ。
以下の8種類のモード(チャンネル)が用意されている。

  • 短いテキスト(リアルタイムの文字認識)
  • ドキュメント(書類のテキストを抽出)
  • 製品(バーコードを読み込み情報を取得)
  • 人(顔検出して登録した人物を識別)
  • 通貨(紙幣の識別)
  • シーン(風景、オブジェクト認識)
  • ライト(明るさ検出)

バージョン3.2から3.3での主な変更点は以下の通り。

  • 日本語を含む5つの言語に対応。
  • 「通過」チャンネルが日本円に対応。
  • 日本語環境で「Handwriting」チャンネルが無効に。
  • Siriショートカット、Haptic Touchショートカット対応。
  • そのほか、細かい修正。

「日本語対応」と言うことでメディアでも大きく取り上げられているSeeing AI 3.3。
インターフェイスはもちろん、これまで英語で読み上げられていたシーン解析の結果なども日本語で読み上げられるようになり、非常に分かりやすくなった。言葉の壁でSeeing AIを敬遠していたユーザーも気軽に試すことができるだろう。

ただ肝心の認識機能自体は前バージョンとさほど変化はしていないようだ。テキストの認識は以前から日本語に対応されているが、他のOCRアプリと比較すると、誤認識が気になるし、商品バーコードの識別も国内の製品はほぼ読まない(輸入食品などは英語で読み上げる)。あ、でも「きのこの山」は「Kinoko no Yama」として海外向けの情報が表示された。海外で販売している商品は識別するようだ。
今回の「日本語化」は、とりあえずインターフェイスの整備が中心で、本格的なローカライズは今後に期待、と言ったところだろうか。

日本円の識別ができるようになった。


今回のアップデートで新機能と言えるのが、日本円の識別。
チャンネルから「通貨」を選択し識別する通過を設定すれば、iPhoneを紙幣にかざしてリアルタイムに紙幣の種類を読み上げてくれる。このモードはオフラインでも動作する。
試してみたところ、現状まだ認識速度が遅い上に誤認識が多い印象。おそらく光のあたり具合などが影響していると想像できるが、同じ紙幣を撮影しているのに「1万円」と読んだり「千円」と読んだりする。一万円札を「千円」と識別されると、お試しとはいえちょっとカチンとくる。テキストなら多少の誤認識も許容できるが、紙幣を間違って認識されるのはちょっと困ったことになりそうだ。
紙幣識別アプリは定番の「Nant Money Reader」が公開終了となり、無料アプリの選択肢が少なくなった上、2024年には新紙幣も登場する。安定して利用できるアプリとしてSeeing AIが期待されるだけに改善を願いたいところだ。

個人的お気に入り機能。


ここで突然。
筆者がお気に入りの「Seeing AIならでは機能」ベスト3を発表。

第3位「短いテキスト」チャンネル。
リアルタイムでテキストを識別し読み上げてくれる機能。
Envision」を購入できない貧乏ライターの筆者にはありがたい。
ちなみに性能はEnvisionの方が良いみたい。

第2位「ドキュメント」チャンネルの自動タグつけ。
書類をスキャンしてテキストを抽出する機能。OCRの精度は最高!とは言えないが、ドキュメント内の見出しやリストを自動的に判別してタグをつけてくれる機能がとても魅力的。Seeing AIのビューワで見出しジャンプを使って読むこともできるし、PDFにエクスポートすればタグが付いた状態で出力できる。
撮影台を使ったり照明を調整するなどして誤認識を減らす工夫をすれば実用的かも。
あと、撮影時のエッジ検出機能は優秀だと思う。

第1位「シーン」チャンネルの「写真の探索」。
この機能だけでもSeeing AIを使う価値があると思う。
撮影した写真や保存された写真をインポートして「探索」をタップすれば、写真に写っているオブジェクトをタッチとサウンドフィードバックで探すことができる。つまり写真が見えなくても、どのあたりに何が写っているのかがわかる。とても楽しい。

Seeing AI、今後の展望は?


「視覚障害者のスイスアーミーナイフ」とも呼ばれるSeeing AI。このアプリの魅力は、最先端の画像認識技術がオールインワンにパッケージングされているという点にあるだろう。だがバージョン3.0のリリースから2年ほど経過する間、視覚障害者を支援するアプリは急速に進化を続けており、Seeing AIの優位性は以前ほどではなくなっているのも事実。実際、当事者間では「Envision」など有料だが高品質なアプリが大きな支持を得ている。

これはMicrosoftも語っていることだが、Seeing AIは視覚障害者の支援を行う一方で、「社会貢献としてのAI」というMicrosoftの活動を一般ユーザーに示すためのショーケースとしての側面もある。今回のリリースが12月3日の国際障害者デーに合わせたことで多くのメディアに取り上げられ、その目的はある程度達成されているように見える。

今後Microsoftがどの程度このアプリに注力するのかは不透明だ。Android版に言及しないあたり、どうなのかな?と勘繰ってしまう。
だがある意味Envisionをはじめとした有能なアプリが商業的に成立するためには、Seeing AIは「無料だけどそこそこ使える」くらいのポジションをキープしている方が健全なのかもしれない。何せ相手は巨人Microsoftだからね。

視覚障害者を支援するアプリの中でも、画像認識AIを応用したアプリは最もホットなジャンルと言えるだろう。Seeing AIEnvisionAndroid版)、そしてGoogleのLookout。さらに最近では韓国から「sullivan plus」というニューフェイスも登場している。
これらのアプリが良い意味で競い合い、技術を磨きあうことで性能が向上し、視覚障害者の生活をもっと便利にしてくれることを望みたい。


0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...