2019年9月20日金曜日

「Seeing AI 3.2」リリース。日本語のリアルタイム認識が可能に。


米国Microsoftは現地時間2019年9月19日、視覚に障害を持つユーザーのための画像認識アプリ「Seeing AI」をバージョン3.2へアップデートした。現在App Storeからインストールすることができる。
主な変更点は以下の通り。

  • Siri Shortcutsに対応しました。「what does this say?」などのボイスコマンドを割り当てて、特定のChannelでアプリを起動することができます。
  • iOS 13に対応しました。
  • iOS 13のダークモードをサポートしました。
  • Short Text channelでは、最大で21言語のテキストを認識できるようになりました。ただし認識できる言語の数は、インストールされている音声の数によって異なります。
  • 写真をexplorしてオブジェクトを認識したとき、同じ名前の複数の物体が認識されると、それぞれに番号が付けられます。例えば「Chair 1」など。
  • 加えて、様々な内部的不具合の修正を行いました。

ここで、注目すべき2つの追加機能についてみてみよう。

その1:Siri Shortcuts対応

Siri Shortcutsを使って、音声コマンドからSeeing AIの特定のChannelを直接起動できるようになった。アプリを探して起動してChannelを選んで……といったてまを大幅に軽減できる。もちろん、日本語によるコマンドも登録可能だ。
設定は「Menu」>「Settings」>「Configure Siri Shortcuts」を開き、ショートカットを設定したいChannelをたっぷ、「録音を開始」をタップして音声コマンドを登録する。
これで、SiriからSeiing AIのChannelを即座に起動できるようになる。

その2:Short Textの多言語対応

今回新たにShort Textで認識できる言語の中には、日本語も含まれている。
Seeing AIを起動してShort Text Channelを選択したら、言語選択ボタンをタップして「日本語」を選択する。
これでiPhoneをかざすだけで、日本語のテキストをリアルタイムに認識して読み上げてくれる。
郵便物や商品パッケージなどで試してみたが、一般的なフォントで印刷されたテキストは、おおよその内容を判別できる程度には読み上げてくれた。
どうしても「Envision AI」と比較してしまうが、第一印象としては、レスポンスはSeeing AIが、テキストの認識精度はEnvisionの方が良いイメージを持った(iPhone 7で使用)。この辺りはもう少し時間をかけて比較する必要があるだろう。
とはいえ、日本語をリアルタイムで認識できるようになったことで、Seeing AIの利用シーンは一気に広がりそうだ。特にEnvisionのセールを逃してしまった筆者のようなユーザーにとっては……。

日本語ローカライズは今回もお預け

今回の目玉、Siri ShortcutsとShort textの日本語対応で、さらに実用的になってきたSeeing AI。まだUIは英語のままだし、紙幣やバーコードのChannelもローカライズされていないが、着実に使えるアプリに進化している。

「Seeing AIの進化によって、ライバル?である「Envision AI」の開発にも良い影響が及ぶことを期待したい。

0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...