2019年9月20日金曜日

「Seeing AI 3.2」リリース。日本語のリアルタイム認識が可能に。


米国Microsoftは現地時間2019年9月19日、視覚に障害を持つユーザーのための画像認識アプリ「Seeing AI」をバージョン3.2へアップデートした。現在App Storeからインストールすることができる。
主な変更点は以下の通り。

  • Siri Shortcutsに対応しました。「what does this say?」などのボイスコマンドを割り当てて、特定のChannelでアプリを起動することができます。
  • iOS 13に対応しました。
  • iOS 13のダークモードをサポートしました。
  • Short Text channelでは、最大で21言語のテキストを認識できるようになりました。ただし認識できる言語の数は、インストールされている音声の数によって異なります。
  • 写真をexplorしてオブジェクトを認識したとき、同じ名前の複数の物体が認識されると、それぞれに番号が付けられます。例えば「Chair 1」など。
  • 加えて、様々な内部的不具合の修正を行いました。

ここで、注目すべき2つの追加機能についてみてみよう。

その1:Siri Shortcuts対応

Siri Shortcutsを使って、音声コマンドからSeeing AIの特定のChannelを直接起動できるようになった。アプリを探して起動してChannelを選んで……といったてまを大幅に軽減できる。もちろん、日本語によるコマンドも登録可能だ。
設定は「Menu」>「Settings」>「Configure Siri Shortcuts」を開き、ショートカットを設定したいChannelをたっぷ、「録音を開始」をタップして音声コマンドを登録する。
これで、SiriからSeiing AIのChannelを即座に起動できるようになる。

その2:Short Textの多言語対応

今回新たにShort Textで認識できる言語の中には、日本語も含まれている。
Seeing AIを起動してShort Text Channelを選択したら、言語選択ボタンをタップして「日本語」を選択する。
これでiPhoneをかざすだけで、日本語のテキストをリアルタイムに認識して読み上げてくれる。
郵便物や商品パッケージなどで試してみたが、一般的なフォントで印刷されたテキストは、おおよその内容を判別できる程度には読み上げてくれた。
どうしても「Envision AI」と比較してしまうが、第一印象としては、レスポンスはSeeing AIが、テキストの認識精度はEnvisionの方が良いイメージを持った(iPhone 7で使用)。この辺りはもう少し時間をかけて比較する必要があるだろう。
とはいえ、日本語をリアルタイムで認識できるようになったことで、Seeing AIの利用シーンは一気に広がりそうだ。特にEnvisionのセールを逃してしまった筆者のようなユーザーにとっては……。

日本語ローカライズは今回もお預け

今回の目玉、Siri ShortcutsとShort textの日本語対応で、さらに実用的になってきたSeeing AI。まだUIは英語のままだし、紙幣やバーコードのChannelもローカライズされていないが、着実に使えるアプリに進化している。

「Seeing AIの進化によって、ライバル?である「Envision AI」の開発にも良い影響が及ぶことを期待したい。

支援技術関連記事まとめ(2022年11月)※お知らせあり。

※以下のリンクをクリックするとDropboxへ接続し、ダウンロードが自動的に始まります。 ※ダウンロードファイルはHTML形式です。ブラウザで開いてください。 ※正常に表示されない場合は別のブラウザで試すか、エンコード設定を変えて見てくださ い。 ダウンロード: 海外記事 / 国...