2018年6月25日月曜日

視覚障害者に便利なiPhone用OCRアプリ(1)紹介編


iPhone持ちの視覚障害者は必携


視覚障害者がスマートフォンを使うメリットは数多くありますが、その中でも個人的に大きいのが、印刷された文字を認識してテキストデータに変換してくれる「OCR」アプリの存在です。
郵便物や商品パッケージの文字を、そのまま読むことができない重度視覚障害者でも、OCRアプリとスクリーンリーダーを利用することで、完全に正確な情報ではなくても、大雑把にそれがどのようなものなのかを判別することができます。これは、有ると無いとでは情報アクセシビリティ的にも非常に大きな違いがあります。

スマートフォン向けには多種多様なOCRアプリがリリースされていますが、今回はその中で、視覚障害者が日常的に使えるものをピックアップしてご紹介します。すべてiPhone向けのもので、Voiceoverでの操作を確認しています。

紹介するのは以下の5本。

・Seeing AI
・OCR
・Google翻訳
・スキャナー&翻訳者
・Text Grabber 6

それぞれのアプリの基本的な使い方と特徴を見て行きましょう。
なお、画面を見ずにVoiceoverだけで操作することを前提にした紹介と鳴りますので、見た目での操作とは若干の違いがあるかもしれません。ボタンなどの名前は、Voiceoverで読み上げた内容を記載しています。
ご了承ください。


「Seeing AI」:撮影がとにかくラク。


開発/Microsoft Corporation 価格/無料(広告なし)
バージョン/2.2.0

○起動と設定

アプリを起動したら、[Channel」から「Document」を選択します

・使い方

1.書類にiPhoneをかざすと、書類がきちんと写真に収まるように音声でナビゲートしてくれます。例えば「Top edge visible」とアナウンスされた場合、書類の上端が切れているので、iPhoneを少し上に向けます。Right(右)、Left)左)、Bottom(下)、Top(上)それぞれの端を識別します。
「Hold steady」とアナウンスされたら、iPhoneを動かさずに少し待てば、シャッター音が鳴り書類がスキャンされます。
また商品パッケージなど明確な端が無いものをスキャンするときは、大体の位置で「Take picture」ボタンで撮影を行えます。

2.文字認識には、ネットワーク接続が必要です。認識処理が完了すれば、抽出されたテキストが表示されます。テキストが認識できない場合は「No text recognized」と読み上げられます。
抽出されたテキストはVoiceoverで読み上げる他、内蔵のスピーチ機能でも読み上げます(ただしこの場合は日本語は非対応)。

3.「Close」をタップすルカ、Voiceoverのスクラブジェスチャで、、次のスキャンに移れます。

○そのほかの機能

履歴保存:不可
インポート:不可

○特徴など

視覚障害者のために開発された、画像認識アプリです。書類スキャンの他にも、商品バーコードや人物の認識などさまざまな機能が含まれていますが、現時点ではまだ日本語には対応していません。ただ書類スキャンだけは日本語の認識が可能です。最大の特徴は、書類を撮影するときに、リアルタイムでナビゲートしてくれる機能でしょう。カメラが書類を捉えられずスキャンできないといった失敗を防げます。機能はテキストの認識に特化しており、翻訳や履歴の保存などには対応していません。非常にシンプルです。


「OCR」:その名の通りシンプルなOCRアプリ


開発/Gen Shinozaki 価格/無料(広告あり)
バージョン/1.03

○起動と設定

アプリを起動したら、設定なしですぐに使い始められます。

○使い方

1.トップ画面から「カメラ起動」をタップします。

2.撮影画面になります。書類にiPhoneを向けて「写真を撮影」ボタンをタップしてスキャンします。シャッター音が鳴ります。

3.写真の確認画面が表示されます。「写真を使用」をタップして、テキストの認識処理を実行します。文字認識にはネットワーク接続が必要です。

4.認識けっかが表示されます。「OCR」という見出し項目の次がテキストフィールド担っているので、ここにVoiceoverカーソルを合わせれば読み上げてくれます。なお、テキストが認識されない場合は問答無用でトップ画面に戻されるので、慌てずもう一度撮影して見ましょう。

5.「戻る」ボタンをタップするか、Voiceoverのスクラブジェスチャでメイン画面に戻り、次のスキャンに移ります。

○そのほかの機能

履歴保存:認識結果画面から「保存する」をタップすれば、メイン画面の「履歴」から抽出したテキストの履歴を参照できます。
インポート:メイン画面で「写真を選ぶ」をタップすると、iPhoneに保存されている写真からイメージを読み込んで認識できます。

○特徴など

テキスト抽出に特化したシンプルなスキャナアプリ。日本語のインターフェイスで利用できる安心感があります。


「Google翻訳」:OCRアプリとしても人気が高い


開発/Google, Inc. 価格/無料(広告なし)
バージョン/5.20.1

○起動と設定

起動するとまず「ホーム」画面が表示されます。
「元の言語」を「日本語」に設定しておきます。
トップ画面にある「リアルタイムカメラ翻訳」をタップし、カメラからのスキャン機能に切り替えます。

○使い方

1.カメラ画面になるので、書類にiPhoneを向けて「スキャン」をタップします。シャッター音は鳴りません。

2.認識処理が開始され、テキストが認識されたら「すべて選択」をタップします。なおGoogle翻訳はオフライン翻訳にも対応していますが、写真からのテキスト認識にはネットワーク接続が必要です。

3.抽出されたテキストが表示されます。テキストは「翻訳言語」と読み上げられる次のテキストフィールドに表示されているので、ここにVoiceoverカーソルを移動させると読み上げられます。なお、少ししたには翻訳されたテキストも表示されています。

4.「戻る」をタップするか、Voiceoverのスクラブジェスチャでカメラ画面に戻り、次のスキャンができます。

○そのほかの機能

履歴保存:抽出されたテキストと翻訳結果は自動的に保存され、ホーム画面のトップから参照できます。この履歴にスターをつけると「保存済み」タブに常時保存されます。
インポート:カメラ画面の「インポート」をタップすれば、iPhoneの「写真」に保存されている写真を取り込んでテキストを抽出できます。

○特徴など

さまざまな方法で翻訳が行えるアプリ。カメラを使用した文字認識機能を使えば、OCRアプリとしても十分活用できます。リアルタイムでテキストを認識し、タップで翻訳する機能もありますが、画面の見えないユーザーにはあまり使えないかもしれません。今回紹介しているOCRアプリの中では、唯一シャッター音が鳴らないのも特徴の一つといえるでしょう。


「スキャナー&翻訳者」:協力なインポート機能


開発/DataCom 価格/360円
バージョン/4.0

○起動と設定

起動するとカメラ画面にナリマスガ、まず最初に「Take photo」の次にある「Camera」ボタンをタップして、カメラスキャンモードに設定しておきます。

○使い方

1.カメラ画面で書類にiPhoneを向け「Take photo」ボタンをタップして写真を撮影します。シャッター音が鳴ります。

2写真の編集画面になります。「Source language picker」の隣のボタンが、テキスト抽出処理を実行するボタンです(ラベルが付けられていないかもしれません)。このボタンをタップします。もしこのボタンが見当たらない場合はもう一度「Camera」ボタンをタップして見ましょう。また、このアプリを購入して初めて使うときは「Source language picker」をタップして、日本語を選択しておきます。

3.テキストの抽出にはネットワーク接続が必要です。テキストが抽出されると、「BTN shareing」の隣のテキストフィールドにテキストが表示されます。テキストが見つからない場合は「Text not found」とダイアログが表示され、「OK」をタップすると編集画面に戻ります。

4.次のスキャンを開始するには「Back」ボタンを2回、もしくはVoiceoverのスクラブジェスチャを2回操作します。

○・そのほかの機能

履歴保存:スキャンされた写真と抽出したテキストは、メインメニューの「Scans」「Text」から参照できます。
インポート:カメラ画面の「Import photo」をタップすると、iPhoneの写真ライブラリーに保存された写真に加え、iCloud、Dropbox、Google Driveアプリとリンクしてイメージファイルを読み込み、テキスト抽出処理を行うことができます。

○特徴など

インターフェイスがやや独特で、ラベル付けされていないボタンがあるなどVoiceoverではやや使いこなすのにコツが必要ですが、クラウドサービスからのインポート機能は大きな魅力です。抽出したテキストの翻訳機能もあります。
一つ注意が必要なのは、このアプリは、スキャンした画像を自動的に保存するので、定期的に「Scans」を開いて不要なファイルを消去しないとアプリが重くなります。また設定の「Image autosave」と「iCloudsync」もオフにしておきましょう。いつの間にかiCloudストレージを章ひしてしまいます。


「Text Grabber 6」:オフライン対応。定評のあるOCRエンジンを搭載


開発/ABBYY 価格/600円
バージョン/6.8.4

○起動と設定

初めて使うときは「Enabled recognition language」をタップして、「Japanese」を追加しておきます。

○使い方

1.「Camera」タブをタップしてカメラモードに切り替えたら、書類にiPhoneを向けて「View finder」をタップして撮影します。シャッター音が鳴ります。

2.編集画面に切り替わるので「Done」をタップします。

3.テキストの抽出処理が実行されます。このアプリは、オフラインでもテキストの抽出ができます。テキストが認識されないと「Unable recognize image」のダイアログが表示されます。ただこのダイアログに「Continue」ボタンがあれば、これをタップして抽出結果にアクセスできます。抽出されたテキストは「Share」ボタンの次にあるテキストフィールドに表示されているので、Voiceoverカーソルを合わせて読み上げることができます。

4.次のスキャンを行うには、「Back」>「Cancel」と押してカメラ画面に戻ります。Voiceoverのスクラブジェスチャは使えませんでした。

○そのほかの機能

履歴保存:抽出結果画面の「Save」をタップしてテキストを保存し、トップ画面の「Notes」タブから参照できます。
インポート:トップ画面の「Album」をタップして、iPhoneの写真ギャラリーからイメージを読み込み、テキストの抽出ができます。

○特徴など

OCRエンジンがドキュメントスキャナ「ScanSnap」にも採用されているABBYY社のOCRアプリです。今回紹介したアプリの中で、唯一オフラインでテキスト抽出処理ができるのが特徴。カメラ撮影によるOCRのほか、リアルタイム認識やQRコードスキャナ機能も備えています。もちろん、写真から抽出されたテキストの翻訳も可能です。また、時々無料セールを開催しているので、その時を狙うのもオススメです。


次回は各アプリの認識能力と機能を比較


視覚障害者でも使える、iPhone用OCRアプリを5本、ご紹介しました。
他にも「Office Lens」や「Adobe Scan」など高性能なOCR機能を搭載したアプリもありますが、今回はちょっとした書類や商品パッケージなどをスキャンして即時に抽出したテキストを読み上げられるものをチョイスしています。

長くなってしまいましたので、次回の記事で、肝心の「文字認識精度」や使い勝手を中心にレビューしていきたいと思います。


※この記事はiOS 11.4で執筆しました。

0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...