2019年12月2日月曜日

SNSのネタ画像「ミーム」をアクセシブルにする技術。


「ミーム(Memes)」とは、主にSNSで共有される、いわば「ネタ画像」のこと。
もしくは「画像大喜利」かな?
インターネット・ミームとも呼ばれ、画像意外にも動画やテキストなども含まれるが、今回は画像ミームに関するお話。

ミームは有名人や動物、赤ちゃんなどの画像に面白い文章を合成する、というのが一般的なパターン。「ミーム・ジェネレーター」と呼ばれるWebサービスを使えば簡単にミームを作成してSNSへ投稿できるため、爆発的に流行することも多い。日本ではさほど多くは見られないが、海外ではネット上の楽しみとして定着している。
あまり役には立たないが老若男女が楽しめるミーム。だがスクリーンリーダーでWebを利用する視覚障害者は、この楽しみから除外され続けてきた。

ミームがリュ痛しているのは主にTwitterやFacebookと言ったSNS。これらのサービスでは投稿された画像に、視覚障害者のための説明文を加える機能が提供されているが、このオプションは非常に見つけにくいため、ほとんど利用されていない。調査によると、SNSに投稿された100万枚のイメージの中で説明文が加えられていたのは、わずか0.1%だったという。

米国カーネギーメロン大学(CMU)のHuman-Computer Interaction Institute(HCII)の準教授であるJeff Bigham氏を中心とした研究チームは、SNS上に流通するミームに視覚障害者向けの代替テキストを追加するプラットホームを開発。ピッツバーグで開催されたACCESS conferenceで発表した。

ミームの面白さは、同じ画像に加えられたテキストのバリエーションにある。そのため単純なオブジェクト認識やOCRだけではそのニュアンスを伝えきれない。
このプラットホームでは、ミームのベースとなる画像に対応したテンプレートをあらかじめ用意しておき、画像認識と光学式文字認識技術を用いて、ミーム画像に自動的に代替テキストを追加する。要するにミームに用いられているイメージの説明と、その画像にオーバーレイされた文字情報を個別に解析し説明テキストを生成する仕組みのようだ。その画像が「ミームである」ことが判別できる、ということが重要だ。

加えて研究者たちは、ミーム画像にオーディオでニュアンスを追加する機能も開発した。説明テキストだけでは面白さを伝えるには不十分、と考えているようだ。
ミーム作成者は画像にオーディオファイルをドラッグ&ドロップすることで、イメージに効果音やメッセージなどのオーディオ説明をつけることができる。

研究チームは次の段階としてこのプラットホームを、ミーム・ジェネレーターやSNSと統合することを考えている。ミーム・ジェネレーターから画像をアップロードするタイミングで代替テキストを生成できれば、視覚障害者はスクリーンリーダーを用いて多くのミームを音声で楽しめるようになるだろう。またCMUは各種ブラウザ用の拡張機能の開発にも着手しているようだ。

CMUのJeff Bigham氏は語る。
「ミームは重要視されるようなものではないのかもしれません。しかし、興味を持つ人々を選別しないことは、アクセシビリティの観点から非常に重要なのです。」

インターネット上には、役に立つもの、下らないもの、笑えるもの、有害なもの。多種多様なコンテンツが流通している。だが情報の内容でアクセシビリティに優先度がつけられるべきではない。すべてのコンテンツがアクセシブルであることが大前提であり、そこからどの情報を受け取るかはあくまでもユーザーに委ねられるべきだろう。
残念ながら現状、障害者はまだ十分な情報の選択肢を与えられてはいない、というのが率直な印象だ。

関連リンク:


0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...