にほんご

エンビジョンAIアプリのチュートリアル

2020年7月8日

概要

Envisionは、周囲から視覚情報を抽出し、意味のある音声に変換できるアプリです。Envisionの機能は三つのタブに分類されています。 文字の認識、周りの物の認識、スキャンして見つける。

文字の認識

現在および将来のすべての文字認識機能はこのタブの中にあり、いつでも簡単にアクセスできます。

すぐに読み上げを始める

ボタンをもう一度タップすると、Envisionはカメラを向けた先にある短いテキストをすぐに読み上げます。ボタンをもう一度タップして、読み上げを停止します。

オランダ語
またはその他のラテン語ベースの言語のみを読みたい場合は、ヘルプの中の「オフラインでの文字認識」をオンにすることで、読み取りをさらに速くすることができます。

Envisionは言語を自動的に検出することもできます。日常生活で複数の言語のテキストに出くわす場合は、「言語の自動認識」をオンにすることをお勧めします。1つの言語しか読まない場合がほとんどであれば、オフにしておくとよいです。

文章の読み上げ

ボタンをタップして機能を有効にします。Envisionは、書類の位置を音声ガイダンスで案内します。すべての端が検出されると、写真が自動的に撮影されます。画面の中央をタップして、手動で写真を撮ることもできます。 認識されたテキストは新しい画面に表示され、次のこと
ができます。

- VoiceOver
コマンド
を使用してテキストをナビゲートします。 - 「再生
」ボタンをタップして、文章を読み上げます。"Zl_2028" - 「文章
をエクスポートする」ボタンをタップして、文章を共有します。"Zl_2028" - 「文字のサイズを変更」ボタンをタップして、フォントサイズを調整します。

その他のアクション

ボタンをタップすると、複数のページを読む、PDFをインポート、画像をインポートなどのオプションが表示されます。

複数ページの読み取り:
このオプションをタップすると、端検出機能を利用しながら複数のページをスキャンできます。

PDFをインポート: アプリ自体から直接PDFをインポートできます。このオプションをタップすると、ファイルアプリが開き、そこからPDFを読み込めます。

画像をインポート: このオプションをタップすると、Envisionに読み取らせたい画像を直接選ぶことができます。

拡大

この機能を利用して、ロービジョンのユーザは読みたいテキストをズームできます。

画面上でピンチしてズームするか、画面の左上隅の拡大鏡アイコンを押して利用します。拡大モードは、何れの文字認識機能でも使用できます。より高い
コントラストでテキストを読みたい場合は、色を反転するオプションもあります。

周りの物の認識

文字の認識を必要としないすべての機能は、このタブの中にあります。現在、このタブには次の機能があります。

風景を説明する

ボタンをタップして、説明させたい風景の写真を撮影します。Envisionは最も可能性の高い説明を読み上げます。友人や家族の顔をすでにEnvisionに学習させている場合、その内容も説明には含まれます。

Envisionは風景に基づいた説明も
提供します。腕時計の写真を撮ると時刻が表示され、窓の写真を撮ると現在の天気が表示されます。

これらの画像は説明
とともにカメラロールに保存でき、VoiceOverでアクセスできます。

色を検出する

ボタンをタップして、色を認識したい物または衣服にカメラを向けます。Envisionはすぐにその色の名前を読み上げます。もう一度ボタンをタップすると、色の認識は停止します。

ヘルプの中では、標準的な30色だけを認識させるか、詳細な
950色を認識させるかを選択できます。

バーコードをスキャンする

ボタンをタップして、認識させたい製品にカメラを向けます。バーコードが検出されたことを意味するビープ音が聞こえるまで、製品をゆっくりと動かしたり、または回転させます。ビープ音の鳴る感覚を頼りに、バーコードに焦点を合わせます。バーコードが正常にスキャンされると、「チーン」という音が聞こえます。

つづいて製品の名前が読み上げられます。「詳細」
ボタンをタップして、製品の詳細を確認することもできます。

スキャンして見つける

このタブは、アプリのリアルタイム認識を使用して、周囲の人や物を見つけるのに役立ちます。 このページには次のオプションが表示されます。

人をみつける

ボタンをタップして、周囲をリアルタイムでスキャンします。Envisionはフレーム内で人に遭遇/認識すると、ビープ音と軽い振動でお知らせします。その人の顔が学習されていれば、Envisionはその人の名前を読み上げます。この機能を使って、カフェや懇親会で友人を見つけることができます。

ものをみつける

ボタンをタップして、リストの中から見つけたい物を選択します。次に、周囲をリアルタイムでスキャンします。 Envisionはフレーム内で選択した物を検出/認識すると、ビープ音と軽い振動でお知らせします。 頻繁に見つけたい物についてはお気に入りリストに登録することができます。 物のリストの一番下には「何かが足りませんか?私たちに知らせて。」というリクエストを送信するためのボタンが用意されています。

エンビジョンに学習させる

エンビジョンに人の顔を認識させると、「風景を説明する」機能でも有効になります。

写真の撮影を開始できる画面が表示されます。デフォルトで

背面カメラで撮影するようになっていますが、自分撮りをしようとする場合は、フロントカメラに変更することもできます。 適切な写真が撮れるように顔の位置をガイドしてくれます。

"少なくとも5枚の写真を撮影する必要がありますが、認識をより正確にするには約10枚の写真を撮影することをお勧めします。 また、これらの写真はさまざまな角度や背景で撮影すると
役立ち
ます。 「完了」ボタン
をタップすると、その人の名前を入力するように求められます。 そうすることでEnvisionはそれを数秒かけて学習します。 成功すると「スキャンして
見つける」のタブに切り替わります。"

学習した人の顔はここで一覧表示されます。検出し
たくなければ、削除することができます。


他のアプリで画像を認識する

他のアプリの中で見かける画像は、Envisionで説明させたり文字認識
させることもできます。写真、Twitter、WhatsAppなどのアプリです。 「共有」ボタンをタップして、アクションシートのリストの中から「Envision it」を選択します。

このオプションを初めて使う時は、共有のアクションシートに「Envision it」を追加する必要があります。 」共有シートの「その他」
または「アクションを編集」をタップして、リストの中から追加します。

ヒント

Envisionは絶えず進化しているアプリであり、私たちはその機能と性能を改善し続けています。そこで、自動更新をオンにするか、アップデートがあるかを毎週確認してください。 ここでは、私たちがユーザの皆さんからいただいたヒントを紹介します。 Envisionを最適に使うという体験に磨きをかけてくれます。

  • Envisionの多くの機能はまだインターネットに依存しています。 安定したインターネット
    接続であれば、処理は高速に行われます・ 私たちは皆さんが撮影した画像や
    情報を保存することはありません。
  • "Envisionに関するフィードバックがあれば、「ヘルプ」タブの「フィードバックを送る」ボタンから送信できます。ヘルプや説明が必要な場合は、「通話をリクエストする」ボタンからお電話をいただくこともできます。 できる限り早くご連絡いたします。"
  • すべての文字認識機能において、Envisionはデフォルトの言語を自動的に検出し、読み上げます。ただし、主に1つの言語しか扱わず、Envisionを混乱させたくなければ、「ヘルプ」の中で「言語の自動認識」をオフにできます。
  • スピーチ」の設定では、読み上げ音声の種類や速度を調整できます。これらの設定はVoiceOverの設定には影響しません。