英語

Envision AIアプリのチュートリアル

2020年6月17日

概要

Envisionは、周囲の視覚情報を抽出し、意味のある音声出力に変換することができるアプリです。Envisionの機能は3つのタブに分類されています。テキスト」「一般」「スキャン&検索」の3つのタブに分かれています。

テキスト認識

現在および将来のすべてのテキスト認識機能は、いつでも簡単にアクセスできるこのタブの下にあります。このタブの中には、以下の機能があります。

テキストを瞬時に読む

ボタンをタップすると、カメラを向けている短いテキストを即座に読み上げます。もう一度ボタンをタップすると、読み上げを停止します。

オランダ語などのラテン語のみを読み取る場合は、設定からオフライン文字認識をオンにすることで、より高速に読み取ることができます。

Envisionは、言語を自動的に検出することもできます。日常生活の中で複数の言語で書かれたテキストに出くわすことが多い場合は、言語自動検出をオンにすることをお勧めします。ほとんどの場合、1つの言語しか読まないのであれば、オフにしておくことをお勧めします。

ドキュメントを読む

ボタンをタップして機能を有効にします。Envisionが音声ガイダンスを提供して、ドキュメントを調整します。そして、すべてのエッジが見えるようになったら、自動的に写真を撮影します。画面の中央をタップして手動で写真を撮ることもできます。認識したテキストが新しい画面に表示され、以下の操作が可能になります。

- VoiceOverコマンドを使用してテキストをナビゲートします。"Zl_
2028" - 再生ボタンをタップして文書を読みます。"Zl_2028
" - 共有ボタンをタップしてドキュメントを共有します。"Zl_
2028" - フォントボタンをタップしてフォントサイズを調整します。

もっと見る

ボタンをタップすると、「複数ページを読む」、「PDFを読み込む」、「画像を読み込む」などのオプションが追加されます。

複数のページを読む。このオプションをタップすると、エッジ検出の助けを借りて複数のページをスキャンすることができます。

PDFをインポートします。あなたは今、アプリ自体の中から右のPDFをインポートすることができます。このオプションをタップすると、お使いの携帯電話上のファイルアプリが開き、そこからPDFをインポートすることができます。

画像のインポート今、あなたは、インポート画像オプションをタップして、直接あなたがEnvisionを介して読みたい画像を選択することができます。

拡大鏡

この機能は、弱視のユーザーが読みたい文字を拡大して表示することができます。

これは、画面上でピンチ&ズームを使用するか、左上の拡大鏡アイコンを押すだけで有効になります。このモードでは、テキスト認識機能のいずれかを使用することができます。また、コントラストの高いテキストを読みたい場合は、色を反転させるオプションもあります。

一般的な認識

テキストの認識を伴わないすべての機能は、このタブの下にあります。現在、このタブには以下の機能があります。

シーンの説明

ボタンをタップして、説明したい写真を撮影します。Envisionが最も可能性の高い説明をしてくれます。すでに友人や家族の顔を教えている場合は、その顔も説明文に含まれます。

また、Envisionはシーンに応じた描写をしてくれます。時計の写真を撮ると時間を教えてくれますし、窓の写真を撮ると現在の天気を教えてくれます。

これらの画像は説明文とともにカメラロールに保存することができ、VoiceOverでアクセスすることができます。

色を検出

ボタンをタップして、色を認識したい対象物や衣服にカメラを向けます。認識した色がすぐに読み上げられます。もう一度ボタンをタップすると、色の認識を停止します。 


設定で
は、あなたはEnvisionがちょうど標準の30色またははるかに多くの記述的な950色を認識するようにするかどうかを選択することができます。

スキャンバーコード

ボタンをタップし、認識したい商品にカメラを向けます。バーコードが検出されたことを示すビープ音が聞こえるまで、商品をゆっくりと動かすか、回転させます。ビープ音の周波数を使ってバーコードにピントを合わせます。バーコードが正常にスキャンされると、「チン」という成功した音が聞こえます。

その後、製品名が聞こえます。また、「詳細情報」をタップして製品の詳細を確認することもできます。

スキャン&検索

このタブは、アプリのリアルタイム認識を使用して、周りの人やオブジェクトを見つけるのに役立ちます。このページでは以下のオプションが表示されます。

人を探す

ボタンをタップして、リアルタイムで周囲をスキャンします。Envisionがフレーム内の人物を認識すると、ビープ音が鳴り、穏やかな振動を感じることができます。訓練をしていれば、フレームの中に顔が出てきた時には、その顔の名前を話してくれます。カフェや懇親会などで友達を探すのにも使えます。

オブジェクトの検索

ボタンをタップして、コンパイルされたオブジェクトのリストから見つけたいオブジェクトを選択します。今すぐリアルタイムであなたの周囲をスキャンします。Envisionが遭遇/フレーム内の選択したオブジェクトを認識するときには、ビープ音が聞こえ、穏やかな振動を感じるでしょう。また、あなたのお気に入りや最も頻繁に検索されたオブジェクトに星を付けることができ、タップしてリストにオブジェクトを追加することができます。をタップして、リストに追加することができます。

ティーチ・エンビジョン

Envisionでは、アプリに顔を教えることができ、後からシーンの描写機能を使って顔を認識することができます。

ティーチエンビジョンのボタンをタップすると、写真を撮る画面が表示されます。デフォルトでは、携帯電話の背面カメラがアクティブになっていますが、自撮りをしたい場合は、画面内で変更することができます。顔を教える」オプションでは、カメラはまた、あなたの顔を適切に配置するのに役立つガイドを提供します。

最低でも5枚以上の写真を撮る必要がありますが、より正確に認識するためには10枚程度の写真を撮ることをお勧めします。また、これらの写真を異なる角度や背景から撮影すると、より正確に認識することができます。写真をクリックしたら、「完了」を押します。あなたは、人の名前を入力するように求められます。これを行うと、Envisionがティーチングを開始しますが、これには数秒かかります。ティーチングが成功すると、スキャン&検索タブに戻ります。

また、Teach Envisionの画面内には、「ライブラリを開く」というオプションもあります。ここには、あなたがトレーニングしたすべての顔が表示されます。Envisionに認識させたくない顔を削除することもできます。


他のアプリで画像を認識する

Envisionは、写真、Twitter、WhatsAppなどの他のアプリで出くわした画像を読み取って認識するためにも使用できます。これは、アプリ内の"共有"ボタンを押して、アクションシートに表示されるアクションのリストから"Envision it"を選択するだけで行うことができます。

初めての場合は、共有シートの右下にある"More"オプションをタップして、アクションにEnvision Itを追加することで、このオプションを有効にする必要があります。

ヒント

エンビジョンは常に進化し続けているアプリであり、機能や機能を改善し続けています。そのため、自動アップデートをオンにしておくか、毎週のようにアップデートをチェックするようにしてください。ここでは、Envisionをより快適に使うためのヒントを、ユーザーの皆様から集めたものをご紹介します。

  • エンビジョンの機能の多くは、やはりインターネットに依存しています。私たちは、処理が高速に行われることを確認していますが、適切なインターネット接続を持っていることが助けになります。私たちは、キャプチャした画像や情報を保存することはありません。
  • Envisionへのフィードバックがある場合は、設定タブの「フィードバックを与える」オプションから共有することができます。ヘルプや説明が必要な場合は、[設定]タブの[フィードバックを与える]オプションからお電話でお問い合わせいただくこともできます。
  • すべてのテキスト認識機能について、Envisionはデフォルトでテキストの言語を自動的に検出して読み上げます。しかし、ある言語のテキストに遭遇することが多く、Envisionを混乱させたくない場合は、アプリ内の音声設定で言語の自動検出をオフにすることができます。
  • 音声設定」では、アプリ内のすべてのVoiceOver以外の音声の発話率と音声を調整することもできます。これらの変更はVoiceOverの設定には影響しません。