Computer Visionとは何か？| Vade

オブジェクトの分類：

視覚データ内のオブジェクトを検索または分類する機能。最も基本的なレベルでは、これにはコンピュータが画像の内容（木、海、犬など）を識別できることが含まれます。

オブジェクトのローカリゼーション：

オブジェクトのローカリゼーションは、視覚データ内の単一のオブジェクトを見つける機能です。たとえば、犬の写真がある場合、コンピュータは画像内の犬を識別してその位置を特定します。

オブジェクトの検出：

オブジェクトの検出は、Computer Visionテクノロジーの高度な種類のものです。オブジェクトの検出機能を活かして、コンピュータは、複数の物体が視覚データ内のどこにあるかを正確に識別して特定します。たとえば、犬と猫が一緒に写っている画像があるとします。オブジェクトの検出によって、コンピュータは2つの物体を区別し、両方を正確に識別して位置を特定します。

Computer visionの仕組み

Computer visionはパターン認識に基づいて機能します。アルゴリズムを使って膨大な量の視覚データをスキャンし、それを理解します。

Computer visionのトレーニングでは、コンピュータを大量の視覚データにさらして、主要な機能とパターンを区別することを学習させます。たとえば、ボートを識別するようにコンピュータに教える場合、データサイエンティストは、ボートの画像と関連するオブジェクトをコンピュータに入力しなければなりません。時間が経過するにつれて、コンピュータは、ボートであるかどうかを判別し、ボートの主要な機能を区別できるようになります。

コンピュータが、画像が何であるかを正確に識別できるようになると、さまざまなアプリケーションのために画像をセグメント化し、検出し、分類できるようになります。AIが進歩したことで、Computer visionテクノロジーは、画像認識において人間の識別能力と同じくらい優れた能力を発揮するようになりました（人間の認識能力よりも優れている場合も多々あります）。

メールセキュリティ:

Computer visionは、画像を分析し、ブランドロゴ、QR Code、疑わしいコピーなどのフィッシング攻撃で一般的に使われる機能を特定することで、メールセキュリティを強化します。画像操作（ハッカーがブラックリストを回避するために企業のロゴにわずかな変更を加えるために用いる戦術）は、組織に対する脅威としてますます増加しています。Computer visionは、リモート画像であっても画像操作を認識することで、これらの高度なメールフィッシング攻撃から防御するための追加のセキュリティレイヤーを提供します。

顔認識テクノロジー：

Computer visionは、人物の顔の特徴を分析して身元を確認するソフトウェアを強化します。顔認識ソフトウェアの使用事例は急速に拡大していますが、一般的な例としては、空港や国境などのセキュリティチェックポイント、犯罪容疑者の識別、スマートフォンのログインなどがあります。

信号機と歩行者の検出：

信号機の検出は、交通の流れを最適化するために使われます。このテクノロジーはデジタルセンサーを利用して、交通上の重要な瞬間（信号が変わるのを待っている車、近くに緊急車両が来ているとき、さらには赤信号を無視している車など）を認識します。同様に、歩行者の検出は、横断歩道や道路のさまざまな地点で歩行者を識別するために使われます。

医用画像（X線、CTスキャンなど）：

放射線科医やその他の医療専門家は、医用画像をより正確に解釈するためにComputer Visionを利用しています。AIモデルは、人間の目では簡単に検出できない異常を明らかにするのに役立ち、診断の精度と予後までも大幅に改善します。

2019年、サイバーセキュリティのコミュニティは、セキュリティ脅威の検出を支援するために、Computer visionテクノロジーに目を向けました。研究者は、マシンラーニングを使って、マルウェアと関連のある画像を基にマルウェアを検出するプログラムを作成しました。時間の経過とともに、このAIテクノロジーは進化を遂げ、フィッシングWebサイトやメールなどの検出にも利用されるようになりました。

高度な話をすると、Computer visionは、二次元の視覚化を活用して検出可能なパターンを識別することにより、サイバーセキュリティの脅威を特定します。二次元の視覚化により、ソフトウェアは悪意のあるパターンや安全なパターンを検出します。悪意のあるファイルには、ASCII文字や、より鮮明な画像が組み込まれている傾向があります。

従来、悪意のあるWebサイトから保護するには、疑わしいドメインをブラックリストに登録しなければなりませんでした。Computer visionは、フィッシングメールで送信された画像からマルウェアを検出することでサイバーセキュリティを強化します。これにより、受信者がドメインをクリックして攻撃を受ける危険が高まる前に、保護レイヤーが追加されます。

メールセキュリティのフィルタは、Computer visionテクノロジーを活かして、メール内で見つかった画像を継続的にスキャンし、悪意のあるコンテンツを識別します。サイバー犯罪者は次の3つの主要なテクノロジーを使います。

画像操作：

この戦術では、わずかに変更された画像を使って、フィンガープリントテクノロジーを備えたメールセキュリティソリューションをすり抜けます。

テキストベースの画像：

この高度なフィッシング手法は、OCR（光学文字認識）で抽出しなければならないテキストが組み込まれた画像を使ってセキュリティ分析をすり抜けます。

リモートでホストされている画像：

リモート画像、つまりオンラインの他の場所でホストされている画像は、GitHubなどの評価の高いサイトにホストされていることが多いため、メールセキュリティを回避しやすくなり、マルウェアの検出がより困難になります。

Computer visionとは何か？