Computer visionとは何か?
Computer visionとは何か?
Computer visionは、人工知能(AI)を活かして視覚データ(画像)を理解するコンピュータサイエンスの分野です。AIがデータ入力を分析したり解釈したりすることによって「考える」ために使用されるならば、Computer visionは視覚入力を分析したり解釈したりすることによって「見る」ために使用されます。
Computer visionで使われる視覚データには、画像、ビデオ、アイコンなどのピクセルで構成されるあらゆるものが含まれており、人間と同じように画像を解釈できることを目的としています。このテクノロジーは急速に拡大していますが、主なComputer visionのタスクは次の3つです。
- オブジェクトの分類:
- オブジェクトのローカリゼーション:
- オブジェクトの検出:
Computer visionの仕組み
Computer visionはパターン認識に基づいて機能します。アルゴリズムを使って膨大な量の視覚データをスキャンし、それを理解します。
Computer visionのトレーニングでは、コンピュータを大量の視覚データにさらして、主要な機能とパターンを区別することを学習させます。たとえば、ボートを識別するようにコンピュータに教える場合、データサイエンティストは、ボートの画像と関連するオブジェクトをコンピュータに入力しなければなりません。時間が経過するにつれて、コンピュータは、ボートであるかどうかを判別し、ボートの主要な機能を区別できるようになります。
コンピュータが、画像が何であるかを正確に識別できるようになると、さまざまなアプリケーションのために画像をセグメント化し、検出し、分類できるようになります。AIが進歩したことで、Computer visionテクノロジーは、画像認識において人間の識別能力と同じくらい優れた能力を発揮するようになりました(人間の認識能力よりも優れている場合も多々あります)。
Computer visionの例
Computer Visionにはさまざまなユースケースがありますが、テクノロジーが利用しやすくなるにつれて、それは急速に拡大しています。今日のComputer Visionテクノロジーの最も一般的な例として、次のようなものが挙げられます。
メールセキュリティ:
顔認識テクノロジー:
Computer visionは、人物の顔の特徴を分析して身元を確認するソフトウェアを強化します。顔認識ソフトウェアの使用事例は急速に拡大していますが、一般的な例としては、空港や国境などのセキュリティチェックポイント、犯罪容疑者の識別、スマートフォンのログインなどがあります。
信号機と歩行者の検出:
医用画像(X線、CTスキャンなど):
放射線科医やその他の医療専門家は、医用画像をより正確に解釈するためにComputer Visionを利用しています。AIモデルは、人間の目では簡単に検出できない異常を明らかにするのに役立ち、診断の精度と予後までも大幅に改善します。
サイバーセキュリティにおけるcomputer vision
2019年、サイバーセキュリティのコミュニティは、セキュリティ脅威の検出を支援するために、Computer visionテクノロジーに目を向けました。研究者は、マシンラーニングを使って、マルウェアと関連のある画像を基にマルウェアを検出するプログラムを作成しました。時間の経過とともに、このAIテクノロジーは進化を遂げ、フィッシングWebサイトやメールなどの検出にも利用されるようになりました。
高度な話をすると、Computer visionは、二次元の視覚化を活用して検出可能なパターンを識別することにより、サイバーセキュリティの脅威を特定します。二次元の視覚化により、ソフトウェアは悪意のあるパターンや安全なパターンを検出します。悪意のあるファイルには、ASCII文字や、より鮮明な画像が組み込まれている傾向があります。
従来、悪意のあるWebサイトから保護するには、疑わしいドメインをブラックリストに登録しなければなりませんでした。Computer visionは、フィッシングメールで送信された画像からマルウェアを検出することでサイバー セキュリティを強化します。これにより、受信者がドメインをクリックして攻撃を受ける危険が高まる前に、保護レイヤーが追加されます。
Computer visionがメールセキュリティを強化する仕組み
メールセキュリティのフィルタは、Computer visionテクノロジーを活かして、メール内で見つかった画像を継続的にスキャンし、悪意のあるコンテンツを識別します。サイバー犯罪者は次の3つの主要なテクノロジーを使います。
- 画像操作:
この戦術では、わずかに変更された画像を使って、フィンガープリントテクノロジーを備えたメールセキュリティソリューションをすり抜けます。
- テキストベースの画像:
この高度なフィッシング手法は、OCR(光学文字認識)で抽出しなければならないテキストが組み込まれた画像を使ってセキュリティ分析をすり抜けます。
- リモートでホストされている画像: