イントロダクション
コンピューター ビジョン は人工知能 (AI) の中核となる領域の 1 つであり、AI アプリケーションが世界を "見る" ことを可能にし、それを理解できるようにするソリューションの作成に重点を置いています。
次のシナリオを考えてみます。
- 病院は手術中に手術器具をリアルタイムで検出して追跡したいと考えています。
- 小売企業は、靴、シャツ、エレクトロニクスなどの製品を画像のカテゴリに分類する必要があります。
- 野生動物保護団体は、ビデオ映像を通って歩く動物を特定する必要があります。
- 市の交通部門は、ライセンス プレートの画像からテキストを読み取って抽出する必要があります。
- ある製造会社は、欠陥の視覚的パターンを分析したいと考えています。
もちろん、コンピューターには、私たちのように動作する生物学的な目はありませんが、画像を処理することができます。ライブカメラフィードから、またはデジタル写真やビデオから。 画像を処理するこの機能は、人間の視覚認識をエミュレートできるソフトウェアを作成するための鍵です。 このモジュールでは、最新のコンピューター ビジョン ソリューションの基礎となる構成要素について説明します。