概要

完了

詳細については、「 テキストと画像 」タブを参照してください。

コンピューター ビジョンは、画像内の数値ピクセル値の分析と操作に基づいて構築されています。 機械学習モデルは、大量の画像を使用してトレーニングされ、画像分類、物体検出、セマンティック セグメント化、キャプション生成などの一般的なコンピューター ビジョン シナリオを可能にします。

コンピューター ビジョン タスクに使用されるモデルは、統計ベースの画像分類子から畳み込みニューラル ネットワークを通じて、今日のトランスフォーマーベースのマルチモーダル モデルへと進化してきました。 最先端のモデルでは、視覚的 な入力を解釈するだけでなく、視覚的 な出力も生成できます。

ヒント

詳細については、「 Azure Vision とは」を参照してください。