概要

注

詳細については、「 テキストと画像 」タブを参照してください。

コンピュータービジョンは、画像内の数値ピクセル値の分析と操作に基づいて構築されています。機械学習モデルは、大量の画像を使用してトレーニングされ、画像分類、物体検出、セマンティックセグメント化、キャプション生成などの一般的なコンピュータービジョンシナリオを可能にします。

コンピュータービジョンタスクに使用されるモデルは、統計ベースの画像分類子から畳み込みニューラルネットワークを通じて、今日のトランスフォーマーベースのマルチモーダルモデルへと進化してきました。最先端のモデルでは、視覚的 な入力を解釈するだけでなく、視覚的 な出力も生成できます。

ヒント

詳細については、「 Azure Vision とは」を参照してください。

フィードバック

このページはお役に立ちましたか?