Modelos de machine learning

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Como o aprendizado de máquina é baseado em matemática e estatísticas, é comum pensar em modelos de machine learning em termos matemáticos. Fundamentalmente, um modelo de machine learning é um aplicativo de software que encapsula uma função para calcular um valor de saída com base em um ou mais valores de entrada. O processo de definição dessa função é conhecido como treinamento. Depois que a função tiver sido definida, você poderá usá-la para prever novos valores em um processo chamado inferência.

Vamos explorar as etapas envolvidas no treinamento e inferência.

Diagrama mostrando as fases de treinamento e inferência no aprendizado de máquina.

  1. Os dados de treinamento consistem em observações passadas. Na maioria dos casos, as observações incluem os atributos ou recursos observados da coisa que está sendo observada e o valor conhecido da coisa que você deseja treinar um modelo para prever (conhecido como rótulo).

    Em termos matemáticos, você verá frequentemente as características referidas pelo nome abreviado da variável x e a etiqueta referida como y. Normalmente, uma observação consiste em vários valores de recurso, portanto , x é na verdade um vetor (uma matriz com vários valores), assim: [x1,x2,x3,...].

    Para deixar isso mais claro, vamos considerar os exemplos descritos anteriormente:

    • No cenário de vendas de sorvetes, nossa meta é treinar um modelo que possa prever o número de vendas de sorvetes com base no clima. As medidas meteorológicas para o dia (temperatura, chuvas, ventos e assim por diante) seriam as características (x), e o número de sorvetes vendidos em cada dia seria o rótulo (y).
    • No cenário médico, a meta é prever se um paciente está ou não em risco de diabetes com base em suas medidas clínicas. As medidas do paciente (peso, nível de glicose no sangue e assim por diante) são as características (x) e a probabilidade de diabetes (por exemplo, 1 para em risco, 0 para não em risco) é o rótulo (y).
    • No cenário de pesquisa antártica, queremos prever a espécie de um pinguim com base em seus atributos físicos. As principais medidas relativas ao pinguim (comprimento de suas nadadeiras, largura de seu bico e assim por diante) são as características (x) e a espécie (por exemplo, 0 para Adelie, 1 para Gentoo ou 2 para Chinstrap) é o rótulo (y).
  2. Um algoritmo é aplicado aos dados para tentar determinar uma relação entre os recursos e o rótulo e generalizar essa relação como um cálculo que pode ser executado em x para calcular y. O algoritmo específico usado depende do tipo de problema preditivo que você está tentando resolver (mais sobre isso posteriormente), mas o princípio básico é tentar ajustar os dados a uma função na qual os valores dos recursos podem ser usados para calcular o rótulo.

  3. O resultado do algoritmo é um modelo que encapsula o cálculo derivado pelo algoritmo como uma função - vamos chamá-lo de f. Em notação matemática:

    y = f(x)

  4. Agora que a fase de treinamento está concluída, o modelo treinado pode ser usado para inferência. O modelo é essencialmente um programa de software que encapsula a função produzida pelo processo de treinamento. Você pode inserir um conjunto de valores de características e receber uma previsão do rótulo correspondente como saída. Como a saída do modelo é uma previsão calculada pela função e não um valor observado, muitas vezes você verá a saída da função mostrada como ŷ (que é curiosamente verbalizada como "y-hat").