Modelos de machine learning
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
Como o aprendizado de máquina é baseado em matemática e estatísticas, é comum pensar em modelos de machine learning em termos matemáticos. Fundamentalmente, um modelo de machine learning é um aplicativo de software que encapsula uma função para calcular um valor de saída com base em um ou mais valores de entrada. O processo de definição dessa função é conhecido como treinamento. Depois que a função tiver sido definida, você poderá usá-la para prever novos valores em um processo chamado inferência.
Vamos explorar as etapas envolvidas no treinamento e inferência.
Os dados de treinamento consistem em observações passadas. Na maioria dos casos, as observações incluem os atributos ou recursos observados da coisa que está sendo observada e o valor conhecido da coisa que você deseja treinar um modelo para prever (conhecido como rótulo).
Em termos matemáticos, você verá frequentemente as características referidas pelo nome abreviado da variável x e a etiqueta referida como y. Normalmente, uma observação consiste em vários valores de recurso, portanto , x é na verdade um vetor (uma matriz com vários valores), assim: [x1,x2,x3,...].
Para deixar isso mais claro, vamos considerar os exemplos descritos anteriormente:
- No cenário de vendas de sorvetes, nossa meta é treinar um modelo que possa prever o número de vendas de sorvetes com base no clima. As medidas meteorológicas para o dia (temperatura, chuvas, ventos e assim por diante) seriam as características (x), e o número de sorvetes vendidos em cada dia seria o rótulo (y).
- No cenário médico, a meta é prever se um paciente está ou não em risco de diabetes com base em suas medidas clínicas. As medidas do paciente (peso, nível de glicose no sangue e assim por diante) são as características (x) e a probabilidade de diabetes (por exemplo, 1 para em risco, 0 para não em risco) é o rótulo (y).
- No cenário de pesquisa antártica, queremos prever a espécie de um pinguim com base em seus atributos físicos. As principais medidas relativas ao pinguim (comprimento de suas nadadeiras, largura de seu bico e assim por diante) são as características (x) e a espécie (por exemplo, 0 para Adelie, 1 para Gentoo ou 2 para Chinstrap) é o rótulo (y).
Um algoritmo é aplicado aos dados para tentar determinar uma relação entre os recursos e o rótulo e generalizar essa relação como um cálculo que pode ser executado em x para calcular y. O algoritmo específico usado depende do tipo de problema preditivo que você está tentando resolver (mais sobre isso posteriormente), mas o princípio básico é tentar ajustar os dados a uma função na qual os valores dos recursos podem ser usados para calcular o rótulo.
O resultado do algoritmo é um modelo que encapsula o cálculo derivado pelo algoritmo como uma função - vamos chamá-lo de f. Em notação matemática:
y = f(x)
Agora que a fase de treinamento está concluída, o modelo treinado pode ser usado para inferência. O modelo é essencialmente um programa de software que encapsula a função produzida pelo processo de treinamento. Você pode inserir um conjunto de valores de características e receber uma previsão do rótulo correspondente como saída. Como a saída do modelo é uma previsão calculada pela função e não um valor observado, muitas vezes você verá a saída da função mostrada como ŷ (que é curiosamente verbalizada como "y-hat").