Exercício – Executar a regressão linear com o Scikit-learn

Concluído

Outra biblioteca popular do Python que é amplamente usada na comunidade de pesquisa é o scikit-learn, que se destaca na criação de modelos de machine learning para ajudar a extrair informações de dados. Neste exercício, você usará o Scikit-learn (que já foi importado na Unidade 2 para calcular uma linha de tendência para os dados de clima da NASA).

  1. Coloque o cursor na célula vazia na parte inferior do notebook. Altere o tipo de célula para Markdown e digite "Executar regressão linear com scikit-learn" como o texto.

  2. Adicione uma célula Code e cole o código a seguir.

    # Pick the Linear Regression model and instantiate it
    model = LinearRegression(fit_intercept=True)
    
    # Fit/build the model
    model.fit(yearsBase[:, np.newaxis], meanBase)
    mean_predicted = model.predict(yearsBase[:, np.newaxis])
    
    # Generate a plot like the one in the previous exercise
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, mean_predicted)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
    
  3. Agora, execute a célula para exibir um gráfico de dispersão com uma linha de regressão.

    Gráfico de dispersão com linha de regressão computada pelo sckikit-learn.

    Gráfico de dispersão com linha de regressão computada por sckikit-learn

A saída é quase idêntica à saída do exercício anterior. A diferença é que o Scikit-learn fez a maior parte do trabalho para você. Especificamente, você não precisou codificar uma função de linha como fez com o NumPy; a função LinearRegression do Scikit-learn fez isso para você. O scikit-learn dá suporte a muitos tipos diferentes de regressão, o que é útil ao criar modelos sofisticados de machine learning.