Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Resumo de um modelo de Microsoft R Machine Learning.
Utilização
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentos
object
Um objeto de modelo retornado de uma análise MicrosoftML .
top
Especifica a contagem de coeficientes superiores a serem mostrados no resumo para modelos lineares como rxLogisticRegression e rxFastLinear. O viés aparece primeiro, seguido por outros pesos, ordenados por seus valores absolutos em ordem decrescente. Se definido como NULL, todos os coeficientes diferentes de zero são mostrados. Caso contrário, apenas os primeiros top coeficientes são mostrados.
...
Argumentos adicionais a serem passados para o método de resumo.
Detalhes
Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.
Valor
O summary método dos objetos de análise MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O coef método retorna um vetor nomeado de pesos, processando informações do objeto de modelo.
Para rxLogisticRegression, as estatísticas a seguir também podem ser apresentadas no resumo quando showTrainingStats definido como TRUE.
training.size
O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.
deviance
O desvio do modelo é dado por -2 * ln(L) onde L está a probabilidade de obter as observações com todas as características incorporadas no modelo.
null.deviance
O desvio nulo é dado por -2 * ln(L0) onde L0 está a probabilidade de obter as observações sem efeito das características. O modelo nulo inclui o viés se houver um no modelo.
aic
O AIC (Akaike Information Criterion) é definido como 2 * k ``+ deviance, onde k é o número de coeficientes do modelo. O viés conta como um dos coeficientes. O CIA é uma medida da qualidade relativa do modelo. Trata do trade-off entre a bondade do ajuste do modelo (medida pelo desvio) e a complexidade do modelo (medida pelo número de coeficientes).
coefficients.stats
Este é um quadro de dados que contém as estatísticas para cada coeficiente no modelo. Para cada coeficiente, são apresentadas as seguintes estatísticas. O viés aparece na primeira linha, e os coeficientes restantes na ordem crescente do valor p.
- EstimativaO valor estimado do coeficiente do modelo.
- Std ErrorEsta é a raiz quadrada da variância de amostra grande da estimativa do coeficiente.
- z-ScorePodemos testar contra a hipótese nula, que afirma que o coeficiente deve ser zero, no que diz respeito à significância do coeficiente calculando a razão entre sua estimativa e seu erro padrão. Na hipótese nula, se não houver regularização aplicada, a estimativa do coeficiente referente segue uma distribuição normal com média 0 e desvio padrão igual ao erro padrão computado acima. O z-score produz a razão entre a estimativa de um coeficiente e o erro padrão do coeficiente.
- Pr(>|z|) Este é o valor p correspondente para o teste de dois lados do z-score. Com base no nível de significância, um indicador de significância é anexado ao valor p. Se
F(x)é o CDF da distribuiçãoN(0, 1)normal padrão , entãoP(>|z|) = 2 - ``2 * F(|z|).
Autor(es)
Corporação Microsoft Microsoft Technical Support
Ver também
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Exemplos
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]