Partilhar via


O que são Machine Learning Server ou R Server autônomos no SQL Server?

Aplica-se a: SQL Server 2016 (13.x) e versões posteriores

Importante

O suporte para o Machine Learning Server (anteriormente conhecido como R Server) terminou em 1º de julho de 2022. Para obter mais informações, consulte O que está acontecendo com o Servidor de Aprendizado de Máquina?

O SQL Server fornece suporte de instalação para um Servidor R autônomo ou Servidor de Aprendizado de Máquina que é executado independentemente do SQL Server. Dependendo da sua versão do SQL Server, um servidor autônomo tem uma base de R de código aberto e, possivelmente, Python, sobreposta com bibliotecas de alto desempenho da Microsoft que adicionam análises estatísticas e preditivas em escala. As bibliotecas também permitem tarefas de aprendizado de máquina com script em R ou Python.

No SQL Server 2016, esta funcionalidade é denominada R Server (autónomo) e é apenas R. No SQL Server 2017, ele é chamado de Servidor de Aprendizado de Máquina (Autônomo) e inclui R e Python.

Observação

Conforme instalado pela Instalação do SQL Server, um servidor autônomo é funcionalmente equivalente às versões sem marca SQL do Microsoft Machine Learning Server, suportando os mesmos cenários de usuário, incluindo execução remota, operacionalização e serviços Web, e a coleção completa de bibliotecas R e Python.

Componentes

O SQL Server 2016 é apenas R. O SQL Server 2017 oferece suporte a R e Python. A tabela a seguir descreve os recursos em cada versão.

Componente Descrição
Pacotes R RevoScaleR é a biblioteca primária para R escalável com funções para manipulação, transformação, visualização e análise de dados.
O MicrosoftML adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimento.
sqlRUtils fornece funções auxiliares para colocar scripts R em um procedimento armazenado T-SQL, registrar um procedimento armazenado com um banco de dados e executar o procedimento armazenado a partir de um ambiente de desenvolvimento R.
olapR é para especificar consultas MDX em R.
Microsoft R Aberto (MRO) Microsoft R Open (aposentado) foi a distribuição de código aberto da Microsoft de R.
Ferramentas R As janelas do console R e os prompts de comando são ferramentas padrão em uma distribuição R. Encontre-os em \Arquivos de programas\Microsoft SQL Server\140\R_SERVER\bin\x64.
R Exemplos e scripts Os pacotes R e RevoScaleR de código aberto incluem conjuntos de dados internos para que você possa criar e executar scripts usando dados pré-instalados. Procure-os em \Arquivos de programas\Microsoft SQL Server\140\R_SERVER\library\datasets e \library\RevoScaleR.
Pacotes de Python revoscalepy é a principal biblioteca para Python escalável com funções para manipulação, transformação, visualização e análise de dados.
O MicrosoftML adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimento.
Ferramentas Python A ferramenta de linha de comando Python integrada é útil para testes e tarefas ad hoc. Encontre a ferramenta em \Program files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe.
Anaconda Anaconda é uma distribuição open-source de Python e pacotes essenciais.
Exemplos e scripts Python Tal como acontece com o R, o Python inclui conjuntos de dados e scripts incorporados. Encontre os dados revoscalepy em \Program files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data.
Modelos pré-treinados em R e Python Os modelos pré-treinados são criados para casos de uso específicos e mantidos pela equipe de engenharia de ciência de dados da Microsoft. Você pode usar os modelos pré-treinados as-is para pontuar sentimentos positivos-negativos em texto ou detetar recursos em imagens, usando novas entradas de dados que você fornece. Modelos pré-treinados são suportados e utilizáveis em um servidor autônomo, mas você não pode instalá-los por meio da Instalação do SQL Server. Para obter mais informações, consulte Instalar modelos de aprendizado de máquina pré-treinados no SQL Server.

Usando um servidor autônomo

Os desenvolvedores de R e Python normalmente escolhem um servidor autônomo para ir além das restrições de memória e processamento de R e Python de código aberto. As bibliotecas R e Python executadas em um servidor autônomo podem carregar e processar grandes quantidades de dados em vários núcleos e agregar os resultados em uma única saída consolidada. As funções de alto desempenho são projetadas para escala e utilidade: fornecendo análise preditiva, modelagem estatística, visualizações de dados e algoritmos de aprendizado de máquina de ponta em um produto de servidor comercial projetado e suportado pela Microsoft.

Como um servidor independente dissociado do SQL Server, o ambiente R e Python é configurado, protegido e acessado usando o sistema operacional subjacente e as ferramentas padrão fornecidas no servidor autônomo, não o SQL Server. Não há suporte interno para dados relacionais do SQL Server. Se quiser usar dados do SQL Server, você pode criar objetos e conexões de fonte de dados como faria a partir de qualquer cliente.

Como um complemento do SQL Server, um servidor autônomo também é útil como um poderoso ambiente de desenvolvimento se você precisar de computação local e remota. Os pacotes R e Python em um servidor autônomo são os mesmos fornecidos com uma instalação do mecanismo de banco de dados, permitindo a portabilidade do código e a comutação do contexto de computação.

Como começar

Comece com a configuração, anexe os binários à sua ferramenta de desenvolvimento favorita e escreva seu primeiro script.

Passo 1: Instale o software

Instale uma destas versões:

Etapa 2: Configurar uma ferramenta de desenvolvimento

Em um servidor autônomo, é comum trabalhar localmente usando um desenvolvimento instalado no mesmo computador.

Passo 3: Escreva o seu primeiro script

Escreva script R ou Python usando funções de RevoScaleR, revoscalepy e os algoritmos de aprendizado de máquina.

Escolha o melhor idioma para a tarefa. R é melhor para cálculos estatísticos que são difíceis de implementar usando SQL. Para operações baseadas em conjunto sobre dados, use o poder do SQL Server para obter o máximo desempenho. Use o mecanismo de banco de dados na memória para cálculos muito rápidos em colunas.

Passo 4: Operacionalizar a sua solução

Servidores autónomos podem usar a funcionalidade de operacionalização do Microsoft Machine Learning Server, que não tem a marca SQL. Você pode configurar um servidor autônomo para operacionalização, o que lhe dá estes benefícios: implantar e hospedar seu código como serviços Web, executar diagnósticos, testar a capacidade do serviço Web.

Etapa 5: Manter o servidor

O SQL Server lança atualizações cumulativas regularmente. A aplicação das atualizações cumulativas adiciona aprimoramentos funcionais e de segurança a uma instalação existente.

Descrições de funcionalidades novas ou alteradas podem ser encontradas no artigo Downloads do CAB e nos artigos da versão de compilação do SQL Server 2016, SQL Server 2017 e SQL Server 2019.

Para obter mais informações sobre como aplicar atualizações a uma instância existente, consulte Aplicar atualizações nas instruções de instalação.