Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a: SQL Server 2016 (13.x) e versões posteriores
Nesta série de tutoriais em várias partes, é apresentado a uma variedade de funções do RevoScaleR para tarefas associadas à ciência de dados. No processo, aprenderás a criar um contexto de computação remota, mover dados entre contextos locais e remotos e executar código R num SQL Server remoto. Também vais aprender a analisar e plotar dados tanto localmente como no servidor remoto, e a criar e implementar modelos.
O RevoScaleR é um pacote Microsoft R que fornece processamento distribuído e paralelo para cargas de trabalho de ciência de dados e aprendizagem automática. Para o desenvolvimento de R no SQL Server, o RevoScaleR é um dos pacotes integrados principais, com funções para criar objetos fonte de dados, definir um contexto de computação, gerir pacotes e, mais importante ainda: trabalhar com dados de ponta a ponta, desde a importação até à visualização e análise. Os algoritmos de Aprendizagem Automática no SQL Server dependem das fontes de dados do RevoScaleR . Dada a importância do RevoScaleR, saber quando e como chamar as suas funções é uma competência essencial.
Pré-requisitos
Serviços de Aprendizagem Automática do SQL Server com a funcionalidade R, ou Serviços R do SQL Server (na base de dados)
Permissões de base de dados e um login de utilizador numa base de dados SQL Server
SQL Server Management Studio (Estúdio de Gestão do Servidor SQL)
Um IDE como o RStudio ou a ferramenta RGUI incorporada incluída no R
Para alternar entre contextos de computação local e remoto, precisas de dois sistemas. Local é tipicamente uma estação de trabalho de desenvolvimento com potência suficiente para cargas de trabalho em ciência de dados. O remoto, neste caso, é o SQL Server com a funcionalidade R ativada.
A troca de contexto de computação baseia-se em ter o RevoScaleR da mesma versão tanto em sistemas locais como remotos. Numa estação de trabalho local, pode obter os pacotes RevoScaleR e fornecedores relacionados instalando o Microsoft R Client.
Se precisares de colocar cliente e servidor no mesmo computador, certifica-te de instalar um segundo conjunto de bibliotecas Microsoft R para enviar scripts R a partir de um cliente "remoto". Não utilize as bibliotecas R que estão instaladas nos ficheiros de programa da instância do SQL Server. Especificamente, se estiver a usar um computador, precisa da biblioteca RevoScaleR em ambos os locais para suportar operações de cliente e servidor.
- C:\Program Files\Microsoft\R Client\R_SERVER\library\RevoScaleR
- C:\Program Files\Microsoft SQL Server\MSSQL14. MSSQLSERVER\R_SERVICES\library\RevoScaleR
Para instruções sobre a configuração do cliente, consulte Configurar um cliente de ciência de dados para desenvolvimento em R.
Ferramentas de desenvolvimento R
Os programadores R normalmente usam IDEs para escrever e depurar código R. Eis algumas sugestões:
R Tools for Visual Studio (RTVS) é um plug-in gratuito que fornece Intellisense, depuração e suporte para Microsoft R. Podes usá-lo com os Serviços de Aprendizagem Automática do SQL Server. Para descarregar, consulte R Tools para Visual Studio.
O RStudio é um dos ambientes mais populares para desenvolvimento R. Para obter mais informações, consulte https://www.rstudio.com/products/RStudio/.
As ferramentas básicas de R (R.exe, RTerm.exe, RScripts.exe) também são instaladas por defeito quando instalas o R no SQL Server ou no R Client. Se não desejar instalar um IDE, pode usar as ferramentas R integradas para executar o código deste tutorial.
Lembre-se que o RevoScaleR é obrigatório tanto em computadores locais como remotos. Não pode completar este tutorial usando uma instalação genérica do RStudio ou outro ambiente que não tenha as bibliotecas Microsoft R. Para mais informações, consulte Configurar um Cliente de Ciência de Dados.
Resumo das tarefas
- Os dados são inicialmente obtidos a partir de ficheiros CSV ou XDF. Importa os dados para o SQL Server usando as funções do pacote RevoScaleR .
- O treino e a pontuação do modelo são realizados usando o contexto de computação do SQL Server.
- Use as funções do RevoScaleR para criar novas tabelas SQL Server e guardar os seus resultados de pontuação.
- Cria gráficos tanto no servidor como no contexto de computação local.
- Treine um modelo em dados na base de dados SQL Server, executando R na instância SQL Server.
- Extrai um subconjunto de dados e guarda-o como ficheiro XDF para reutilização em análise na tua estação de trabalho local.
- Obtenha novos dados para pontuação, abrindo uma ligação ODBC à base de dados SQL Server. A pontuação é feita na estação de trabalho local.
- Crie uma função R personalizada e execute-a no contexto de computação do servidor para realizar uma simulação.