Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Observação
O suporte para esta versão do Databricks Runtime foi encerrado. Para obter a data de fim do suporte, consulte o Histórico de fim do suporte. Para todas as versões suportadas do Databricks Runtime, consulte Notas de versão do Databricks Runtime: versões e compatibilidade.
O Databricks Runtime 11.3 LTS para Machine Learning fornece um ambiente pronto para uso para aprendizado de máquina e ciência de dados com base no Databricks Runtime 11.3 LTS (EoS). O Databricks Runtime ML contém muitas bibliotecas de machine learning populares, incluindo o TensorFlow, o PyTorch e o XGBoost. O Databricks Runtime ML inclui o AutoML, uma ferramenta para treinamento automático de pipelines de aprendizado de máquina. O Databricks Runtime ML também dá suporte ao treinamento de aprendizado profundo distribuído usando o Horovod.
Observação
LTS significa que essa versão possui suporte de longo prazo. Confira Ciclo de vida da versão de LTS do Databricks Runtime.
Para obter mais informações, incluindo instruções para criar um cluster de ML do Databricks Runtime, confira IA e Machine Learning no Databricks.
Novos recursos e melhorias
O Databricks Runtime 11.3 LTS ML é criado com base no Databricks Runtime 11.3 LTS. Para obter informações sobre as novidades no Databricks Runtime 11.3 LTS, incluindo Apache Spark MLlib e SparkR, consulte as notas de versão do Databricks Runtime 11.3 LTS (EoS ).
Aprimoramentos no AutoML
O AutoML agora dá suporte ao uso de tabelas de recursos existentes do Repositório de Recursos em seus experimentos do AutoML. Para obter detalhes, consulte a integração do Repositório de Recursos do AutoML.
Os notebooks de avaliação gerados pelo AutoML agora contêm snippets de código que permitem que os usuários executem novamente o ajuste do hiperparâmetro.
O AutoML agora dá suporte a DecimalType recursos.
Correções
O Databricks Runtime 11.3 LTS ML inclui uma versão atualizada de sparkdl.xgboost. As versões sparkdl.xgboost anteriores contêm bugs corrigidos nesta versão, portanto, o Databricks recomenda que os usuários da biblioteca atualizem para o Databricks Runtime 11.3 LTS ML.
Preparar para versões futuras
Uma versão futura do Databricks Runtime ML incluirá sklearn a versão 1.0. Visite a sklearndocumentação para obter informações sobre como se preparar para essa alteração.
O Databricks Runtime ML contém dois openblas pacotes. O /opt/OpenBLAS pacote foi preterido no Databricks Runtime 11.3 LTS ML e será removido em uma versão futura.
Ambiente do sistema
O ambiente do sistema no Databricks Runtime 11.3 LTS ML difere do Databricks Runtime 11.3 LTS da seguinte maneira:
-
DBUtils: O Databricks Runtime ML não inclui Utilitário de biblioteca (dbutils.library) (herdado).
Em vez disso, utilize os comandos
%pip. Veja Bibliotecas do Python no escopo do notebook. - Para clusters de GPU, o Databricks Runtime ML inclui as seguintes bibliotecas de GPU NVIDIA:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
O Databricks Runtime 11.3 LTS ML inclui o XGBoost 1.6.1, que não dá suporte a clusters de GPU com capacidade de computação 5.2 e inferior.
Libraries
As seções a seguir listam as bibliotecas incluídas no Databricks Runtime 11.3 LTS ML que diferem daquelas incluídas no Databricks Runtime 11.3 LTS.
Nesta seção:
- Bibliotecas de camada superior
- Bibliotecas do Python
- Bibliotecas do R
- Bibliotecas Java e Scala (cluster Scala 2.12)
Bibliotecas de camada superior
O Databricks Runtime 11.3 LTS ML inclui as seguintes bibliotecas de camada superior:
- GraphFrames
- Horovod e HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Bibliotecas do Python
O Databricks Runtime 11.3 LTS ML usa o Virtualenv para gerenciamento de pacotes python e inclui muitos pacotes ML populares.
Além dos pacotes especificados nas seções a seguir, o Databricks Runtime 11.3 LTS ML também inclui os seguintes pacotes:
- hyperopt 0.2.7.db1
- sparkdl 2.3.0-db3
- feature_store 0.7.0
- automl 1.13.2
Para reproduzir o ambiente do Databricks Runtime ML Python em seu ambiente virtual do Python local, baixe o arquivo requirements-11.3.txt e execute pip install -r requirements-11.3.txt. Esse comando instala todas as bibliotecas código aberto que o Databricks Runtime ML usa, mas não instala bibliotecas desenvolvidas pelo Databricks, como databricks-automl, databricks-feature-store, ou o fork do Databricks de hyperopt.
Bibliotecas do Python em clusters de CPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | argon2-cffi | 20.1.0 | Astor | 0.8.1 |
| astunparse | 1.6.3 | gerador assíncrono | 1.10 | atributos | 21.2.0 |
| azure-core | 1.22.1 | azure-cosmos | 4.2.0 | chamada de retorno | 0.2.0 |
| backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | preto | 22.3.0 |
| bleach | 4.0.0 | felicidade | 0.7.8 | boto3 | 1.21.18 |
| botocore | 1.24.18 | ferramentas de cache | 5.2.0 | catálogo | 2.0.8 |
| certificado | 2021.10.8 | cffi | 1.14.6 | chardet | 4.0.0 |
| normalizador de conjunto de caracteres | 2.0.4 | click | 8.0.3 | cloudpickle | 2.0.0 |
| cmdstanpy | 0.9.68 | confecção | 0.0.1 | configparser | 5.2.0 |
| convertdate | 2.4.0 | criptografia | 3.4.8 | ciclista | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
| databricks-cli | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | decorador | 5.1.0 | defusedxml | 0.7.1 |
| endro | 0.3.4 | cache de disco | 5.4.0 | distlib | 0.3.6 |
| pontos de entrada | 0,3 | efêm | 4.1.3 | Visão geral de facetas | 1.0.0 |
| fasttext | 0.9.2 | bloqueio de arquivo | 3.3.1 | Flask | 1.1.2 |
| flatbuffers | 1.12 | fsspec | 2021.8.1 | futuro | 0.18.2 |
| gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
| google-auth (autenticação do Google) | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
| grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
| h5py | 3.3.0 | hijri-converter | 2.2.4 | Férias | 0.15 |
| horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
| IDNA | 3.2 | ImageHash | 4.3.0 | desequilibrado-learn | 0.8.1 |
| importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
| ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
| itsdangerous | 2.0.1 | Jedi | 0.18.0 | Jinja2 | 2.11.3 |
| jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
| jsonschema | 3.2.0 | Cliente Jupyter | 6.1.12 | jupyter-core | 4.8.1 |
| jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 | keras | 2.9.0 |
| Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 | calendário lunar coreano | 0.3.1 |
| códigos de idioma | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
| llvmlite | 0.37.0 | Calendário Lunar | 0.0.9 | Mako | 1.2.0 |
| Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
| matplotlib-inline | 0.1.2 | missingno | 0.5.1 | Mistune | 0.8.4 |
| mleap | 0.20.0 | mlflow-skinny | 1.29.0 | multimétodo | 1.9 |
| murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
| nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
| networkx | 2.6.3 | nltk | 3.6.5 | notebook | 6.4.5 |
| numba | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
| opt-einsum | 3.3.0 | empacotamento | 21,0 | Pandas | 1.3.4 |
| criação de perfil pandas | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
| parso | 0.8.2 | pathspec | 0.9.0 | patia | 0.6.2 |
| patsy | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
| phik | 0.12.2 | pickleshare | 0.7.5 | Almofada | 8.4.0 |
| pip | 21.2.4 | platformdirs | 2.5.2 | enredo | 5.9.0 |
| pmdarima | 1.8.5 | If the text refers to a technical term or specific term that may need localization, and a translation exists, that translation should be provided instead of remaining untranslated. | 3.0.7 | prometheus-client | 0.11.0 |
| prompt-toolkit | 3.0.20 | profeta | 1.0.1 | protobuf | 3.19.4 |
| psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
| Pyarrow | 7.0.0 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
| pybind11 | 2.10.0 | pycparser | 2,20 | pydantic | 1.9.2 |
| Pygments | 2.10.0 | PyGObject | 3.36.0 | PyJWT | 2.5.0 |
| PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
| pyparsing | 3.0.4 | pyrsistent | 0.18.0 | pystan | 2.19.1.1 |
| python-dateutil | 2.8.2 | editor de Python | 1.0.4 | Pytz | 2021.3 |
| PyWavelets | 1.1.1 | PyYAML | 6,0 | pyzmq | 22.2.1 |
| regex | 2021.8.3 | requests | 2.26.0 | requests-oauthlib | 1.3.1 |
| requests-unixsocket | 0.2.0 | rsa | 4.9 | s3transfer | 0.5.2 |
| scikit-aprender | 0.24.2 | scipy | 1.7.1 | seaborn (biblioteca de visualização em Python) | 0.11.3 |
| Send2Trash | 1.8.0 | Ferramentas de configuração | 58.0.4 | setuptools-git | 1,2 |
| shap | 0.41.0 | simplejson | 3.17.6 | seis | 1.16.0 |
| segmentação | 0.0.7 | smart-open | 5.2.1 | smmap | 5.0.0 |
| espaçoso | 3.4.1 | spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 |
| spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 | srsly | 2.4.4 |
| ssh-import-id | 5.10 | statsmodels (biblioteca para modelos estatísticos em Python) | 0.12.2 | tabulate | 0.8.9 |
| tangled-up-in-unicode | 0.1.0 | tenacidade | 8.0.1 | tensorboard | 2.9.1 |
| tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 |
| tensorflow-cpu | 2.9.1 | tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-filesystem | 0.27.0 |
| termcolor | 2.0.1 | terminado | 0.9.4 | caminho de teste | 0.5.0 |
| thinc | 8.1.2 | threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 |
| criadores de token | 0.12.1 | tomli | 2.0.1 | lanterna | 1.12.1+cpu |
| torchvision | 0.13.1+cpu | tornado | 6.1 | tqdm | 4.62.3 |
| traitlets | 5.1.0 | Transformadores | 4.21.2 | Typer | 0.4.2 |
| extensões de digitação | 3.10.0.2 | ujson | 4.0.2 | atualizações não supervisionadas | 0.1 |
| urllib3 | 1.26.7 | virtualenv | 20.8.0 | visões | 0.7.4 |
| wasabi | 0.10.1 | wcwidth | 0.2.5 | codificações web | 0.5.1 |
| websocket-client (cliente WebSocket) | 1.3.1 | Ferramentas | 2.0.2 | wheel | 0.37.0 |
| widgetsnbextension | 3.6.0 | embrulhado | 1.12.1 | xgboost | 1.6.2 |
| zipp | 3.6.0 |
Bibliotecas do Python em clusters de GPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | argon2-cffi | 20.1.0 | Astor | 0.8.1 |
| astunparse | 1.6.3 | gerador assíncrono | 1.10 | atributos | 21.2.0 |
| azure-core | 1.22.1 | azure-cosmos | 4.2.0 | chamada de retorno | 0.2.0 |
| backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | preto | 22.3.0 |
| bleach | 4.0.0 | felicidade | 0.7.8 | boto3 | 1.21.18 |
| botocore | 1.24.18 | ferramentas de cache | 5.2.0 | catálogo | 2.0.8 |
| certificado | 2021.10.8 | cffi | 1.14.6 | chardet | 4.0.0 |
| normalizador de conjunto de caracteres | 2.0.4 | click | 8.0.3 | cloudpickle | 2.0.0 |
| cmdstanpy | 0.9.68 | confecção | 0.0.1 | configparser | 5.2.0 |
| convertdate | 2.4.0 | criptografia | 3.4.8 | ciclista | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
| databricks-cli | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | decorador | 5.1.0 | defusedxml | 0.7.1 |
| endro | 0.3.4 | cache de disco | 5.4.0 | distlib | 0.3.6 |
| pontos de entrada | 0,3 | efêm | 4.1.3 | Visão geral de facetas | 1.0.0 |
| fasttext | 0.9.2 | bloqueio de arquivo | 3.3.1 | Flask | 1.1.2 |
| flatbuffers | 1.12 | fsspec | 2021.8.1 | futuro | 0.18.2 |
| gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
| google-auth (autenticação do Google) | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
| grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
| h5py | 3.3.0 | hijri-converter | 2.2.4 | Férias | 0.15 |
| horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
| IDNA | 3.2 | ImageHash | 4.3.0 | desequilibrado-learn | 0.8.1 |
| importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
| ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
| itsdangerous | 2.0.1 | Jedi | 0.18.0 | Jinja2 | 2.11.3 |
| jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
| jsonschema | 3.2.0 | Cliente Jupyter | 6.1.12 | jupyter-core | 4.8.1 |
| jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 | keras | 2.9.0 |
| Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 | calendário lunar coreano | 0.3.1 |
| códigos de idioma | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
| llvmlite | 0.37.0 | Calendário Lunar | 0.0.9 | Mako | 1.2.0 |
| Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
| matplotlib-inline | 0.1.2 | missingno | 0.5.1 | Mistune | 0.8.4 |
| mleap | 0.20.0 | mlflow-skinny | 1.29.0 | multimétodo | 1.9 |
| murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
| nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
| networkx | 2.6.3 | nltk | 3.6.5 | notebook | 6.4.5 |
| numba | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
| opt-einsum | 3.3.0 | empacotamento | 21,0 | Pandas | 1.3.4 |
| criação de perfil pandas | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
| parso | 0.8.2 | pathspec | 0.9.0 | patia | 0.6.2 |
| patsy | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
| phik | 0.12.2 | pickleshare | 0.7.5 | Almofada | 8.4.0 |
| pip | 21.2.4 | platformdirs | 2.5.2 | enredo | 5.9.0 |
| pmdarima | 1.8.5 | If the text refers to a technical term or specific term that may need localization, and a translation exists, that translation should be provided instead of remaining untranslated. | 3.0.7 | prompt-toolkit | 3.0.20 |
| profeta | 1.0.1 | protobuf | 3.19.4 | psutil | 5.8.0 |
| psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | Pyarrow | 7.0.0 |
| pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.10.0 |
| pycparser | 2,20 | pydantic | 1.9.2 | Pygments | 2.10.0 |
| PyGObject | 3.36.0 | PyJWT | 2.5.0 | PyMeeus | 0.5.11 |
| PyNaCl | 1.5.0 | pyodbc | 4.0.31 | pyparsing | 3.0.4 |
| pyrsistent | 0.18.0 | pystan | 2.19.1.1 | python-dateutil | 2.8.2 |
| editor de Python | 1.0.4 | Pytz | 2021.3 | PyWavelets | 1.1.1 |
| PyYAML | 6,0 | pyzmq | 22.2.1 | regex | 2021.8.3 |
| requests | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
| rsa | 4.9 | s3transfer | 0.5.2 | scikit-aprender | 0.24.2 |
| scipy | 1.7.1 | seaborn (biblioteca de visualização em Python) | 0.11.3 | Send2Trash | 1.8.0 |
| Ferramentas de configuração | 58.0.4 | setuptools-git | 1,2 | shap | 0.41.0 |
| simplejson | 3.17.6 | seis | 1.16.0 | segmentação | 0.0.7 |
| smart-open | 5.2.1 | smmap | 5.0.0 | espaçoso | 3.4.1 |
| spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 |
| sqlparse | 0.4.2 | srsly | 2.4.4 | ssh-import-id | 5.10 |
| statsmodels (biblioteca para modelos estatísticos em Python) | 0.12.2 | tabulate | 0.8.9 | tangled-up-in-unicode | 0.1.0 |
| tenacidade | 8.0.1 | tensorboard | 2.9.1 | tensorboard-data-server | 0.6.1 |
| tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow | 2.9.1 |
| tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-filesystem | 0.27.0 | termcolor | 2.0.1 |
| terminado | 0.9.4 | caminho de teste | 0.5.0 | thinc | 8.1.2 |
| threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | criadores de token | 0.12.1 |
| tomli | 2.0.1 | lanterna | 1.12.1+cu113 | torchvision | 0.13.1+cu113 |
| tornado | 6.1 | tqdm | 4.62.3 | traitlets | 5.1.0 |
| Transformadores | 4.21.2 | Typer | 0.4.2 | extensões de digitação | 3.10.0.2 |
| ujson | 4.0.2 | atualizações não supervisionadas | 0.1 | urllib3 | 1.26.7 |
| virtualenv | 20.8.0 | visões | 0.7.4 | wasabi | 0.10.1 |
| wcwidth | 0.2.5 | codificações web | 0.5.1 | websocket-client (cliente WebSocket) | 1.3.1 |
| Ferramentas | 2.0.2 | wheel | 0.37.0 | widgetsnbextension | 3.6.0 |
| embrulhado | 1.12.1 | xgboost | 1.6.2 | zipp | 3.6.0 |
Bibliotecas de R
As bibliotecas do R são idênticas às Bibliotecas do R no Databricks Runtime 11.3 LTS.
Bibliotecas Java e Scala (cluster Scala 2.12)
Além das bibliotecas Java e Scala no Databricks Runtime 11.3 LTS, o Databricks Runtime 11.3 LTS ML contém os seguintes JARs:
Clusters de CPU
| ID do grupo | ID do artefato | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
| ml.dmlc | xgboost4j-spark_2.12 | 1.6.2 |
| ml.dmlc | xgboost4j_2.12 | 1.6.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.29.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
Clusters de GPU
| ID do grupo | ID do artefato | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
| ml.dmlc | xgboost4j-gpu_2.12 | 1.6.2 |
| ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.6.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.29.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |