Partilhar via


Conjuntos de dados de exemplo no Cosmos DB no Microsoft Fabric

A carga de trabalho da base de dados Cosmos DB do Microsoft Fabric fornece conjuntos de dados de exemplo incorporados para o ajudar a explorar, aprender e experimentar padrões de bases de dados NoSQL. Este conjunto de dados representa um cenário de comércio eletrónico com produtos e avaliações de clientes, demonstrando como diferentes tipos de entidades coexistem no mesmo contentor.

Estão disponíveis dois conjuntos de dados de exemplo:

  • Dados de exemplo padrão: Dados centrais de comércio eletrónico com produtos e avaliações
  • Dados de amostra vetorial: Versão melhorada que inclui embeddings vetoriais de 1536 dimensões gerados usando o modelo text-embedding-ada-002 da OpenAI para cenários de pesquisa semântica.

Visão geral do conjunto de dados

Ambos os conjuntos de dados de exemplo contêm os mesmos dados de comércio eletrónico com dois tipos de documentos.

  • Documentos do produto (docType: "product") - Produtos individuais com nome, descrição, inventário, preço atual e um conjunto incorporado do histórico de preços desse produto.
  • Documentos de avaliação (docType: "review") - Avaliações e avaliações de clientes ligadas a produtos através de productId

O conjunto de dados de amostra vetorial baseia-se no conjunto de dados de amostra padrão. Os documentos de produto no conjunto de dados vetoriais incluem uma propriedade adicional vectors contendo embeddings de dimensão 1536 para capacidades de pesquisa semântica.

Observação

Pode encontrar ambos os conjuntos de dados, bem como um conjunto de dados adicional com vetores gerados usando o modelo OpenAI text-embedding-3-large com 512 dimensões na pasta Sample Datasets do Cosmos DB no Fabric - Samples Repository

Esquemas de documentos

Esquema do documento de produto

Os documentos do produto contêm informações detalhadas sobre itens individuais no catálogo de comércio eletrónico:

Propriedade Tipo Descrição
id string Identificador único do produto no formato GUID
docType string Identificador de tipo de documento, sempre "product"
productId string Identificador de produto, igual aos id documentos de produto
name string Nome de exibição do produto
description string Descrição detalhada do produto
categoryName string Categoria de produto (por exemplo, "Computadores, Portáteis", "Media", "Acessórios")
inventory number Número de artigos atualmente em stock
firstAvailable string Data em que o produto ficou disponível (formato ISO 8601)
currentPrice number Preço de venda atual
priceHistory array Array de objetos de alteração de preços com date e price campos
priceHistory[].date string Data e hora da alteração de preço no formato ISO 8601
priceHistory[].price number Preço na data especificada
vectors array Apenas dados de amostra vetorial - imersão vetorial de 1536 dimensões

Revisão do esquema do documento

Os documentos de revisão contêm o feedback dos clientes e as classificações dos produtos:

Propriedade Tipo Descrição
id string Identificador único para a revisão em formato GUID
docType string Identificador de tipo de documento, sempre "review"
productId string Referências ao id produto em análise
categoryName string Categoria de produto (herdada do produto avaliado)
customerName string Nome do cliente que escreveu a avaliação
reviewDate string Data de submissão da revisão (formato ISO 8601)
stars number Classificação atribuída pelo cliente (escala 1-5)
reviewText string Conteúdo de avaliação escrita pelo cliente

Observação

O Cosmos DB gera automaticamente propriedades do sistema (_rid, _self, _etag, _attachments, _ts) para todos os documentos.

Observação

Para obter mais informações sobre o formato ISO 8601, consulte Padrão internacional de data e hora. Para obter mais informações sobre o formato GUID, consulte identificadores universalmente exclusivos.

Exemplos de documentos

Os exemplos seguintes mostram a estrutura dos documentos em ambos os conjuntos de dados de exemplo.

Exemplo de documento de produto padrão

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Exemplo de documento de produto vetorizado

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Exemplo de documento de revisão

Os documentos de revisão são idênticos em ambos os conjuntos de dados de exemplo:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Como usar os dados de exemplo

Ambos os conjuntos de dados de exemplo ajudam-no a praticar consultas, filtragem e agregação de dados no Cosmos DB. Os tipos mistos de documentos fornecem cenários realistas para vários casos de uso.

Cenários padrão de dados de exemplo

  • Juntar dados relacionados: Ligar avaliações a produtos que utilizam productId
  • Análise por categoria: Consultar produtos e avaliações por categoryName
  • Análise de avaliações: Analise os padrões de feedback e as avaliações dos clientes

Padrões comuns de consulta

Obtenha todos os produtos numa categoria:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Obtenha avaliações para um produto específico:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Cenários de dados de amostra vetorial

  • Pesquisa por similaridade semântica: Encontre produtos com características semelhantes usando embeddings vetoriais
  • Recomendações baseadas em conteúdo: Gerar sugestões de produtos com base na similaridade da descrição
  • Consultas híbridas: Combine filtros tradicionais com similaridade vetorial para obter resultados melhorados

Esquemas JSON

Os seguintes esquemas JSON descrevem a estrutura dos documentos em ambos os conjuntos de dados de exemplo. Use estes esquemas para validar ou gerar dados semelhantes para as suas próprias cargas de trabalho do Cosmos DB.

Esquema padrão de documentos de produto

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Esquema de documentos de produto com suporte a vetores

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Revisão do esquema do documento

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}