แชร์ผ่าน


มุมมองทะเลสาบที่เป็นภาพใน Microsoft Fabric คืออะไร

Note

คุณลักษณะนี้อยู่ในการแสดง ตัวอย่างในขณะนี้

มุมมองทะเลสาบที่เป็นรูปธรรมเป็นผลลัพธ์ที่คํานวณไว้ล่วงหน้าและจัดเก็บไว้ของคิวรี SQL ที่สามารถรีเฟรชได้ตามความต้องการหรือตามกําหนดการ ลองนึกถึงตารางเหล่านี้เป็น "ตารางอัจฉริยะ" ที่มีผลลัพธ์ของการแปลง การรวม หรือการรวมที่ซับซ้อน ด้วยกลยุทธ์การรีเฟรชอัจฉริยะเพื่อให้ข้อมูลเป็นปัจจุบันอยู่เสมอ

ทําไมต้องใช้วิวทะเลสาบที่เป็นรูปธรรม?

มุมมองทะเลสาบที่เป็นรูปธรรมช่วยแก้ปัญหาความท้าทายด้านวิศวกรรมข้อมูลทั่วไป:

  • ประสิทธิภาพ: แทนที่จะเรียกใช้คิวรีที่มีราคาแพงซ้ําๆ ผลลัพธ์จะถูกคํานวณและจัดเก็บไว้ล่วงหน้า
  • ความสอดคล้อง: ทุกคนเข้าถึงข้อมูลที่แปลงเหมือนกัน ซึ่งช่วยลดความคลาดเคลื่อน
  • ประสิทธิภาพ: รีเฟรชเฉพาะเมื่อข้อมูลต้นทางมีการเปลี่ยนแปลงจริง ซึ่งช่วยประหยัดทรัพยากรการประมวลผล
  • ความเรียบง่าย: กําหนดการแปลงครั้งเดียวโดยใช้ไวยากรณ์ SQL ที่คุ้นเคย

เมื่อใดที่คุณควรใช้มุมมองทะเลสาบที่เป็นรูปธรรม

พิจารณามุมมองทะเลสาบที่เป็นรูปธรรมเมื่อคุณมี:

  • การรวมที่เข้าถึงบ่อย (ยอดขายรวมรายวัน เมตริกรายเดือน)
  • การรวมที่ซับซ้อน ในตารางขนาดใหญ่หลายตารางที่มีการคิวรีบ่อยครั้ง
  • การแปลงคุณภาพข้อมูล ที่ต้องนําไปใช้อย่างสม่ําเสมอ
  • ชุดข้อมูลการรายงาน ที่รวมข้อมูลจากหลายแหล่ง
  • สถาปัตยกรรมเหรียญ ที่คุณต้องการการแปลงสีบรอนซ์→เงิน→ทอง

อย่าใช้สําหรับ:

  • คิวรีแบบใช้ครั้งเดียวหรือไม่ค่อยได้เข้าถึง
  • การแปลงอย่างง่ายที่ทํางานได้อย่างรวดเร็ว
  • ข้อมูลการสตรีมความถี่สูง (พิจารณา Real-Time Intelligence สําหรับการอัปเดตที่ต่ํากว่าวินาที)

มุมมองทะเลสาบที่เป็นรูปธรรมทํางานอย่างไร

มุมมองทะเลสาบที่เป็นรูปธรรมใช้วิธีการประกาศ - คุณกําหนดสิ่งที่คุณต้องการ ไม่ใช่วิธีสร้าง:

  1. สร้าง: เขียน SQL ที่กําหนดการแปลงของคุณ
  2. รีเฟรช: Fabric กําหนดกลยุทธ์การรีเฟรชที่เหมาะสมที่สุด (ส่วนเพิ่ม เต็ม หรือข้าม)
  3. คิวรี: แอปพลิเคชันสืบค้นมุมมองที่เป็นรูปธรรมเหมือนกับตารางใดๆ
  4. ตรวจสอบ: ติดตามคุณภาพข้อมูล สายข้อมูล และสถานะการรีเฟรช

ความสามารถหลัก

การเพิ่มประสิทธิภาพการรีเฟรชอัตโนมัติ

Fabric จะกําหนดเวลาและวิธีการรีเฟรชมุมมองของคุณโดยอัตโนมัติ:

  • การรีเฟรชแบบเพิ่มหน่วย: ประมวลผลเฉพาะข้อมูลใหม่หรือข้อมูลที่เปลี่ยนแปลง
  • การรีเฟรชเต็มรูปแบบ: สร้างมุมมองทั้งหมดใหม่เมื่อจําเป็น
  • ข้ามการรีเฟรช: ไม่จําเป็นต้องรีเฟรชเมื่อข้อมูลต้นทางไม่มีการเปลี่ยนแปลง

คุณภาพข้อมูลในตัว

กําหนดกฎโดยตรงใน SQL ของคุณและระบุวิธีจัดการกับการละเมิด:

CONSTRAINT valid_sales CHECK (sales_amount > 0) ON MISMATCH DROP

การจัดการการพึ่งพา

  • แสดงภาพว่ามุมมองของคุณขึ้นอยู่กับกันอย่างไร
  • การเรียงลําดับการรีเฟรชอัตโนมัติตามการขึ้นต่อกัน
  • การประมวลผลเป็นไปตามห่วงโซ่การขึ้นต่อกันเพื่อให้แน่ใจว่าข้อมูลมีความสอดคล้องกัน

การตรวจสอบและข้อมูลเชิงลึก

  • ติดตามประสิทธิภาพการรีเฟรชและสถานะการดําเนินการ
  • ดูเมตริกคุณภาพข้อมูลและจํานวนการละเมิดในสายข้อมูล
  • ตรวจสอบอินสแตนซ์งานและประวัติการรีเฟรช

กรณีการใช้งานทั่วไป

แดชบอร์ดการรายงานยอดขาย

-- Daily sales summary that refreshes automatically
CREATE MATERIALIZED LAKE VIEW daily_sales AS
SELECT 
    DATE(order_date) as sale_date,
    region,
    SUM(amount) as total_sales,
    COUNT(*) as order_count
FROM orders 
GROUP BY DATE(order_date), region;

การตรวจสอบคุณภาพข้อมูล

-- Clean customer data with quality rules
CREATE MATERIALIZED LAKE VIEW clean_customers (
    CONSTRAINT valid_email CHECK (email IS NOT NULL) ON MISMATCH DROP
) AS
SELECT 
    customer_id,
    TRIM(customer_name) as customer_name,
    LOWER(email) as email
FROM raw_customers
WHERE customer_name IS NOT NULL;

สถาปัตยกรรมเหรียญ

-- Bronze → Silver transformation
CREATE MATERIALIZED LAKE VIEW silver_products AS
SELECT 
    product_id,
    product_name,
    category,
    CAST(price as DECIMAL(10,2)) as price
FROM bronze_products
WHERE price > 0;

Note

ฟีเจอร์นี้ยังไม่พร้อมใช้งานในภูมิภาคตอนกลางตอนใต้ของสหรัฐอเมริกา

ข้อจํากัดในปัจจุบัน

คุณลักษณะต่อไปนี้ยังไม่พร้อมใช้งานสําหรับมุมมองทะเลสาบที่เป็นรูปธรรมใน Microsoft Fabric:

  • การสนับสนุนไวยากรณ์แบบประกาศสําหรับ PySpark คุณสามารถใช้ไวยากรณ์ Spark SQL เพื่อสร้างและรีเฟรชมุมมองทะเลสาบที่เป็นรูปธรรมได้
  • เชื้อสายข้ามเลคเฮาส์และคุณสมบัติการดําเนินการ