หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
Note
คุณลักษณะนี้อยู่ในการแสดง ตัวอย่างในขณะนี้
มุมมองทะเลสาบที่เป็นรูปธรรมเป็นผลลัพธ์ที่คํานวณไว้ล่วงหน้าและจัดเก็บไว้ของคิวรี SQL ที่สามารถรีเฟรชได้ตามความต้องการหรือตามกําหนดการ ลองนึกถึงตารางเหล่านี้เป็น "ตารางอัจฉริยะ" ที่มีผลลัพธ์ของการแปลง การรวม หรือการรวมที่ซับซ้อน ด้วยกลยุทธ์การรีเฟรชอัจฉริยะเพื่อให้ข้อมูลเป็นปัจจุบันอยู่เสมอ
ทําไมต้องใช้วิวทะเลสาบที่เป็นรูปธรรม?
มุมมองทะเลสาบที่เป็นรูปธรรมช่วยแก้ปัญหาความท้าทายด้านวิศวกรรมข้อมูลทั่วไป:
- ประสิทธิภาพ: แทนที่จะเรียกใช้คิวรีที่มีราคาแพงซ้ําๆ ผลลัพธ์จะถูกคํานวณและจัดเก็บไว้ล่วงหน้า
- ความสอดคล้อง: ทุกคนเข้าถึงข้อมูลที่แปลงเหมือนกัน ซึ่งช่วยลดความคลาดเคลื่อน
- ประสิทธิภาพ: รีเฟรชเฉพาะเมื่อข้อมูลต้นทางมีการเปลี่ยนแปลงจริง ซึ่งช่วยประหยัดทรัพยากรการประมวลผล
- ความเรียบง่าย: กําหนดการแปลงครั้งเดียวโดยใช้ไวยากรณ์ SQL ที่คุ้นเคย
เมื่อใดที่คุณควรใช้มุมมองทะเลสาบที่เป็นรูปธรรม
พิจารณามุมมองทะเลสาบที่เป็นรูปธรรมเมื่อคุณมี:
- การรวมที่เข้าถึงบ่อย (ยอดขายรวมรายวัน เมตริกรายเดือน)
- การรวมที่ซับซ้อน ในตารางขนาดใหญ่หลายตารางที่มีการคิวรีบ่อยครั้ง
- การแปลงคุณภาพข้อมูล ที่ต้องนําไปใช้อย่างสม่ําเสมอ
- ชุดข้อมูลการรายงาน ที่รวมข้อมูลจากหลายแหล่ง
- สถาปัตยกรรมเหรียญ ที่คุณต้องการการแปลงสีบรอนซ์→เงิน→ทอง
อย่าใช้สําหรับ:
- คิวรีแบบใช้ครั้งเดียวหรือไม่ค่อยได้เข้าถึง
- การแปลงอย่างง่ายที่ทํางานได้อย่างรวดเร็ว
- ข้อมูลการสตรีมความถี่สูง (พิจารณา Real-Time Intelligence สําหรับการอัปเดตที่ต่ํากว่าวินาที)
มุมมองทะเลสาบที่เป็นรูปธรรมทํางานอย่างไร
มุมมองทะเลสาบที่เป็นรูปธรรมใช้วิธีการประกาศ - คุณกําหนดสิ่งที่คุณต้องการ ไม่ใช่วิธีสร้าง:
- สร้าง: เขียน SQL ที่กําหนดการแปลงของคุณ
- รีเฟรช: Fabric กําหนดกลยุทธ์การรีเฟรชที่เหมาะสมที่สุด (ส่วนเพิ่ม เต็ม หรือข้าม)
- คิวรี: แอปพลิเคชันสืบค้นมุมมองที่เป็นรูปธรรมเหมือนกับตารางใดๆ
- ตรวจสอบ: ติดตามคุณภาพข้อมูล สายข้อมูล และสถานะการรีเฟรช
ความสามารถหลัก
การเพิ่มประสิทธิภาพการรีเฟรชอัตโนมัติ
Fabric จะกําหนดเวลาและวิธีการรีเฟรชมุมมองของคุณโดยอัตโนมัติ:
- การรีเฟรชแบบเพิ่มหน่วย: ประมวลผลเฉพาะข้อมูลใหม่หรือข้อมูลที่เปลี่ยนแปลง
- การรีเฟรชเต็มรูปแบบ: สร้างมุมมองทั้งหมดใหม่เมื่อจําเป็น
- ข้ามการรีเฟรช: ไม่จําเป็นต้องรีเฟรชเมื่อข้อมูลต้นทางไม่มีการเปลี่ยนแปลง
คุณภาพข้อมูลในตัว
กําหนดกฎโดยตรงใน SQL ของคุณและระบุวิธีจัดการกับการละเมิด:
CONSTRAINT valid_sales CHECK (sales_amount > 0) ON MISMATCH DROP
การจัดการการพึ่งพา
- แสดงภาพว่ามุมมองของคุณขึ้นอยู่กับกันอย่างไร
- การเรียงลําดับการรีเฟรชอัตโนมัติตามการขึ้นต่อกัน
- การประมวลผลเป็นไปตามห่วงโซ่การขึ้นต่อกันเพื่อให้แน่ใจว่าข้อมูลมีความสอดคล้องกัน
การตรวจสอบและข้อมูลเชิงลึก
- ติดตามประสิทธิภาพการรีเฟรชและสถานะการดําเนินการ
- ดูเมตริกคุณภาพข้อมูลและจํานวนการละเมิดในสายข้อมูล
- ตรวจสอบอินสแตนซ์งานและประวัติการรีเฟรช
กรณีการใช้งานทั่วไป
แดชบอร์ดการรายงานยอดขาย
-- Daily sales summary that refreshes automatically
CREATE MATERIALIZED LAKE VIEW daily_sales AS
SELECT
DATE(order_date) as sale_date,
region,
SUM(amount) as total_sales,
COUNT(*) as order_count
FROM orders
GROUP BY DATE(order_date), region;
การตรวจสอบคุณภาพข้อมูล
-- Clean customer data with quality rules
CREATE MATERIALIZED LAKE VIEW clean_customers (
CONSTRAINT valid_email CHECK (email IS NOT NULL) ON MISMATCH DROP
) AS
SELECT
customer_id,
TRIM(customer_name) as customer_name,
LOWER(email) as email
FROM raw_customers
WHERE customer_name IS NOT NULL;
สถาปัตยกรรมเหรียญ
-- Bronze → Silver transformation
CREATE MATERIALIZED LAKE VIEW silver_products AS
SELECT
product_id,
product_name,
category,
CAST(price as DECIMAL(10,2)) as price
FROM bronze_products
WHERE price > 0;
Note
ฟีเจอร์นี้ยังไม่พร้อมใช้งานในภูมิภาคตอนกลางตอนใต้ของสหรัฐอเมริกา
ข้อจํากัดในปัจจุบัน
คุณลักษณะต่อไปนี้ยังไม่พร้อมใช้งานสําหรับมุมมองทะเลสาบที่เป็นรูปธรรมใน Microsoft Fabric:
- การสนับสนุนไวยากรณ์แบบประกาศสําหรับ PySpark คุณสามารถใช้ไวยากรณ์ Spark SQL เพื่อสร้างและรีเฟรชมุมมองทะเลสาบที่เป็นรูปธรรมได้
- เชื้อสายข้ามเลคเฮาส์และคุณสมบัติการดําเนินการ