แชร์ผ่าน


การเร่งคิวรีสําหรับทางลัด OneLake - ภาพรวม

ทางลัด OneLake คือการอ้างอิงจาก Eventhouse ที่ชี้ไปยัง Fabric ภายในหรือแหล่งข้อมูลภายนอก ทางลัดชนิดนี้จะเข้าถึงได้ในภายหลังสําหรับคิวรีในชุดคิวรี KQL โดยใช้external_table()ฟังก์ชัน คิวรีที่เรียกใช้ผ่านทางลัด OneLake อาจมีประสิทธิภาพน้อยกว่าข้อมูลที่จะเข้าถึงโดยตรงไปยัง Eventhouses เนื่องจากปัจจัยต่าง ๆ เช่น การเรียกเครือข่ายเพื่อดึงข้อมูลจากที่เก็บข้อมูล การไม่มีดัชนี และอื่นๆ

การเร่งคิวรีอนุญาตให้ระบุนโยบายที่ด้านบนของตาราง delta ภายนอกที่กําหนดจํานวนวันในการแคชข้อมูลสําหรับคิวรีประสิทธิภาพสูง

การเร่งคิวรีได้รับการสนับสนุนใน Eventhouse ผ่านตาราง delta จาก ทางลัด OneLake, Azure Data Lake Store Gen1, Amazon S3, Google Cloud Services, ตารางภายนอกที่เก็บข้อมูล Azure blob และปลายทางทั้งหมดที่สนับสนุนโดยทางลัด OneLake

หมายเหตุ

  • หากคุณมีข้อควรพิจารณาเกี่ยวกับการปฏิบัติตามข้อกําหนดที่กําหนดให้คุณจัดเก็บข้อมูลในภูมิภาคที่เฉพาะเจาะจง ตรวจสอบให้แน่ใจว่าความจุ Eventhouse ของคุณอยู่ในภูมิภาคเดียวกันกับตารางภายนอกหรือข้อมูลทางลัดของคุณ

  • ตารางภายนอกที่เร่งความเร็วเพิ่มไปยัง COGS ที่เก็บข้อมูล และปริมาณการใช้พื้นที่จัดเก็บ SSD ของคุณ Eventhouse ของคุณ คล้ายกับตารางปกติในฐานข้อมูล KQL ของคุณ คุณสามารถควบคุมจํานวนข้อมูลที่จะแคชได้โดยการกําหนด คุณสมบัติ Hot ใน นโยบายการเร่งคิวรี กิจกรรมการทําดัชนีและการนําเข้ายังมีส่วนร่วมในการคํานวณการใช้ทรัพยากร

ฉันควรใช้การเร่งคิวรีสําหรับทางลัด OneLake เมื่อใด

การเร่งคิวรีจะแคชข้อมูลเมื่ออยู่ใน OneLake ซึ่งมีประสิทธิภาพเทียบเท่ากับการนําเข้าข้อมูลใน Eventhouse ด้วยการใช้คุณลักษณะนี้ คุณสามารถเร่งการวางข้อมูลใน OneLake รวมถึงข้อมูลที่มีอยู่และการอัปเดตใหม่ และคาดหวังประสิทธิภาพที่คล้ายกัน ซึ่งจะช่วยลดความจําเป็นในการจัดการไปป์ไลน์การนําเข้า รักษาสําเนาสําเนาที่ซ้ํากันของข้อมูล ในขณะที่ทําให้แน่ใจว่าข้อมูลยังคงซิงค์อยู่โดยไม่ต้องใช้ความพยายามเพิ่มเติม

สถานการณ์ต่อไปนี้เหมาะสําหรับการใช้การเร่งคิวรีผ่านทางลัด OneLake:

  • คิวรีข้อมูลใน OneLake ที่มีประสิทธิภาพสูง: เมื่อคุณมีปริมาณงานที่มีอยู่ที่กําลังอัปโหลดข้อมูลและจัดการในที่เก็บข้อมูล (ทางเลือกในระบบคลาวด์หรือภูมิภาคอื่น) และคุณต้องการสอบถามข้อมูลบางส่วนหรือทั้งหมดที่มีประสิทธิภาพสูง
  • รวมข้อมูลในอดีตกับสตรีมแบบเรียลไทม์: เมื่อคุณต้องการรวมการลงจอดข้อมูลใน OneLake โดยตรงด้วยสตรีมแบบเรียลไทม์ที่เข้ามาใน Eventhouse โดยไม่ลดทอนความเร็วของคิวรี
  • ใช้ประโยชน์จากข้อมูลมิติที่จัดการโดยรายการอื่น ๆ: มักจะมีค่าสูงและข้อมูลขนาดเล็กถูกโฮสต์ใน SQL Server, Cosmos DB, Snowflake หรือระบบอื่น ๆ ที่สามารถจําลองเป็น OneLake ได้ ทางลัด OneLake ที่เร่งความเร็วสามารถทําให้ข้อมูลนี้สามารถใช้สําหรับการเข้าร่วมและการเสริมสร้างได้อย่างง่ายดายในคิวรี Eventhouse เนื่องจากข้อมูลมิติมักจะน้อยกว่าข้อมูลกิจกรรมอย่างมาก ค่าใช้จ่ายเพิ่มเติมที่เกี่ยวข้องกับการใช้งานนั้นจึงมักน้อยที่สุด

ลักษณะการทํางานของตารางส่วนที่แตกต่างภายนอกที่เร่งความเร็ว

ทางลัด OneLake ที่เร่งทํางานเหมือนกับ ตารางภายนอก โดยมีข้อจํากัดและความสามารถเดียวกัน โดยเฉพาะคุณลักษณะ เช่น มุมมองแบบเป็นภาพและนโยบายการอัปเดตจะไม่ได้รับการสนับสนุน

ตรวจสอบลักษณะการทํางานของการเร่ง

กระบวนการเริ่มต้นของการเร่งคิวรีจะขึ้นอยู่กับขนาดของตารางภายนอก เมื่อต้องการตรวจสอบความคืบหน้าและการตั้งค่าของตารางที่มีการเร่ง ให้ใช้ .show การดําเนินการของ ตารางภายนอก query_acceleration คําสั่งสถิติ ใน ชุดคิวรี KQL

ข้อจำกัด

  • จํานวนคอลัมน์ในตารางภายนอกต้องไม่เกิน 900
  • ประสิทธิภาพของคิวรีกับตาราง Delta ภายนอกที่มีการเร่งความเร็วที่มีไฟล์ข้อมูลมากกว่า 2.5 ล้านไฟล์อาจไม่เหมาะสม
  • คุณลักษณะจะถือว่าตาราง delta ที่มีคุณลักษณะขั้นสูงแบบคงที่ ตัวอย่างเช่น การแมปคอลัมน์ไม่เปลี่ยนแปลง พาร์ติชันจะไม่เปลี่ยนแปลง และอื่น ๆ หากต้องการเปลี่ยนคุณลักษณะขั้นสูง ก่อนอื่นให้ปิดใช้งานนโยบาย และเมื่อมีการเปลี่ยนแปลง ให้เปิดใช้งานนโยบายอีกครั้ง
  • การเปลี่ยนแปลง Schema บนตารางเดลต้าต้องตามด้วย Schema ของตาราง delta ภายนอกที่เกี่ยวข้อง .alter ซึ่งอาจส่งผลให้มีการเร่งความเร็วที่เริ่มต้นตั้งแต่เริ่มต้นหากมีการแบ่งการเปลี่ยนแปลง Schema
  • การตัดแต่งกิ่งตามดัชนีไม่ได้รับการสนับสนุนสําหรับพาร์ติชัน
  • ไฟล์ Parquet ที่มีขนาดบีบอัดสูงกว่า 6 GB จะไม่ถูกแคช

การเรียกเก็บเงิน

ข้อมูลที่ถูกเร่งจะถูกเรียกเก็บเงินภายใต้ตัววัดแคช OneLake Premium ซึ่งคล้ายกับตาราง Eventhouse แบบเนทีฟ คุณสามารถควบคุมจํานวนข้อมูลที่เร่งความเร็วได้โดยการกําหนดค่าจํานวนวันในการแคช กิจกรรมการทําดัชนียังอาจนับรวมในปริมาณการใช้แบบ CU สําหรับข้อมูลเพิ่มเติม ดู การเรียกเก็บเงินที่เก็บข้อมูล

ค่าใช้จ่ายที่เกี่ยวข้องกับการเร่งคิวรีจะปรากฏในแอปการวัด Fabric ภายใต้ Eventhouse ที่สร้างทางลัดที่เร่งความเร็ว