แชร์ผ่าน


ทําความเข้าใจและเพิ่มประสิทธิภาพการรีเฟรชกระแสข้อมูล

กระแสข้อมูล Power BI ช่วยให้คุณสามารถเชื่อมต่อ แปลง รวม และแจกจ่ายข้อมูลสําหรับการวิเคราะห์ดาวน์สตรีม องค์ประกอบหลักในกระแสข้อมูลคือกระบวนการรีเฟรช ซึ่งจะใช้ขั้นตอนการแปลงที่คุณเขียนไว้ในกระแสข้อมูล และอัปเดตข้อมูลในรายการเอง

เมื่อต้องการทําความเข้าใจเวลารัน ประสิทธิภาพ และไม่ว่าคุณจะได้รับประโยชน์สูงสุดจากกระแสข้อมูลของคุณหรือไม่ คุณสามารถดาวน์โหลดประวัติการรีเฟรชหลังจากที่คุณรีเฟรชกระแสข้อมูล

ทําความเข้าใจการรีเฟรช

การรีเฟรชมีสองชนิดที่ใช้ได้กับกระแสข้อมูล:

  • เต็ม ซึ่งจะทําการล้างและโหลดข้อมูลของคุณใหม่ทั้งหมด

  • ส่วนเพิ่ม (Premium เท่านั้น) ซึ่งประมวลผลชุดย่อยของข้อมูลของคุณตามกฎตามเวลา ซึ่งแสดงเป็นตัวกรองที่คุณกําหนดค่า ตัวกรองในคอลัมน์วันที่จะแบ่งพาร์ติชันข้อมูลแบบไดนามิกเป็นช่วงในบริการของ Power BI หลังจากที่คุณกําหนดค่าการรีเฟรชแบบเพิ่มหน่วย กระแสข้อมูลจะเปลี่ยนคิวรีของคุณโดยอัตโนมัติเพื่อรวมการกรองตามวันที่ คุณสามารถแก้ไขคิวรีที่สร้างขึ้นโดยอัตโนมัติโดยใช้ ตัวแก้ไขขั้นสูง ใน Power Query เพื่อปรับแต่งหรือปรับแต่งการรีเฟรชของคุณ หากคุณนํา Azure Data Lake Storage ของคุณเอง คุณสามารถดูส่วนเวลาของข้อมูลของคุณตามนโยบายการรีเฟรชที่คุณตั้งไว้

    Note

    หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการรีเฟรชแบบเพิ่มหน่วยและวิธีการทํางาน โปรดดู การใช้การรีเฟรชแบบเพิ่มหน่วยกับกระแสข้อมูล

การรีเฟรชแบบเพิ่มหน่วยเปิดใช้งานกระแสข้อมูลขนาดใหญ่ใน Power BI พร้อมประโยชน์ดังต่อไปนี้:

  • การรีเฟรชจะเร็วขึ้นหลังจากการรีเฟรชครั้งแรก เนื่องจากข้อเท็จจริงต่อไปนี้:

    • Power BI รีเฟรชพาร์ติชัน N ล่าสุดที่ระบุโดยผู้ใช้ (โดยที่พาร์ติชันคือวัน/สัปดาห์/เดือน และอื่นๆ) หรือ
    • Power BI รีเฟรชเฉพาะข้อมูลที่ต้องรีเฟรชเท่านั้น ตัวอย่างเช่น การรีเฟรชเฉพาะห้าวันสุดท้ายของแบบจําลองความหมาย 10 ปี
    • Power BI จะรีเฟรชเฉพาะข้อมูลที่มีการเปลี่ยนแปลง ตราบใดที่คุณระบุคอลัมน์ที่คุณต้องการตรวจสอบการเปลี่ยนแปลง
  • การรีเฟรชมีความน่าเชื่อถือมากขึ้น - ไม่จําเป็นต้องรักษาการเชื่อมต่อที่ยาวนานกับระบบต้นทางที่ผันผวนอีกต่อไป

  • การใช้ทรัพยากรลดลง - ข้อมูลในการรีเฟรชน้อยลงจะช่วยลดการใช้หน่วยความจําและทรัพยากรอื่นๆ โดยรวม

  • เมื่อใดก็ตามที่เป็นไปได้ Power BI จะใช้การประมวลผลแบบขนานบนพาร์ติชัน ซึ่งสามารถนําไปสู่การรีเฟรชที่เร็วขึ้น

ในสถานการณ์การรีเฟรชเหล่านี้ หากการรีเฟรชล้มเหลว ข้อมูลจะไม่อัปเดต ข้อมูลของคุณอาจเก่าจนกว่าการรีเฟรชล่าสุดจะเสร็จสมบูรณ์ หรือคุณสามารถรีเฟรชด้วยตนเอง และจากนั้นก็สามารถทําได้โดยไม่มีข้อผิดพลาด การรีเฟรชเกิดขึ้นที่พาร์ติชันหรือเอนทิตี ดังนั้นถ้าการรีเฟรชแบบเพิ่มหน่วยล้มเหลว หรือเอนทิตีมีข้อผิดพลาด ธุรกรรมการรีเฟรชทั้งหมดจะไม่เกิดขึ้น กล่าวอีกนัยหนึ่ง ถ้าพาร์ติชัน (นโยบายการรีเฟรชแบบเพิ่มหน่วย) หรือเอนทิตีล้มเหลวสําหรับกระแสข้อมูล การดําเนินการรีเฟรชทั้งหมดจะล้มเหลว และไม่มีการอัปเดตข้อมูล

ทําความเข้าใจและเพิ่มประสิทธิภาพการรีเฟรช

หากต้องการทําความเข้าใจให้ดียิ่งขึ้นว่าการดําเนินการรีเฟรชกระแสข้อมูลทํางานอย่างไร ให้ตรวจสอบ ประวัติการรีเฟรช สําหรับกระแสข้อมูลโดยนําทางไปยังกระแสข้อมูลใดกระแสหนึ่งของคุณ เลือก ตัวเลือกเพิ่มเติม (...) สําหรับกระแสข้อมูล จากนั้นเลือก การตั้งค่า > ประวัติการรีเฟรช คุณยังสามารถเลือกกระแสข้อมูลในพื้นที่ ทํางานได้อีกด้วย จากนั้นเลือก ตัวเลือกเพิ่มเติม (...) > รีเฟรชประวัติ

สกรีนช็อตของประวัติการรีเฟรชกระแสข้อมูล

ประวัติการ รีเฟรช ให้ภาพรวมของการรีเฟรช รวมถึงชนิด – ตามความต้องการ หรือตาม กําหนดการ ระยะเวลา และสถานะการเรียกใช้ หากต้องการดูรายละเอียดในรูปแบบของไฟล์ CSV ให้เลือกไอคอนดาวน์โหลดที่ด้านขวาสุดของแถวของคําอธิบายการรีเฟรช CSV ที่ดาวน์โหลดจะมีแอตทริบิวต์ที่อธิบายไว้ในตารางต่อไปนี้ การรีเฟรชแบบพรีเมียมให้ข้อมูลเพิ่มเติมตามความสามารถด้านการคํานวณและกระแสข้อมูลเพิ่มเติม เทียบกับกระแสข้อมูลที่ใช้ Pro ที่อยู่บนความจุที่ใช้ร่วมกัน ด้วยเหตุนี้ เมตริกต่อไปนี้บางส่วนจึงพร้อมใช้งานใน Premium เท่านั้น

Item คำอธิบาย Pro Premium
ขอเมื่อ มีการกําหนดเวลาการรีเฟรชหรือรีเฟรชเดี๋ยวนี้ถูกคลิกตามเวลาท้องถิ่น
ชื่อกระแสข้อมูล ชื่อของกระแสข้อมูลของคุณ
สถานะการรีเฟรชกระแสข้อมูล เสร็จสมบูรณ์ ล้มเหลว หรือ ข้าม (สําหรับเอนทิตี) เป็นสถานะที่เป็นไปได้ กรณีการใช้งาน เช่น เอนทิตีที่เชื่อมโยงเป็นสาเหตุที่อาจเห็นการข้าม
ชื่อเอนทิตี้ ชื่อตาราง
ชื่อพาร์ติชัน รายการนี้ขึ้นอยู่กับว่ากระแสข้อมูลเป็นแบบพรีเมียมหรือไม่ และหาก Pro แสดงเป็น NA เนื่องจากไม่รองรับการรีเฟรชแบบเพิ่มหน่วย พรีเมี่ยมแสดง FullRefreshPolicyPartition หรือ IncrementalRefreshPolicyPartition-[DateRange]
สถานะการรีเฟรช สถานะการรีเฟรชของเอนทิตีหรือพาร์ติชันแต่ละรายการ ซึ่งให้สถานะสําหรับส่วนเวลาของข้อมูลที่กําลังรีเฟรช
เวลาเริ่มต้น ใน Premium รายการนี้คือเวลาที่กระแสข้อมูลถูกจัดคิวสําหรับการประมวลผลสําหรับเอนทิตีหรือพาร์ติชัน เวลานี้อาจแตกต่างกันไปหากกระแสข้อมูลมีการขึ้นต่อกัน และจําเป็นต้องรอให้ชุดผลลัพธ์ของกระแสข้อมูลอัปสตรีมเริ่มการประมวลผล
เวลาสิ้นสุด เวลาสิ้นสุดคือเวลาที่เอนทิตีกระแสข้อมูลหรือพาร์ติชันเสร็จสมบูรณ์
Duration เวลาที่ผ่านไปทั้งหมดสําหรับกระแสข้อมูลเพื่อรีเฟรชที่แสดงเป็น HH:MM:SS
แถวที่ประมวลผล สําหรับเอนทิตีหรือพาร์ติชันที่กําหนด จํานวนแถวที่สแกนหรือเขียนโดยกลไกจัดการกระแสข้อมูล รายการนี้อาจไม่มีข้อมูลที่ยึดตามการดําเนินการที่คุณดําเนินการเสมอไป ข้อมูลอาจถูกละเว้นเมื่อไม่ได้ใช้กลไกการคํานวณ หรือเมื่อคุณใช้เกตเวย์ขณะที่ข้อมูลถูกประมวลผลที่นั่น
ไบต์ที่ประมวลผล สําหรับเอนทิตีหรือพาร์ติชันที่กําหนด ข้อมูลที่เขียนโดยกลไกจัดการกระแสข้อมูล ซึ่งแสดงเป็นไบต์

เมื่อใช้เกตเวย์บนกระแสข้อมูลเฉพาะนี้ จะไม่มีการระบุข้อมูลนี้
จํานวนการยอมรับสูงสุด (KB) Max Commit คือหน่วยความจําคอมมิตสูงสุดที่มีประโยชน์สําหรับการวินิจฉัยความล้มเหลวของหน่วยความจําไม่เพียงพอเมื่อคิวรี M ไม่ได้รับการปรับให้เหมาะสม

เมื่อคุณใช้เกตเวย์บนกระแสข้อมูลเฉพาะนี้ จะไม่มีการระบุข้อมูลนี้
เวลาโปรเซสเซอร์ สําหรับเอนทิตีหรือพาร์ติชันที่กําหนด เวลา ที่แสดงเป็น HH:MM:SS ที่กลไกจัดการกระแสข้อมูลใช้ในการแปลง

เมื่อคุณใช้เกตเวย์บนกระแสข้อมูลเฉพาะนี้ จะไม่มีการระบุข้อมูลนี้
เวลารอ สําหรับเอนทิตีหรือพาร์ติชันที่กําหนด เวลาที่เอนทิตีใช้ในสถานะรอ ตามปริมาณงานในความจุพรีเมียม
กลไกการคํานวณ สําหรับเอนทิตีหรือพาร์ติชันที่กําหนด ให้รายละเอียดเกี่ยวกับวิธีที่การดําเนินการรีเฟรชใช้กลไกการคํานวณ ค่าคือ:
-นา
-พับ
-แค ช
- แคช + พับ

องค์ประกอบเหล่านี้จะอธิบายในรายละเอียดเพิ่มเติมในบทความนี้
Error หากมี จะมีการอธิบายข้อความแสดงข้อผิดพลาดโดยละเอียดต่อเอนทิตีหรือพาร์ติชัน

คําแนะนําการรีเฟรชกระแสข้อมูล

สถิติการรีเฟรชให้ข้อมูลที่มีค่าที่คุณสามารถใช้เพื่อเพิ่มประสิทธิภาพและเร่งประสิทธิภาพของกระแสข้อมูลของคุณ ในส่วนต่อไปนี้ เราจะอธิบายสถานการณ์บางอย่าง สิ่งที่ต้องระวัง และวิธีเพิ่มประสิทธิภาพตามข้อมูลที่ให้ไว้

การเรียบเรียง

การใช้กระแสข้อมูลในพื้นที่ทํางานเดียวกันช่วยให้สามารถประสานงานได้อย่างตรงไปตรงมา ตัวอย่างเช่น คุณอาจมีกระแสข้อมูล A, B และ C ในพื้นที่ทํางานเดียว และการเชื่อมโยงเช่น ABC >> C ถ้าคุณรีเฟรชแหล่งข้อมูล (A) เอนทิตีดาวน์สตรีมจะได้รับการรีเฟรชด้วย อย่างไรก็ตาม หากคุณรีเฟรช C คุณต้องรีเฟรชผู้อื่นอย่างอิสระ นอกจากนี้ ถ้าคุณเพิ่มแหล่งข้อมูลใหม่ในกระแสข้อมูล B (ซึ่งไม่รวมอยู่ใน A) ข้อมูลนั้นจะไม่ถูกรีเฟรชเป็นส่วนหนึ่งของการประสานรวม

คุณอาจต้องการเชื่อมโยงรายการเข้าด้วยกันซึ่งไม่พอดีกับการประสานรวมที่มีการจัดการที่ Power BI ดําเนินการ ในสถานการณ์เหล่านี้ คุณสามารถใช้ API และ/หรือใช้ Power Automate ได้ คุณสามารถดู เอกสารประกอบ API และ สคริปต์ PowerShell สําหรับการรีเฟรชแบบเป็นโปรแกรม มีตัวเชื่อมต่อ Power Automate ที่ช่วยให้สามารถทํากระบวนงานนี้ได้โดยไม่ต้องเขียนโค้ดใดๆ คุณสามารถดูตัวอย่างโดยละเอียด พร้อมคําแนะนําเฉพาะสําหรับการรีเฟรชตามลําดับ

Monitoring

เมื่อใช้สถิติการรีเฟรชขั้นสูงที่อธิบายไว้ก่อนหน้านี้ในบทความนี้ คุณจะได้รับข้อมูลการรีเฟรชต่อกระแสข้อมูลโดยละเอียด แต่ถ้าคุณต้องการดูกระแสข้อมูลที่มีภาพรวมการรีเฟรชทั่วทั้งผู้เช่าหรือทั่วทั้งพื้นที่ทํางาน อาจสร้างแดชบอร์ดการตรวจสอบ คุณสามารถใช้ API หรือ เทมเพลต Power Automate ได้ ในทํานองเดียวกัน สําหรับกรณีการใช้งาน เช่น การส่งการแจ้งเตือนแบบง่ายหรือซับซ้อน คุณสามารถใช้ตัวเชื่อมต่อ Power Automate หรือสร้างแอปพลิเคชันแบบกําหนดเองของคุณเองได้โดยใช้ API

ข้อผิดพลาดหมดเวลา

การปรับเวลาที่ใช้ในการดําเนินการสถานการณ์การแยกข้อมูล การแปลง และการโหลด (ETL) ให้เหมาะสมนั้นเหมาะอย่างยิ่ง ใน Power BI กรณีต่อไปนี้มีผลบังคับใช้:

  • ตัวเชื่อมต่อบางตัวมีการตั้งค่าการหมดเวลาที่ชัดเจนที่คุณสามารถกําหนดค่าได้ สําหรับข้อมูลเพิ่มเติม โปรดดู ตัวเชื่อมต่อใน Power Query
  • กระแสข้อมูล Power BI โดยใช้ Power BI Pro ยังสามารถพบการหมดเวลาสําหรับคิวรีที่ทํางานเป็นเวลานานภายในเอนทิตีหรือกระแสข้อมูลเอง ข้อจํากัดนั้นไม่มีอยู่ในพื้นที่ทํางาน Power BI Premium

คําแนะนําการหมดเวลา

เกณฑ์การหมดเวลาสําหรับกระแสข้อมูล Power BI Pro คือ:

  • สองชั่วโมงในระดับเอนทิตีแต่ละรายการ
  • สามชั่วโมงที่ระดับกระแสข้อมูลทั้งหมด

ตัวอย่างเช่น ถ้าคุณมีกระแสข้อมูลที่มีสามตาราง จะไม่มีตารางใดที่อาจใช้เวลาเกินสองชั่วโมง และกระแสข้อมูลทั้งหมดจะหมดเวลาหากระยะเวลาเกินสามชั่วโมง

หากคุณกําลังประสบปัญหาการหมดเวลา ให้พิจารณาปรับคิวรีกระแสข้อมูลของคุณให้เหมาะสม และพิจารณาใช้ การพับคิวรี บนระบบต้นทางของคุณ

แยกจากกัน ให้พิจารณาอัปเกรดเป็น Premium Per User ซึ่งไม่อยู่ภายใต้การหมดเวลาเหล่านี้ และให้ประสิทธิภาพที่เพิ่มขึ้นเนื่องจาก คุณลักษณะ Power BI Premium Per User จํานวนมาก

ระยะเวลานาน

กระแสข้อมูลที่ซับซ้อนหรือขนาดใหญ่อาจใช้เวลามากขึ้นในการรีเฟรช เช่นเดียวกับกระแสข้อมูลที่ปรับให้เหมาะสมไม่ดี ส่วนต่อไปนี้ให้คําแนะนําเกี่ยวกับวิธีการลดระยะเวลาการรีเฟรชที่ยาวนาน

คําแนะนําสําหรับระยะเวลาการรีเฟรชที่ยาวนาน

ขั้นตอนแรกในการปรับปรุงระยะเวลาการรีเฟรชที่ยาวนานสําหรับกระแสข้อมูลคือการสร้างกระแสข้อมูลตามแนวทางปฏิบัติที่ดีที่สุด รูปแบบที่โดดเด่น ได้แก่ :

ถัดไป จะช่วยประเมินว่าคุณสามารถใช้การรีเฟรชแบบเพิ่มหน่วยได้หรือไม่

การใช้การ รีเฟรชแบบเพิ่มหน่วย สามารถปรับปรุงประสิทธิภาพได้ สิ่งสําคัญคือตัวกรองพาร์ติชันจะถูกส่งไปยังระบบต้นทางเมื่อมีการส่งคิวรีสําหรับการดําเนินการรีเฟรช เมื่อต้องการผลักดันการกรองลงหมายความว่าแหล่งข้อมูลควรสนับสนุนการพับคิวรี หรือคุณสามารถแสดงตรรกะทางธุรกิจผ่านฟังก์ชันหรือวิธีการอื่นๆ ที่สามารถช่วยให้ Power Query กําจัดและกรองไฟล์หรือโฟลเดอร์ได้ แหล่งข้อมูลส่วนใหญ่ที่สนับสนุนคิวรี SQL สนับสนุนการพับคิวรี และตัวดึงข้อมูล OData บางตัวยังสามารถสนับสนุนการกรองได้อีกด้วย

อย่างไรก็ตาม แหล่งข้อมูล เช่น ไฟล์แฟลต Blob และ API มักไม่รองรับการกรอง ในกรณีที่แบ็คเอนด์แหล่งข้อมูลไม่รองรับตัวกรอง จะไม่สามารถผลักลงได้ ในกรณีดังกล่าว กลไกจัดการ Mash-up จะชดเชยและใช้ตัวกรองภายในเครื่อง ซึ่งอาจต้องดึงแบบจําลองความหมายแบบเต็มจากแหล่งข้อมูล การดําเนินการนี้อาจทําให้การรีเฟรชแบบเพิ่มหน่วยช้าลง และกระบวนการอาจหมดทรัพยากรในบริการของ Power BI หรือในเกตเวย์ข้อมูลภายในองค์กร

เมื่อพิจารณาถึงระดับต่างๆ ของการสนับสนุนการพับคิวรีสําหรับแต่ละแหล่งข้อมูล คุณควรดําเนินการตรวจสอบเพื่อให้แน่ใจว่าตรรกะตัวกรองรวมอยู่ในคิวรีต้นทาง เพื่อให้ง่ายขึ้น Power BI จะพยายามดําเนินการตรวจสอบนี้ให้คุณ ด้วยตัวบ่งชี้การพับขั้นตอนสําหรับ Power Query Online การเพิ่มประสิทธิภาพเหล่านี้จํานวนมากเป็นประสบการณ์เวลาออกแบบ แต่หลังจากการรีเฟรชเกิดขึ้น คุณจะมีโอกาสวิเคราะห์และเพิ่มประสิทธิภาพการรีเฟรชของคุณ

สุดท้าย ให้พิจารณาปรับสภาพแวดล้อมของคุณให้เหมาะสม คุณสามารถปรับสภาพแวดล้อม Power BI ให้เหมาะสมได้โดยการปรับขนาดความจุ ปรับขนาดเกตเวย์ข้อมูลให้เหมาะสม และลดเวลาแฝงของเครือข่ายด้วยการเพิ่มประสิทธิภาพต่อไปนี้:

  • เมื่อใช้ความจุที่พร้อมใช้งานกับ Power BI Premium หรือ Premium Per User คุณสามารถเพิ่มประสิทธิภาพได้โดยการเพิ่มอินสแตนซ์แบบพรีเมียมของคุณ หรือกําหนดเนื้อหาให้กับความจุอื่น

  • จําเป็นต้องมีเกตเวย์เมื่อใดก็ตามที่ Power BI จําเป็นต้องเข้าถึงข้อมูลที่ไม่พร้อมใช้งานโดยตรงผ่านทางอินเทอร์เน็ต คุณสามารถติดตั้ง เกตเวย์ข้อมูลภายในองค์กร บนเซิร์ฟเวอร์ภายในองค์กร หรือบนเครื่องเสมือน

    • เมื่อต้องการทําความเข้าใจปริมาณงานของเกตเวย์และคําแนะนําการปรับขนาด โปรดดู การปรับขนาดเกตเวย์ข้อมูลภายในองค์กร
    • ประเมินการนําข้อมูลเข้าสู่กระแสข้อมูลการจัดเตรียมก่อน และอ้างอิงข้อมูลดาวน์สตรีมโดยใช้เอนทิตีที่เชื่อมโยงและคํานวณ
  • เวลาแฝงของเครือข่ายอาจส่งผลต่อประสิทธิภาพการรีเฟรชโดยการเพิ่มเวลาที่ต้องใช้สําหรับคําขอเพื่อเข้าถึงบริการของ Power BI และสําหรับการตอบสนองที่จะส่ง ผู้เช่าใน Power BI ถูกกําหนดให้กับภูมิภาคเฉพาะ เมื่อต้องการกําหนดตําแหน่งของผู้เช่าของคุณ ให้ดูที่ ค้นหาภูมิภาคเริ่มต้นสําหรับองค์กรของคุณ เมื่อผู้ใช้จากผู้เช่าเข้าถึงบริการของ Power BI คําขอของพวกเขาจะกําหนดเส้นทางไปยังภูมิภาคนั้นเสมอ เมื่อคําขอไปถึงบริการของ Power BI บริการอาจส่งคําขอเพิ่มเติม เช่น ไปยังแหล่งข้อมูลต้นแบบ หรือเกตเวย์ข้อมูล ซึ่งขึ้นอยู่กับเวลาแฝงของเครือข่ายด้วย

    • เครื่องมือต่างๆ เช่น การทดสอบความเร็ว Azure ให้การบ่งชี้เวลาแฝงของเครือข่ายระหว่างไคลเอ็นต์และภูมิภาค Azure โดยทั่วไป เพื่อลดผลกระทบของเวลาแฝงของเครือข่าย ให้พยายามรักษาแหล่งข้อมูล เกตเวย์ และคลัสเตอร์ Power BI ของคุณให้ใกล้ที่สุดเท่าที่จะเป็นไปได้ อาศัยอยู่ในภูมิภาคเดียวกันจะดีกว่า ถ้าเวลาแฝงของเครือข่ายเป็นปัญหา ให้ลองค้นหาเกตเวย์และแหล่งข้อมูลให้ใกล้กับคลัสเตอร์ Power BI ของคุณมากขึ้นโดยวางไว้ในเครื่องเสมือนที่โฮสต์บนคลาวด์

เวลาประมวลผลสูง

หากคุณเห็นเวลาโปรเซสเซอร์สูง คุณอาจมีการแปลงราคาแพงที่ไม่ได้พับ เวลาของตัวประมวลผลที่สูงอาจเป็นเพราะจํานวนขั้นตอนที่ใช้ที่คุณมี หรือประเภทของการแปลงที่คุณกําลังทํา ความเป็นไปได้แต่ละอย่างเหล่านี้อาจส่งผลให้เวลารีเฟรชสูงขึ้น

คําแนะนําสําหรับเวลาโปรเซสเซอร์สูง

มีสองตัวเลือกในการเพิ่มประสิทธิภาพเวลาโปรเซสเซอร์ที่สูง

ขั้นแรก ให้ใช้การพับคิวรีภายในแหล่งข้อมูลเอง ซึ่งควรลดภาระในกลไกการคํานวณกระแสข้อมูลโดยตรง การพับคิวรีภายในแหล่งข้อมูลช่วยให้ระบบต้นทางสามารถทํางานส่วนใหญ่ได้ กระแสข้อมูลสามารถส่งผ่านคิวรีในภาษาดั้งเดิมของแหล่งที่มา แทนที่จะต้องทําการคํานวณทั้งหมดในหน่วยความจําหลังจากคิวรีเริ่มต้น

แหล่งข้อมูลบางแหล่งข้อมูลไม่สามารถทําการพับคิวรีได้ และแม้ว่าจะสามารถพับคิวรีได้ แต่ก็อาจมีกระแสข้อมูลที่ทําการแปลงบางอย่างที่ไม่สามารถพับไปยังแหล่งข้อมูลได้ ในกรณีดังกล่าว กลไกการคํานวณขั้นสูง เป็นความสามารถที่แนะนําโดย Power BI เพื่อปรับปรุงประสิทธิภาพได้ถึง 25 เท่า สําหรับการแปลงโดยเฉพาะ

ใช้กลไกการคํานวณเพื่อเพิ่มประสิทธิภาพสูงสุด

ในขณะที่ Power Query มีการมองเห็นเวลาออกแบบในการพับคิวรี คอลัมน์กลไกการคํานวณจะให้รายละเอียดว่ามีการใช้กลไกจัดการภายในหรือไม่ กลไกการคํานวณมีประโยชน์เมื่อคุณมีกระแสข้อมูลที่ซับซ้อนและคุณกําลังทําการแปลงในหน่วยความจํา สถานการณ์นี้เป็นที่ที่สถิติการรีเฟรชที่ปรับปรุงแล้วอาจเป็นประโยชน์ เนื่องจากคอลัมน์กลไกการคํานวณให้รายละเอียดว่ามีการใช้กลไกจัดการหรือไม่

ส่วนต่อไปนี้ให้คําแนะนําเกี่ยวกับการใช้กลไกการคํานวณและสถิติ

คำเตือน

ในระหว่างเวลาออกแบบ ตัวบ่งชี้การพับในตัวแก้ไขอาจแสดงว่าคิวรีไม่พับเมื่อใช้ข้อมูลจากกระแสข้อมูลอื่น ตรวจสอบกระแสข้อมูลต้นทางหากเปิดใช้งานการประมวลผลขั้นสูงเพื่อให้แน่ใจว่ามีการเปิดใช้งานการพับบนกระแสข้อมูลต้นทาง

คําแนะนําเกี่ยวกับสถานะกลไกการคํานวณ

การเปิดกลไกการคํานวณขั้นสูงและทําความเข้าใจสถานะต่างๆ จะเป็นประโยชน์ ภายในกลไกการคํานวณขั้นสูงจะใช้ฐานข้อมูล SQL เพื่ออ่านและจัดเก็บข้อมูล ทางที่ดีควรให้การแปลงของคุณดําเนินการกับกลไกจัดการคิวรีที่นี่ ย่อหน้าต่อไปนี้ให้สถานการณ์ต่างๆ และคําแนะนําเกี่ยวกับสิ่งที่ต้องทําสําหรับแต่ละสถานการณ์

NA - สถานะนี้หมายความว่าไม่ได้ใช้กลไกการคํานวณ เนื่องจาก:

  • คุณกําลังใช้กระแสข้อมูล Power BI Pro
  • คุณปิดกลไกการคํานวณอย่างชัดเจน
  • คุณกําลังใช้การพับคิวรีบนแหล่งข้อมูล
  • คุณกําลังทําการแปลงที่ซับซ้อนซึ่งไม่สามารถใช้ประโยชน์จากกลไกจัดการ SQL ที่ใช้เพื่อเพิ่มความเร็วการสืบค้นได้

หากคุณประสบปัญหาเป็นเวลานานและยังคงได้รับสถานะ NA ตรวจสอบให้แน่ใจว่าได้ เปิด อยู่และไม่ได้ปิดโดยไม่ได้ตั้งใจ รูปแบบหนึ่งที่แนะนําคือการใช้ กระแสข้อมูลการจัดเตรียม เพื่อรับข้อมูลของคุณในบริการของ Power BI ในขั้นต้น จากนั้นสร้างกระแสข้อมูลที่ด้านบนของข้อมูลนี้หลังจากที่อยู่ในกระแสข้อมูลการจัดเตรียม รูปแบบดังกล่าวสามารถลดภาระในระบบต้นทาง และร่วมกับกลไกการคํานวณ ช่วยเพิ่มความเร็วสําหรับการแปลงและปรับปรุงประสิทธิภาพ

แคช - ถ้าคุณเห็นสถานะ แคช แสดงว่าข้อมูลกระแสข้อมูลถูกเก็บไว้ในกลไกการคํานวณ และพร้อมที่จะอ้างอิงเป็นส่วนหนึ่งของคิวรีอื่น สถานการณ์นี้เหมาะอย่างยิ่งหากคุณใช้เป็นเอนทิตีที่เชื่อมโยง เนื่องจากกลไกการคํานวณแคชข้อมูลนั้นเพื่อใช้ดาวน์สตรีม ข้อมูลที่แคชไว้ไม่จําเป็นต้องรีเฟรชหลายครั้งในกระแสข้อมูลเดียวกัน สถานการณ์นี้ยังเหมาะอย่างยิ่งหากคุณต้องการใช้สําหรับ DirectQuery

เมื่อแคช ผลกระทบด้านประสิทธิภาพในการนําเข้าเริ่มต้นจะจ่ายในภายหลังในกระแสข้อมูลเดียวกันหรือในกระแสข้อมูลอื่นในพื้นที่ทํางานเดียวกัน

หากคุณมีระยะเวลานานสําหรับเอนทิตี ให้พิจารณาปิดกลไกการคํานวณ เมื่อต้องการแคชเอนทิตี Power BI จะเขียนไปยังที่เก็บข้อมูลและไปยัง SQL ถ้าเป็นเอนทิตีแบบใช้ครั้งเดียว ประโยชน์ด้านประสิทธิภาพสําหรับผู้ใช้อาจไม่คุ้มกับบทลงโทษของการนําเข้าซ้ําซ้อน

พับ - พับหมายความว่ากระแสข้อมูลสามารถใช้การประมวลผล SQL เพื่ออ่านข้อมูลได้ เอนทิตีจากการคํานวณใช้ตารางจาก SQL เพื่ออ่านข้อมูล และ SQL ที่ใช้เกี่ยวข้องกับโครงสร้างของคิวรี

สถานะ พับ จะปรากฏขึ้นถ้าคุณกําลังใช้แหล่งข้อมูลภายในองค์กรหรือระบบคลาวด์ คุณโหลดข้อมูลลงในกระแสข้อมูลการจัดเตรียมเป็นครั้งแรก และอ้างอิงข้อมูลนั้นในกระแสข้อมูลนี้ สถานะนี้ใช้กับเอนทิตีที่อ้างอิงเอนทิตีอื่นเท่านั้น หมายความว่าการสืบค้นของคุณถูกเรียกใช้บนกลไก SQL และมีศักยภาพในการปรับปรุงด้วยการประมวลผล SQL เพื่อให้แน่ใจว่ากลไกจัดการ SQL ประมวลผลการแปลงของคุณ ให้ใช้การแปลงที่สนับสนุนการพับ SQL เช่น การดําเนินการผสาน (รวม) จัดกลุ่มตาม (การรวม) และผนวก (ผนวก) ในตัวแก้ไขคิวรี

แคช + พับ - เมื่อคุณเห็นแคช + พับ มีแนวโน้มว่าการรีเฟรชข้อมูลได้รับการปรับให้เหมาะสม เนื่องจากคุณมีเอนทิตีที่อ้างอิงเอนทิตีอื่นและอ้างอิงโดยเอนทิตีอื่นอัปสตรีม การดําเนินการนี้ยังทํางานบนด้านบนของ SQL และด้วยเหตุนี้จึงมีศักยภาพในการปรับปรุงด้วยการประมวลผล SQL เพื่อให้แน่ใจว่าคุณได้รับประสิทธิภาพที่ดีที่สุดเท่าที่จะเป็นไปได้ ให้ใช้การแปลงที่สนับสนุนการพับ SQL เช่น การดําเนินการผสาน (รวม) จัดกลุ่มตาม (การรวม) และผนวก (ผนวก) ในตัวแก้ไขคิวรี

คําแนะนําสําหรับการเพิ่มประสิทธิภาพกลไกการคํานวณ

ขั้นตอนต่อไปนี้ช่วยให้ปริมาณงานสามารถทริกเกอร์กลไกการคํานวณ และด้วยเหตุนี้ จึงปรับปรุงประสิทธิภาพการทํางานอยู่เสมอ

เอนทิตีที่คํานวณและเชื่อมโยงในพื้นที่ทํางานเดียวกัน:

สําหรับการ นําเข้า ให้มุ่งเน้นไปที่การรับข้อมูลเข้าสู่ที่เก็บข้อมูลโดยเร็วที่สุด และใช้ตัวกรองเฉพาะเมื่อลดขนาดแบบจําลองความหมายโดยรวม แยกตรรกะการแปลงของคุณออกจากขั้นตอนนี้ จากนั้น แยกการแปลงและตรรกะทางธุรกิจของคุณออกเป็นกระแสข้อมูลแยกต่างหากในพื้นที่ทํางานเดียวกัน ใช้เอนทิตีที่เชื่อมโยงหรือคํานวณ การทําเช่นนี้ช่วยให้เอ็นจิ้นสามารถเปิดใช้งานและเร่งการคํานวณของคุณได้ สําหรับการเปรียบเทียบง่ายๆ ก็เหมือนกับการเตรียมอาหารในครัว: การเตรียมอาหารมักเป็นขั้นตอนที่แยกจากกันและแตกต่างจากการรวบรวมวัตถุดิบของคุณ และเป็นข้อกําหนดเบื้องต้นสําหรับการใส่อาหารในเตาอบ ในทํานองเดียวกัน คุณต้องเตรียมตรรกะของคุณแยกต่างหากก่อนจึงจะสามารถใช้ประโยชน์จากกลไกการคํานวณได้

ตรวจสอบให้แน่ใจว่าคุณได้ดําเนินการที่พับ เช่น การผสาน การรวม การแปลง และอื่นๆ

นอกจากนี้ ให้สร้างกระแสข้อมูลภายในแนวทางและข้อจํากัดที่เผยแพร่

เมื่อกลไกการคํานวณเปิดอยู่ แต่ประสิทธิภาพการทํางานช้า:

ทําตามขั้นตอนต่อไปนี้เมื่อตรวจสอบสถานการณ์ที่กลไกการคํานวณเปิดอยู่ แต่คุณเห็นประสิทธิภาพต่ํา:

  • จํากัดเอนทิตีที่คํานวณและเชื่อมโยงที่มีอยู่ทั่วทั้งพื้นที่ทํางาน
  • หากการรีเฟรชเริ่มต้นของคุณเปิดอยู่กับกลไกการคํานวณ ข้อมูลจะถูกเขียนในที่จัดเก็บข้อมูลดิบ และ ในแคช การเขียนสองครั้งนี้ส่งผลให้การรีเฟรชช้าลง
  • หากคุณมีกระแสข้อมูลที่เชื่อมโยงกับกระแสข้อมูลหลายกระแส ให้แน่ใจว่าคุณได้กําหนดเวลาการรีเฟรชกระแสข้อมูลต้นทางเพื่อไม่ให้รีเฟรชกระแสข้อมูลทั้งหมดพร้อมกัน

ข้อควรพิจารณาและข้อจำกัด

สิทธิ์การใช้งาน Power BI Pro มีขีดจํากัดการรีเฟรชกระแสข้อมูลที่ 8 การรีเฟรชต่อวัน