แชร์ผ่าน


บทช่วยสอน: ใช้โน้ตบุ๊ค Fabric ที่มี Kqlmagic เพื่อคิวรีฐานข้อมูล KQL

สมุดบันทึกสําหรับผ้าช่วยให้คุณสามารถสร้างและแชร์เอกสารที่มีโค้ดสด สมการ การแสดงภาพ และข้อความคําบรรยาย ซึ่งมีประโยชน์สําหรับงานหลายอย่าง เช่น การทําความสะอาดและการแปลงข้อมูล การจําลองเชิงตัวเลข การสร้างแบบจําลองเชิงสถิติ การจัดรูปแบบข้อมูล และการเรียนรู้ของเครื่อง

Kqlmagic เพิ่มขีดความสามารถของเคอร์เนล Python ในโน้ตบุ๊ค Fabric เพื่อให้คุณสามารถเรียกใช้คิวรี Kusto Query Language (KQL) ได้ตั้งแต่เริ่มต้นจากเซลล์สมุดบันทึก คุณสามารถรวม Python และ KQL เพื่อคิวรีและแสดงข้อมูลด้วยภาพโดยใช้ไลบรารี Plotly ที่สมบูรณ์ซึ่งรวมเข้ากับตัวดําเนินการแสดงผล

สําหรับข้อมูลเพิ่มเติมเกี่ยวกับสมุดบันทึก ดู วิธีการใช้สมุดบันทึก Microsoft Fabric

ในบทช่วยสอนนี้ คุณจะได้เรียนรู้วิธีการใช้ Kqlmagic เพื่อเรียกใช้คิวรีขั้นสูงและการแสดงภาพจากข้อมูลในฐานข้อมูล KQL ใช้ชุดข้อมูลและสมุดบันทึกที่สร้างไว้ล่วงหน้าทั้งใน Real-Time Intelligence และสภาพแวดล้อม Data Engineering ใน Microsoft Fabric

ในบทช่วยสอนนี้ คุณจะเรียนรู้วิธีการ:

  • สร้างฐานข้อมูล KQL
  • รับ ข้อมูล
  • นําเข้าสมุดบันทึกด้วย Kqlmagic
  • เรียกใช้สมุดบันทึก

ข้อกําหนดเบื้องต้น

  • พื้นที่ทํางานที่มีความจุที่เปิดใช้งาน Microsoft Fabric
  • ฐานข้อมูล KQL ที่มีสิทธิ์ในการแก้ไข

1. สร้างฐานข้อมูล KQL

ในขั้นตอนนี้ คุณสร้างฐานข้อมูล KQL เปล่าที่ชื่อว่า NYCTaxiDB ในพื้นที่ทํางานของคุณหรือใน Eventhouse ที่มีอยู่

  1. เลือกพื้นที่ทํางานของคุณจากแถบนําทางด้านซ้าย

  2. ทําตามหนึ่งในขั้นตอนเหล่านี้เพื่อเริ่มสร้างฐานข้อมูล KQL:

    • เลือก รายการใหม่ จากนั้น Eventhouse ในเขตข้อมูล ชื่อเหตุการณ์ ให้ใส่ NYCTaxiDB จากนั้นเลือก สร้าง มีการสร้างฐานข้อมูล KQL โดยใช้ชื่อเดียวกัน
    • ในอีเวนต์เฮ้าส์ที่มีอยู่ ให้เลือก ฐานข้อมูล ภายใต้ฐานข้อมูล KQL เลือก +ในเขตข้อมูล ชื่อฐานข้อมูล KQL ใส่ NYCTaxiDB จากนั้นเลือก สร้าง
  3. เลือกฐานข้อมูล NYCTaxiDB ขยาย รายละเอียดฐานข้อมูล คัดลอก URI คิวรี และวางไว้ที่ใดที่หนึ่ง เช่น notepad เพื่อใช้ในขั้นตอนต่อไป

     สกรีนช็อตของการ์ดรายละเอียดฐานข้อมูลที่แสดงรายละเอียดฐานข้อมูล ตัวเลือก URI คิวรีที่ชื่อว่าคัดลอก URI จะถูกเน้น

2. รับข้อมูล

ในขั้นตอนนี้ คุณจะใช้สคริปต์เพื่อสร้างตารางที่มีการแมปที่ระบุก่อน แล้วรับข้อมูลจาก blob สาธารณะลงในตารางนี้

  1. คัดลอกสคริปต์ KQL จาก ที่เก็บตัวอย่าง Fabric บน GitHub

    ภาพหน้าจอของที่เก็บ GitHub ที่แสดงสคริปต์ KQL สําหรับสมุดบันทึกการสาธิต NYC Taxi ไอคอนคัดลอกจะถูกเน้นไว้

  2. เรียกดูฐานข้อมูล KQL ของคุณ

  3. เลือกคิวรีพร้อมรหัสเพื่อเปิดแท็บว่างใน NYCTaxiDB_queryset

  4. วางสคริปต์ KQL จากขั้นตอนที่ 1 และเลือกปุ่ม เรียกใช้

    คิวรีแรกจะสร้างการแมปตารางและการแมป Schema ผลลัพธ์ของคิวรีนี้แสดงข้อมูลการสร้างตารางและการแมป รวมถึงชนิดของคําสั่งและผลลัพธ์ของ เสร็จสมบูรณ์ เมื่อเสร็จสิ้น คิวรีที่สองจะโหลดข้อมูลของคุณ ซึ่งอาจใช้เวลาสักครู่ในการโหลดข้อมูลให้เสร็จสมบูรณ์

    ภาพหน้าจอของหน้าต่างชุดคิวรีที่แสดงสถานะที่เสร็จสมบูรณ์ของการแมปตารางและการนําเข้าข้อมูล

  5. รีเฟรชชุดคิวรีและเลือก ตาราง เพื่อดูภาพรวมของตารางที่สร้างขึ้นใหม่ที่ชื่อว่า trips2 จากที่นี่ คุณสามารถขยายสคีมาของตาราง แสดงตัวอย่างข้อมูล และดูข้อมูลเชิงลึกของคิวรีได้

    ภาพหน้าจอของแท็บตารางที่แสดงตาราง trips2

3. ดาวน์โหลดสมุดสาธิต NYC Taxi

ใช้สมุดบันทึกตัวอย่างเพื่อคิวรีและแสดงข้อมูลตัวอย่างที่คุณโหลดในฐานข้อมูล KQL ของคุณ

  1. เปิดที่เก็บตัวอย่าง Fabric บน GitHub และดาวน์โหลดสมุดบันทึก KQL ของ NYC Taxi

    ภาพหน้าจอของที่เก็บ GitHub ที่แสดงสมุดบันทึกสาธิต NYC Taxi ตัวเลือกที่ชื่อว่า Raw จะถูกเน้น

  2. ดาวน์โหลดสมุดบันทึกภายในเครื่องลงในอุปกรณ์ของคุณ

    หมายเหตุ

    สมุดบันทึกต้องถูกบันทึกในรูปแบบ .ipynb แฟ้ม

4. นําเข้าสมุดบันทึก

ส่วนที่เหลือของเวิร์กโฟลว์นี้ใช้ Kqlmagic เพื่อคิวรีและแสดงข้อมูลในฐานข้อมูล KQL ของคุณ

  1. ในพื้นที่ทํางานของคุณ เลือกนําเข้า>สมุดบันทึก<จากคอมพิวเตอร์เครื่องนี้

    ภาพหน้าจอของตัวเลือกรายการในวิศวกรรมข้อมูล รายการที่ชื่อว่านําเข้าสมุดบันทึกจะถูกเน้นไว้

  2. ในบานหน้าต่าง สถานะการนําเข้า ให้เลือก อัปโหลด

    ภาพหน้าจอของหน้าต่างสถานะการนําเข้า ปุ่มที่ชื่อว่า อัปโหลด จะถูกไฮไลต์ไว้

  3. เลือกสมุดบันทึก KQL แท็กซี่ของ NYC ที่คุณดาวน์โหลดในขั้นตอนที่ 3

  4. เมื่อนําเข้าเสร็จสมบูรณ์แล้ว ให้เลือก ไปยังพื้นที่ทํางาน และเปิดสมุดบันทึกนี้

    สกรีนช็อตของการอัปโหลดเสร็จสมบูรณ์แล้วและไปยังพื้นที่ทํางาน

5. เรียกใช้สมุดบันทึก

เลือกปุ่มเล่นเพื่อเรียกใช้แต่ละเซลล์ตามลําดับ หรือเลือกเซลล์และกด Shift+ Enter ทําซ้ําขั้นตอนนี้สําหรับแต่ละแพคเกจ

หมายเหตุ

รอให้เครื่องหมายถูกเสร็จสมบูรณ์ปรากฏขึ้นก่อนที่จะเรียกใช้เซลล์ถัดไป

ภาพหน้าจอของบล็อกเซลล์ที่แสดงคําสั่งนําเข้า ปุ่ม เล่น จะถูกเน้นไว้

เรียกใช้เซลล์ที่เหลือตามลําดับเพื่อสร้างแผนที่ความร้อนของรถแท็กซี่ NYC สําหรับข้อมูลเพิ่มเติมเกี่ยวกับ Kqlmagic ดู ใช้สมุดบันทึก Jupyter และส่วนขยาย Kqlmagic เพื่อวิเคราะห์ข้อมูล

  1. เซลล์ต่อไปนี้รวมบริการรับของทั้งหมดภายในขอบเขตทางภูมิศาสตร์ที่ระบุ

    ภาพหน้าจอของเซลล์โค้ดที่แสดงคิวรีการรวม

  2. เรียกใช้เซลล์ต่อไปนี้เพื่อวาดแผนที่ความร้อนของรถแท็กซี่ NYC

    ภาพหน้าจอของเซลล์โค้ดที่แสดงคิวรีเพื่อสร้างแผนที่ความร้อน

    ในแผนที่ความร้อนที่เกิดขึ้นคุณจะเห็นว่ารถแท็กซี่ส่วนใหญ่อยู่ในบริเวณแมนฮัตตันตอนล่าง นอกจากนี้ยังมีบริการรถแท็กซี่จํานวนมากที่สนามบิน JFK และ La Guardia อีกด้วย

    ภาพหน้าจอของสมุดบันทึกที่แสดงแผนที่ความร้อนของบริการรับรถแท็กซี่ของ NYC

6. ล้างข้อมูล

ล้างรายการที่สร้างขึ้นโดยการนําทางไปยังพื้นที่ทํางานที่สร้างขึ้น

  1. ในพื้นที่ทํางานของคุณ ให้วางเมาส์เหนือสมุดบันทึกที่คุณต้องการลบ เลือกเมนู เพิ่มเติม [...] >ลบ

    ภาพหน้าจอของพื้นที่ทํางานที่แสดงเมนูดรอปดาวน์ของสมุดบันทึกแท็กซี่ของ NYC ตัวเลือกที่ชื่อว่า ลบ จะถูกเน้น

  2. เลือกลบ คุณไม่สามารถกู้คืนสมุดบันทึกของคุณได้เมื่อคุณลบสมุดบันทึกนั้น