หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
คุณลักษณะพาร์ติชันในตารางเลคเฮ้าส์เป็นปลายทางมีความสามารถในการโหลดข้อมูลไปยังตาราง Lakehouse ที่มีพาร์ติชัน พาร์ติชันจะถูกสร้างขึ้นในปลายทางของ Lakehouse และจากนั้นได้รับประโยชน์จากงานหรือปริมาณการใช้ปลายน้ํา
บทช่วยสอนนี้ช่วยให้คุณเรียนรู้วิธีโหลดข้อมูลไปยัง Lakehouse โดยใช้พาร์ติชันในไปป์ไลน์ ตัวอย่างเช่น คุณโหลดชุดข้อมูลตัวอย่างลงใน Lakehouse โดยใช้หนึ่งหรือหลายคอลัมน์พาร์ติชันโดยทําตามขั้นตอนต่อไปนี้ ชุดข้อมูลตัวอย่าง วันหยุดราชการ ถูกใช้เป็นข้อมูลตัวอย่าง
ข้อกำหนดเบื้องต้น
- ตรวจสอบให้แน่ใจว่า คุณมีพื้นที่ทํางานที่เปิดใช้งาน Project Microsoft Fabric: สร้างพื้นที่ทํางาน
สร้างไปป์ไลน์
นําทางไปยัง Power BI
เลือกไอคอน Power BI ที่ด้านล่างซ้ายของหน้าจอ จากนั้นเลือก แฟบริก เพื่อเปิดหน้าแรกของ Data Factory
นําทางไปยังพื้นที่ทํางาน Microsoft Fabric ของคุณ ถ้าคุณสร้างพื้นที่ทํางานใหม่ในส่วนข้อกําหนดเบื้องต้นก่อนหน้า ให้ใช้พื้นที่ทํางานนี้
เลือก + รายการใหม่
ค้นหาและเลือก ไปป์ไลน์ แล้วป้อนชื่อไปป์ไลน์เพื่อสร้างไปป์ไลน์ใหม่ เพื่อสร้างไปป์ไลน์ใหม่
โหลดข้อมูลไปยัง Lakehouse โดยใช้คอลัมน์พาร์ติชัน
เปิดไปป์ไลน์ของคุณและเพิ่มกิจกรรมการคัดลอกโดยเลือก กิจกรรมไปป์ไลน์ ->คัดลอกข้อมูล ภายใต้ แหล่งที่มา ให้เลือก เพิ่มเติม ที่ด้านล่างของรายการการเชื่อมต่อ จากนั้นเลือก วันหยุดนักขัตฤกษ์ ภายใต้ แท็บ ข้อมูลตัวอย่าง
ภายใต้แท็บปลายทาง ให้เลือกเพิ่มเติมที่ด้านล่างของรายการการเชื่อมต่อจากนั้นเลือกแท็บเลคเฮาส์ที่มีอยู่ใน OneLake ระบุเลคเฮาส์ของคุณหรือสร้างเลคเฮาส์ใหม่ในแท็บหน้าแรก เลือก ตาราง ในโฟลเดอร์ราก และระบุชื่อตารางของคุณ
ขยาย ขั้นสูง ใน การดําเนินการ ตาราง เลือก เขียนทับ จากนั้นเลือก เปิดใช้งานพาร์ติชัน ภายใต้ คอลัมน์ พาร์ติชัน เลือก เพิ่มคอลัมน์ และเลือกคอลัมน์ที่คุณต้องการใช้เป็นคอลัมน์พาร์ติชัน คุณสามารถเลือกที่จะใช้คอลัมน์เดียวหรือหลายคอลัมน์เป็นคอลัมน์พาร์ติชันได้
ถ้าคุณใช้คอลัมน์ เดียว countryOrRegion (ชนิดสตริง) จะถูกเลือกเป็นตัวอย่างในบทช่วยสอนนี้ ข้อมูลจะถูกแบ่งพาร์ติชันด้วยค่าคอลัมน์ที่แตกต่างกัน
หมายเหตุ
คอลัมน์พาร์ติชันที่สามารถเลือกได้ควรเป็นสตริง จํานวนเต็ม บูลีน และชนิดวันที่เวลา คอลัมน์ของชนิดข้อมูลอื่นๆ จะไม่แสดงในรายการดรอปดาวน์
ถ้าคุณใช้คอลัมน์หลายพาร์ติชัน ให้เพิ่มคอลัมน์อีกหนึ่งคอลัมน์และเลือก คือ PaidTimeOff ซึ่งเป็นชนิดบูลีนเป็นตัวอย่าง จากนั้นเรียกใช้ไปป์ไลน์ ตรรกะคือตารางได้รับการแบ่งพาร์ติชันโดยค่าคอลัมน์ที่เพิ่มครั้งแรกก่อน จากนั้นก็ยังคงแบ่งพาร์ติชันข้อมูลตามค่าคอลัมน์ที่เพิ่มครั้งที่สอง
เคล็ดลับ
คุณสามารถลากคอลัมน์เพื่อเปลี่ยนลําดับของคอลัมน์ และลําดับพาร์ติชันจะเปลี่ยนแปลง
เลือก เรียกใช้ และเลือก บันทึก และเรียกใช้เพื่อเรียกใช้ไปป์ไลน์
หลังจากเรียกใช้ไปป์ไลน์เรียบร้อยแล้วให้ไปที่เลคเฮ้าส์ของคุณ ค้นหาตารางที่คุณคัดลอกไว้ คลิกขวาที่ชื่อตารางและเลือก ดูไฟล์
สําหรับคอลัมน์พาร์ติชันหนึ่งคอลัมน์ (countryOrRegion) ตารางจะถูกแบ่งพาร์ติชันไปยังโฟลเดอร์ที่แตกต่างกันตามชื่อประเทศหรือภูมิภาค มีการเข้ารหัสอักขระพิเศษในชื่อคอลัมน์ และคุณอาจเห็นชื่อไฟล์แตกต่างจากค่าของคอลัมน์เมื่อคุณดูไฟล์ใน Lakehouse
สําหรับคอลัมน์หลายพาร์ติชัน คุณพบว่าตารางถูกแบ่งออกเป็นโฟลเดอร์ต่าง ๆ ตามชื่อประเทศหรือภูมิภาค
เลือกหนึ่งโฟลเดอร์ ตัวอย่างเช่น contryOrRegion=United States ตารางที่มีพาร์ติชันตามชื่อประเทศหรือภูมิภาคจะถูกแบ่งพาร์ติชันอีกครั้งโดยคอลัมน์ที่สองที่เพิ่มเข้ามาคือค่าของ PaidTimeOff:
TrueหรือFalse__HIVE_DEFAULT_PARTITION__(แสดงค่าว่างในชุดข้อมูลตัวอย่าง)ในทํานองเดียวกัน ถ้าคุณเพิ่มสามคอลัมน์ลงในพาร์ติชันตาราง คุณจะได้รับโฟลเดอร์ระดับที่สองที่แบ่งพาร์ติชันโดยคอลัมน์ที่สามเพิ่ม
เนื้อหาที่เกี่ยวข้อง
ถัดไป กรุณาเรียนรู้เพิ่มเติมเกี่ยวกับการคัดลอกจาก Azure Blob Storage ไปยัง Lakehouse