หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
บทช่วยสอนนี้ช่วยให้คุณเร่งกระบวนการประเมินผลสําหรับ Data Factory ใน Microsoft Fabric โดยให้ขั้นตอนสําหรับสถานการณ์การรวมข้อมูลเต็มรูปแบบภายในหนึ่งชั่วโมง ในตอนท้ายของบทช่วยสอนนี้ คุณเข้าใจค่าและความสามารถที่สําคัญของ Data Factory และทราบวิธีการเสร็จสิ้นสถานการณ์การรวมข้อมูลแบบ end-to-end ทั่วไป
สถานการณ์แบ่งออกเป็นบทนําและสามโมดูล:
- บทนํา สู่บทช่วยสอนและทําไมคุณควรใช้ Data Factory ใน Microsoft Fabric
- โมดูล 1: สร้างไปป์ไลน์ที่มี Data Factory เพื่อนําเข้าข้อมูลดิบจากที่เก็บข้อมูล Blob ไปยังตารางชั้นข้อมูล ทองแดง ใน data Lakehouse
- โมดูล 2: แปลงข้อมูลด้วยกระแสข้อมูลใน Data Factory เพื่อประมวลผลข้อมูลดิบจากตาราง ทองแดง ของคุณและย้ายไปยังตารางชั้นข้อมูล ทอง ใน data Lakehouse
- โมดูล 3: เสร็จสิ้นการเดินทางของการรวมข้อมูลแรกของคุณและ ส่งอีเมลเพื่อแจ้งให้คุณทราบเมื่องานทั้งหมดเสร็จสมบูรณ์และสุดท้ายตั้งค่าโฟลว์ทั้งหมดเพื่อเรียกใช้ตามกําหนดเวลา
ทําไมต้องเป็น Data Factory ใน Microsoft Fabric?
Microsoft Fabric มีแพลตฟอร์มเดียวสําหรับความต้องการวิเคราะห์ทั้งหมดขององค์กร ครอบคลุมถึงการสเปกตรัมของการวิเคราะห์ รวมถึงการเคลื่อนย้ายข้อมูล ที่จัดเก็บข้อมูลทะเลสาบ วิศวกรรมข้อมูล การรวมข้อมูล วิทยาศาสตร์ข้อมูล การวิเคราะห์แบบเรียลไทม์ และข่าวกรองธุรกิจ ด้วย Fabric ไม่จําเป็นต้องเย็บรวมบริการที่แตกต่างกันจากผู้ขายหลายราย แต่ผู้ใช้ของคุณจะเพลิดเพลินไปกับผลิตภัณฑ์ที่ครอบคลุมซึ่งเข้าใจง่ายสร้างออนบอร์ดและใช้งาน
Data Factory in Fabric ผสานรวม Power Query ที่ใช้งานง่ายด้วยมาตราส่วนและพลังของ Azure Data Factory ซึ่งนําสิ่งที่ดีที่สุดของทั้งสองผลิตภัณฑ์มารวมกันเป็นประสบการณ์เดียว เป้าหมายคือสําหรับนักพัฒนาข้อมูลทั้งพลเมืองและมืออาชีพที่มีเครื่องมือการผสานรวมข้อมูลที่ถูกต้อง Data Factory ให้การเตรียมข้อมูลและการแปลงข้อมูลที่เปิดใช้งาน AI ในรหัสต่ํา การแปลงข้อมูลแบบ petabyte และตัวเชื่อมต่อหลายร้อยรายการที่มีการเชื่อมต่อแบบไฮบริดและมัลติคลาวด์
คุณสมบัติหลักสามประการของ Data Factory
- การนําเข้าข้อมูล: กิจกรรมการคัดลอกในไปป์ไลน์ (หรือ งานคัดลอกแบบสแตนด์อโลน) ช่วยให้คุณย้ายข้อมูลระดับเพตะไบต์จากแหล่งข้อมูลหลายร้อยแหล่งลงใน Data Lakehouse ของคุณสําหรับการประมวลผลเพิ่มเติม
- การแปลงและเตรียมการข้อมูล: Dataflow Gen2 มีอินเทอร์เฟสแบบ Low-code สําหรับการแปลงข้อมูลของคุณโดยใช้การแปลงข้อมูลมากกว่า 300+ รายการ โดยมีความสามารถในการโหลดผลลัพธ์ที่แปลงแล้วลงในปลายทางหลายแห่ง เช่น ฐานข้อมูล Azure SQL, Lakehouse และอื่นๆ
- ระบบอัตโนมัติแบบครบวงจร: ไปป์ไลน์ให้การจัดเรียงของกิจกรรมที่มีการทําสําเนา กระแสข้อมูล และกิจกรรมสมุดบันทึกและอื่นๆ กิจกรรมในไปป์ไลน์สามารถเชื่อมโยงเข้าด้วยกันเพื่อดําเนินการตามลําดับ หรือสามารถดําเนินการได้อย่างอิสระควบคู่กัน โฟลว์การรวมข้อมูลของคุณทั้งหมดจะทํางานโดยอัตโนมัติ และสามารถตรวจสอบได้ในที่เดียว
สถาปัตยกรรมของบทช่วยสอน
ในอีก 50 นาทีข้างหน้า คุณจะได้เรียนรู้ผ่านคุณลักษณะหลักทั้งสามของ Data Factory เมื่อคุณเสร็จสิ้นสถานการณ์การรวมข้อมูลแบบ end-to-end
สถานการณ์สมมติจะแบ่งออกเป็นสามโมดูล:
- โมดูล 1: สร้างไปป์ไลน์ที่มี Data Factory เพื่อนําเข้าข้อมูลดิบจากที่เก็บข้อมูล Blob ไปยังตารางชั้นข้อมูล ทองแดง ใน data Lakehouse
- โมดูล 2: แปลงข้อมูลด้วยกระแสข้อมูลใน Data Factory เพื่อประมวลผลข้อมูลดิบจากตาราง ทองแดง ของคุณและย้ายไปยังตารางชั้นข้อมูล ทอง ใน data Lakehouse
- โมดูล 3: เสร็จสิ้นการเดินทางของการรวมข้อมูลแรกของคุณและ ส่งอีเมลเพื่อแจ้งให้คุณทราบเมื่องานทั้งหมดเสร็จสมบูรณ์และสุดท้ายตั้งค่าโฟลว์ทั้งหมดเพื่อเรียกใช้ตามกําหนดเวลา
คุณใช้ชุดข้อมูลตัวอย่าง NYC-Taxi เป็นแหล่งข้อมูลสําหรับบทช่วยสอน หลังจากที่คุณทําเสร็จแล้ว คุณจะสามารถรับข้อมูลเชิงลึกเกี่ยวกับส่วนลดรายวันสําหรับค่าโดยสารรถแท็กซี่สําหรับระยะเวลาที่กําหนดโดยใช้ Data Factory ใน Microsoft Fabric
ขั้นตอนต่อไป
ดําเนินการต่อในส่วนถัดไปเพื่อสร้างไปป์ไลน์ของคุณ
โมดูล 1: สร้างไปป์ไลน์ด้วย Data Factory