แชร์ผ่าน


การวางแผนการโยกย้ายสําหรับ Azure Data Factory ไปยัง Fabric Data Factory

Microsoft Fabric รวบรวมเครื่องมือวิเคราะห์ของ Microsoft ไว้ในแพลตฟอร์ม SaaS เดียว มีความสามารถที่แข็งแกร่งสําหรับการประสานเวิร์กโฟลว์ การเคลื่อนย้ายข้อมูล การจําลองแบบ และการแปลงตามขนาด Fabric Data Factory มีสภาพแวดล้อม SaaS ที่สร้างขึ้นบน Azure Data Factory (ADF) PaaS ผ่านการปรับปรุงที่ใช้งานง่ายและฟังก์ชันพิเศษ ทําให้ Fabric Data Factory เป็นการปรับปรุงโซลูชันการรวมข้อมูลที่มีอยู่ของคุณให้ทันสมัยอย่างสมบูรณ์แบบ

คู่มือนี้แสดงกลยุทธ์การโยกย้าย ข้อควรพิจารณา และแนวทางที่จะช่วยคุณย้ายจาก Azure Data Factory ไปยัง Fabric Data Factory

ทําไมต้องย้ายข้อมูล

การโยกย้ายจากไปป์ไลน์ ADF และ Synapse ไปยัง Fabric Data Factory เป็นมากกว่าการยกและเปลี่ยน: เป็นโอกาสในการลดความซับซ้อนของการกํากับดูแล กําหนดมาตรฐานรูปแบบ และใช้คุณสมบัติขั้นสูงของ Fabric Data Factory เพื่อปรับปรุงกลยุทธ์การรวมข้อมูลของคุณ

Fabric มีคุณสมบัติใหม่มากมาย ได้แก่:

  • กิจกรรมไปป์ไลน์แบบบูรณาการ เช่น อีเมล และ Teams สําหรับการกําหนดเส้นทางข้อความ
  • CI/CD ในตัว (ไปป์ไลน์การปรับใช้) โดยไม่ต้องพึ่งพา Git ภายนอก
  • การผสานรวมพื้นที่ทํางานที่ราบรื่นกับ OneLake, Warehouse และ Lakehouse สําหรับการวิเคราะห์แบบครบวงจร
  • โมเดลข้อมูลความหมายที่คล่องตัว จะรีเฟรชที่ ปรับขนาดเพื่อตอบสนองความต้องการทั้งแบบบริการตนเองและข้อมูลขององค์กร
  • ความสามารถ AI ในตัวพร้อม Copilot เพื่อช่วยคุณสร้างและจัดการไปป์ไลน์

สําหรับการเปรียบเทียบโดยละเอียด โปรดดู คู่มือการเปรียบเทียบ Azure Data Factory และ Fabric Data Factory

ความแตกต่างทางสถาปัตยกรรมที่สําคัญ

ก่อนที่คุณจะโยกย้ายจาก Azure Data Factory ไปยัง Fabric Data Factory ให้พิจารณาความแตกต่างทางสถาปัตยกรรมที่สําคัญเหล่านี้ซึ่งมีแนวโน้มที่จะมีผลกระทบมากที่สุดต่อการวางแผนการโยกย้าย:

ประเภท โรงงานข้อมูล Azure โรงงานข้อมูลผ้า ผลกระทบจากการย้ายถิ่นฐาน
รหัสที่กําหนดเอง กิจกรรมที่กําหนดเอง กิจกรรม Azure Batch ชื่อกิจกรรมแตกต่างกัน แต่สนับสนุนฟังก์ชันการทํางานเดียวกัน
กระแสข้อมูล การแมปโฟลว์ข้อมูล (ตาม Spark) กระแสข้อมูล Gen2 (กลไกจัดการ Power Query) พร้อม การคัดลอกที่รวดเร็ว และ ปลายทางหลายแห่ง กลไกและความสามารถการเปลี่ยนแปลงที่แตกต่างกัน ดู คําแนะนําเกี่ยวกับกระแสข้อมูลสําหรับผู้ใช้การแมปโฟลว์ข้อมูล สําหรับข้อมูลเพิ่มเติม
ชุดข้อมูล แยกออบเจ็กต์ชุดข้อมูลที่นํากลับมาใช้ใหม่ได้ คุณสมบัติถูกกําหนดแบบอินไลน์ภายในกิจกรรม เมื่อคุณแปลงจาก ADF เป็น Fabric ข้อมูล 'ชุดข้อมูล' จะอยู่ในแต่ละกิจกรรม
การเชื่อมต่อแบบไดนามิก คุณสมบัติบริการที่เชื่อมโยงสามารถเป็นแบบไดนามิกได้โดยใช้พารามิเตอร์ การเชื่อมต่อ poperty ไม่สนับสนุนคุณสมบัติแบบไดนามิก แต่กิจกรรมไปป์ไลน์สามารถใช้เนื้อหาแบบไดนามิกสําหรับออบเจ็กต์การเชื่อมต่อ สําหรับโซลูชันที่ใช้สถาปัตยกรรมที่ขับเคลื่อนด้วยข้อมูลเมตาที่อาศัยการเชื่อมต่อที่มีพารามิเตอร์ ให้กําหนดพารามิเตอร์ออบเจ็กต์การเชื่อมต่อใน Fabric
พารามิเตอร์ส่วนกลาง พารามิเตอร์ส่วนกลาง ห้องสมุดตัวแปรผ้า รูปแบบการใช้งานและประเภทข้อมูลที่แตกต่างกัน แม้ว่าเราจะมีคู่มือการโยกย้าย
กิจกรรม HDInsight ห้ากิจกรรมแยกกัน (Hive, Pig, MapReduce, Spark, Streaming) กิจกรรม HDInsight เดียว คุณต้องการกิจกรรมเพียงชนิดเดียวเมื่อแปลง แต่รองรับฟังก์ชันทั้งหมด
ข้อมูลประจําตัวของ ข้อมูลเฉพาะตัวที่มีการจัดการ เอกลักษณ์พื้นที่ทํางานแบบ Fabric โมเดลอัตลักษณ์ที่แตกต่างกัน โดยต้องมีการวางแผนบางอย่างเพื่อเปลี่ยนไป
ชุดเก็บคีย์ของ การผสานรวมกับการตรวจสอบสิทธิ์ทุกประเภท การผสานรวมที่จํากัดผ่าน Fabric Key Vault Reference เปรียบเทียบ แหล่งที่มาของ Key Vault ที่รองรับในปัจจุบันและการรับรองความถูกต้อง กับการกําหนดค่าที่มีอยู่ของคุณ
การดําเนินการไปป์ไลน์ ดําเนินการกิจกรรมไปป์ไลน์ เรียกใช้กิจกรรมไปป์ไลน์ ด้วยชนิดการเชื่อมต่อ FabricDataPipeline ชื่อกิจกรรมและข้อกําหนดการเชื่อมต่อจะเปลี่ยนไปเมื่อทําการแปลง
การจัดตารางเวลา ทริกเกอร์เดียวสําหรับไปป์ไลน์จํานวนมากหรือทริกเกอร์หลายรายการต่อไปป์ไลน์ด้วยการจัดการแบบรวมศูนย์ หนึ่งกําหนดการต่อไปป์ไลน์หรือหลายกําหนดการต่อไปป์ไลน์โดยไม่มีการนํากลับมาใช้ใหม่ตามกําหนดการหรือฮับส่วนกลาง ปัจจุบัน Fabric ต้องการการจัดการกําหนดการต่อไปป์ไลน์

เส้นทางการย้ายข้อมูล

เส้นทางการย้ายข้อมูลจะขึ้นอยู่กับเนื้อหา ADF และความเท่าเทียมกันของคุณสมบัติ ตัวเลือกได้แก่:

รายการ Azure Data Factory ในพื้นที่ทํางาน Fabric ของคุณ

การเพิ่ม ADF ที่มีอยู่ไปยังพื้นที่ทํางาน Fabric ของคุณ จะช่วยให้คุณมองเห็นและกํากับดูแลได้ทันทีในขณะที่คุณย้ายข้อมูลทีละน้อย เหมาะอย่างยิ่งสําหรับการค้นพบ การกําหนดความเป็นเจ้าของ และการทดสอบแบบเคียงข้างกัน เนื่องจากทีมสามารถดูไปป์ไลน์ จัดระเบียบภายใต้พื้นที่ทํางาน Fabric และวางแผนการเคลื่อนย้ายต่อโดเมนได้ ใช้รายการ Azure Data Factory เพื่อจัดทําแค็ตตาล็อกสิ่งที่มีอยู่ จัดลําดับความสําคัญของไปป์ไลน์ที่มีมูลค่าสูงสุด/ความเสี่ยงต่ําที่สุดก่อน และสร้างแบบแผน (การตั้งชื่อ โฟลเดอร์ การนําการเชื่อมต่อกลับมาใช้ใหม่) ที่สคริปต์การแปลงและเครื่องมือของคู่ค้าของคุณสามารถปฏิบัติตามได้อย่างสม่ําเสมอ

การติดตั้งใน Fabric ทําได้ผ่านชนิดรายการ Azure Data Factory: นํา Azure Data Factory ของคุณมาสู่ Fabric

ใช้เครื่องมืออัปเกรด PowerShell

Microsoft เสนอยูทิลิตี้การโยกย้าย ADF-to-Fabric ในโมดูล Azure PowerShell เมื่อคุณใช้โมดูล คุณสามารถแปลชุดย่อยขนาดใหญ่ของ ADF JSON (ไปป์ไลน์ กิจกรรม พารามิเตอร์) เป็นคําจํากัดความแบบ Fabric-native ทําให้คุณมีจุดเริ่มต้นที่รวดเร็ว คาดหวังความครอบคลุมที่แข็งแกร่งสําหรับรูปแบบ การคัดลอก/การค้นหา/กระบวนงานที่เก็บไว้ และโฟลว์การควบคุม พร้อมการติดตามผลด้วยตนเองสําหรับกรณีขอบ (ตัวเชื่อมต่อแบบกําหนดเอง นิพจน์ที่ซับซ้อน โครงสร้างโฟลว์ข้อมูลบางอย่าง) ปฏิบัติต่อเอาต์พุตสคริปต์เป็น นั่งร้าน: เรียกใช้เป็นชุด บังคับใช้การตรวจสอบสไตล์โค้ด/เส้นบรรทัด จากนั้นแนบการเชื่อมต่อและแก้ไขคุณสมบัติที่ไม่ตรงกัน สร้างสิ่งนี้ในการเรียกใช้ CI ที่ทําซ้ําได้ เพื่อให้คุณสามารถทําซ้ําได้ในขณะที่คุณเรียนรู้ แทนที่จะแก้ไขไปป์ไลน์ทุกรายการด้วยมือ

สําหรับคําแนะนําฉบับเต็ม โปรดดู การโยกย้าย PowerShell สําหรับบทช่วยสอนโดยละเอียดพร้อมตัวอย่าง โปรดดูบทช่วยสอนการโยกย้าย PowerShell

การโยกย้ายแบบแมนวล

การโยกย้ายด้วยตนเองเป็นสิ่งจําเป็นสําหรับไปป์ไลน์ที่ซับซ้อนที่มีความเท่าเทียมกันต่ํา แต่ก็เป็นโอกาสในการปรับปรุงสถาปัตยกรรมของคุณให้ทันสมัยและนําคุณสมบัติแบบบูรณาการของ Fabric มาใช้ เส้นทางนี้ต้องมีการวางแผนและพัฒนาล่วงหน้ามากขึ้น แต่สามารถให้ประโยชน์ในระยะยาวในด้านการบํารุงรักษา ประสิทธิภาพ และต้นทุน

หากต้องการย้ายข้อมูลอย่างมีประสิทธิภาพ ให้ทําตามขั้นตอนเหล่านี้

  1. ประเมินและสินค้าคงคลัง: จัดทําแค็ตตาล็อกสินทรัพย์ ADF ทั้งหมด รวมถึงไปป์ไลน์ ชุดข้อมูล บริการที่เชื่อมโยง และรันไทม์การรวม ระบุการขึ้นต่อกันและรูปแบบการใช้งาน
  2. ระบุรายการที่ซ้ํากันและไม่ได้ใช้: ล้างรายการที่ไม่ได้ใช้หรือซ้ําซ้อนใน ADF เพื่อปรับปรุงการย้ายข้อมูลและสภาพแวดล้อมการรวมข้อมูลของคุณ
  3. ระบุช่องว่าง: ใช้ เครื่องมือประเมินการย้ายข้อมูล และตรวจสอบ ความเท่าเทียมกันของตัวเชื่อมต่อ และความ เท่าเทียมกันของกิจกรรม เพื่อระบุช่องว่างระหว่างไปป์ไลน์ ADF และไปป์ไลน์ Fabric และวางแผนสําหรับทางเลือกอื่น
  4. ตรวจสอบคุณสมบัติใหม่: ใช้ คู่มือการตัดสินใจในการย้ายข้อมูล และ คู่มือการตัดสินใจในการรวมข้อมูล เพื่อตัดสินใจว่าเครื่องมือ Fabric ใดจะเหมาะกับความต้องการของคุณมากที่สุด
  5. แผน: ตรวจสอบ แนวทางปฏิบัติที่ดีที่สุดสําหรับการย้ายข้อมูล สําหรับข้อควรพิจารณาสําหรับแต่ละรายการของคุณ และแนวทางในการใช้ประโยชน์สูงสุดจากความสามารถที่ได้รับการปรับปรุงของ Fabric
  6. หากคุณใช้พารามิเตอร์ส่วนกลางใน ADF ให้วางแผนที่จะย้ายไปยังไลบรารีตัวแปร Fabric ดู แปลงพารามิเตอร์ส่วนกลาง ADF เป็นไลบรารีตัวแปร Fabric สําหรับขั้นตอนโดยละเอียด
  7. การเปลี่ยน ADF: พิจารณา เพิ่มรายการ Azure Data Factory ใน Microsoft Fabric เป็นขั้นตอนแรกในการโยกย้าย ซึ่งช่วยให้สามารถเปลี่ยนทีละน้อยในแพลตฟอร์มเดียว
  8. จัดลําดับความสําคัญ: จัดอันดับไปป์ไลน์ของคุณตามผลกระทบทางธุรกิจ ความซับซ้อน และความสะดวกในการย้ายข้อมูล
  9. ทําให้เป็นอัตโนมัติในที่ที่คุณสามารถทําได้: สําหรับไปป์ไลน์ที่มีความซับซ้อนต่ําทั้งหมด ให้พิจารณาใช้ เครื่องมืออัปเกรด PowerShell เพื่อทําให้การโยกย้ายบางส่วนเป็นไปโดยอัตโนมัติ
  10. พิจารณาการใช้เครื่องมือ: ใช้เครื่องมือเหล่านี้เพื่อทําให้การพักผ่อนหย่อนใจง่ายขึ้น:
  11. การโยกย้ายด้วยตนเอง: สําหรับสถานการณ์ที่ไม่รองรับโดยวิธีการโยกย้ายอื่นๆ ให้สร้างใหม่ใน Fabric:
    1. สร้างการเชื่อมต่อใหม่: ตั้งค่า การเชื่อมต่อ ใน Fabric เพื่อแทนที่บริการที่เชื่อมโยงใน ADF
    2. สร้างกิจกรรมใหม่: ตั้งค่า กิจกรรม ของคุณในไปป์ไลน์ แทนที่ กิจกรรมที่ไม่รองรับ ด้วยทางเลือก Fabric หรือใช้กิจกรรมไปป์ไลน์เรียกใช้
    3. กําหนดเวลาและตั้งค่าทริกเกอร์: สร้างกําหนดการและทริกเกอร์เหตุการณ์ใหม่ใน Fabric เพื่อให้ตรงกับกําหนดการ ADF ของคุณ
  12. ทดสอบอย่างละเอียด: ตรวจสอบไปป์ไลน์ที่ย้ายกับผลลัพธ์ที่คาดหวัง เกณฑ์มาตรฐานประสิทธิภาพ และข้อกําหนดการปฏิบัติตามข้อกําหนด

ตัวอย่างสถานการณ์การโยกย้าย

การย้ายจาก ADF ไปยัง Fabric อาจเกี่ยวข้องกับกลยุทธ์ที่แตกต่างกันไปตามกรณีการใช้งานของคุณ ส่วนนี้สรุปเส้นทางการโยกย้ายทั่วไปและข้อควรพิจารณาเพื่อช่วยให้คุณวางแผนได้อย่างมีประสิทธิภาพ

สถานการณ์สมมติที่ 1: ไปป์ไลน์ ADF และโฟลว์ข้อมูล

ปรับปรุงสภาพแวดล้อม ETL ของคุณให้ทันสมัยโดยการย้ายไปป์ไลน์และโฟลว์ข้อมูลไปยัง Fabric วางแผนสําหรับองค์ประกอบเหล่านี้:

  • สร้างบริการที่เชื่อมโยงใหม่เป็นการเชื่อมต่อ
  • สร้างพารามิเตอร์ส่วนกลางใหม่เป็นไลบรารีตัวแปร
  • กําหนดคุณสมบัติของชุดข้อมูลแบบอินไลน์ในกิจกรรมไปป์ไลน์
  • แทนที่ SHIR (รันไทม์การรวมที่โฮสต์เอง) ด้วย OPDG (เกตเวย์ข้อมูลภายในองค์กร) และ VNet IR ด้วยเกตเวย์ข้อมูลเครือข่ายเสมือน
  • สร้างกิจกรรม ADF ที่ไม่ได้รับการสนับสนุนใหม่โดยใช้ทางเลือก Fabric หรือกิจกรรมเรียกใช้ไปป์ไลน์ กิจกรรมที่ไม่รองรับ ได้แก่
    • Data Lake Analytics (U-SQL) ซึ่งเป็นบริการ Azure ที่เลิกใช้แล้ว
    • กิจกรรมการตรวจสอบความถูกต้อง ซึ่งสามารถสร้างใหม่ได้โดยใช้ Get Metadata, ไปป์ไลน์ลูป และกิจกรรม If
    • Power Query ซึ่งรวมเข้ากับ Fabric อย่างสมบูรณ์เป็นกระแสข้อมูลที่สามารถใช้โค้ด M ซ้ําได้
    • กิจกรรม Notebook, Jar และ Python สามารถแทนที่ด้วยกิจกรรม Databricks ใน Fabric
    • กิจกรรม Hive, Pig, MapReduce, Spark และ Streaming สามารถแทนที่ด้วยกิจกรรม HDInsight ใน Fabric ได้

ตัวอย่างเช่น นี่คือหน้าการกําหนดค่าชุดข้อมูล ADF พร้อมเส้นทางไฟล์และการตั้งค่าการบีบอัด:

สกรีนช็อตของหน้าการกําหนดค่าชุดข้อมูล ADF

และนี่คือกิจกรรมการคัดลอกสําหรับ Data Factory ใน Fabric ซึ่งการบีบอัดและเส้นทางไฟล์เป็นแบบอินไลน์ในกิจกรรม:

สกรีนช็อตของการกําหนดค่าการบีบอัดกิจกรรม Fabric Copy

สถานการณ์ที่ 2: ADF ที่มี CDC, SSIS และ Airflow

สร้าง CDC ใหม่เป็น คัดลอกรายการงาน สําหรับ Airflow ให้คัดลอก DAG ของคุณลงในข้อเสนอ Apache Airflow ของ Fabric เรียกใช้แพคเกจ SSIS โดยใช้ไปป์ไลน์ ADF และเรียกใช้จาก Fabric

สถานการณ์สมมติที่ 3: การโยกย้าย PowerShell

ใช้โมดูล Microsoft.FabricPipelineUpgrade PowerShell เพื่อโยกย้ายไปป์ไลน์ Azure Data Factory ของคุณไปยัง Fabric วิธีนี้ใช้ได้ดีสําหรับการโยกย้ายไปป์ไลน์ กิจกรรม และพารามิเตอร์ตามขนาดโดยอัตโนมัติ โมดูล PowerShell แปลชุดย่อยขนาดใหญ่ของ ADF JSON เป็นคําจํากัดความแบบ Fabric-native ซึ่งเป็นจุดเริ่มต้นที่รวดเร็วสําหรับการย้ายข้อมูล

สําหรับคําแนะนําโดยละเอียด โปรดดูบทช่วยสอนการโยกย้าย PowerShell

สถานการณ์สมมติที่ 4: รายการ ADF ในพื้นที่ทํางาน Fabric

คุณสามารถเพิ่มโรงงาน ADF ทั้งหมดในพื้นที่ทํางาน Fabric เป็นรายการดั้งเดิมได้ วิธีนี้ช่วยให้คุณจัดการโรงงาน ADF ควบคู่ไปกับสิ่งประดิษฐ์ Fabric ภายในอินเทอร์เฟซเดียวกัน ADF UI ยังคงสามารถเข้าถึงได้อย่างเต็มที่ ช่วยให้คุณสามารถตรวจสอบ จัดการ และแก้ไขรายการโรงงาน ADF ได้โดยตรงจากพื้นที่ทํางาน Fabric อย่างไรก็ตาม การดําเนินการของไปป์ไลน์ กิจกรรม และรันไทม์การรวมยังคงเกิดขึ้นภายในทรัพยากร Azure ของคุณ

คุณลักษณะนี้มีประโยชน์สําหรับองค์กรที่เปลี่ยนไปใช้ Fabric เนื่องจากให้มุมมองแบบรวมของทั้งทรัพยากร ADF และ Fabric ซึ่งช่วยลดความยุ่งยากในการจัดการและการวางแผนสําหรับการย้ายข้อมูล

สําหรับข้อมูลเพิ่มเติม โปรดดู นํา Azure Data Factory ของคุณเข้าสู่ Fabric