แชร์ผ่าน


เปลี่ยนการเก็บข้อมูล (CDC) ในงานคัดลอก (ตัวอย่าง)

บทความนี้อธิบายความสามารถในการเก็บข้อมูลการเปลี่ยนแปลง (CDC) ในงานคัดลอกและวิธีการใช้งาน

การเปลี่ยนแปลงการเก็บข้อมูล (CDC) ในงานคัดลอกคืออะไร

การเปลี่ยนแปลงการเก็บข้อมูล (CDC) ในงานคัดลอกเป็นความสามารถที่มีประสิทธิภาพใน Fabric Data Factory ที่ช่วยให้การจําลองข้อมูลที่เปลี่ยนแปลงรวมถึงแทรก อัปเดต และลบระเบียนจากต้นทางไปยังปลายทางได้อย่างมีประสิทธิภาพและอัตโนมัติ ซึ่งทําให้มั่นใจได้ว่าข้อมูลปลายทางของคุณจะยังคงทันสมัยอยู่เสมอโดยไม่ต้องใช้ความพยายามด้วยตนเอง ปรับปรุงประสิทธิภาพในการรวมข้อมูลในขณะที่ลดการโหลดในระบบต้นทางของคุณ

ประโยชน์สําคัญของ CDC ในการคัดลอกงาน

  • การแทรกแซงด้วยตนเองเป็นศูนย์: รวบรวมการเปลี่ยนแปลงแบบเพิ่มหน่วยโดยอัตโนมัติ (แทรก อัปเดต ลบ) ได้โดยตรงจากแหล่งข้อมูล
  • การจําลองแบบอัตโนมัติ: เก็บข้อมูลปลายทางอย่างต่อเนื่องซิงโครไนซ์กับการเปลี่ยนแปลงต้นทาง
  • ประสิทธิภาพที่ดีที่สุด: ประมวลผลเฉพาะข้อมูลที่เปลี่ยนแปลง ลดเวลาการประมวลผล และลดโหลดบนแหล่งข้อมูล
  • สําเนาแบบเพิ่มหน่วยที่ชาญฉลาดยิ่งขึ้น: ตรวจหาตารางแหล่งข้อมูลที่เปิดใช้งาน CDC โดยอัตโนมัติ และช่วยให้คุณสามารถเลือกสําเนาแบบเพิ่มหน่วยตาม CDC หรือลายน้ําสําหรับแต่ละตาราง

วิธีการทํางาน: สําเนาแบบเพิ่มหน่วยตาม CDC เทียบกับลายน้ํา

  • สําเนาแบบเพิ่มหน่วยที่ใช้ CDC: ถ้าฐานข้อมูลต้นฉบับของคุณเปิดใช้งาน CDC งานคัดลอกจะจับภาพและจําลองแบบแทรก ปรับปรุง และลบไปยังปลายทางโดยอัตโนมัติ โดยใช้การเปลี่ยนแปลงที่แน่นอน
  • หากไม่ได้เปิดใช้งาน CDC ในฐานข้อมูลต้นทางของคุณ งานคัดลอกจะตรวจพบการเปลี่ยนแปลงโดยการเปรียบเทียบคอลัมน์แบบเพิ่มหน่วย (เช่น ประทับเวลาหรือ ID) กับการทํางานครั้งล่าสุด จากนั้นจะผนวกหรือผสานข้อมูลที่เปลี่ยนแปลงไปยังปลายทางตามการกําหนดค่าของคุณ

ตัวเชื่อมต่อที่รองรับ

ปัจจุบัน งาน CDC ใน Copy รองรับที่เก็บข้อมูลต้นทางและปลายทางต่อไปนี้:

ตัวเชื่อมต่อ แหล่งที่มา ปลายทาง อ่าน - CDC (ตัวอย่าง) เขียน - CDC Merge เขียน - CDC Upsert
Azure SQL DB
อินสแตนซ์ที่มีการจัดการของ Azure SQL
โต๊ะเลคเฮ้าส์ผ้า
Google บิ๊กคิวรี
SQL Server ภายในองค์กร
SAP Datasphere ขาออกสําหรับ ADLS Gen2
SAP Datasphere ขาออกสําหรับ AWS S3
SAP Datasphere ขาออกสําหรับ Google CloudStorage
Snowflake
ฐานข้อมูล SQL ใน Fabric (ตัวอย่าง)

สําหรับ SAP Datasphere Outbound โปรดไปที่ เปลี่ยนการบันทึกข้อมูลจาก SAP ผ่าน SAP Datasphere Outbound ใน งานคัดลอก เพื่อเรียนรู้รายละเอียดเพิ่มเติม

วิธีเริ่มต้นใช้งาน

ทําตามขั้นตอนต่อไปนี้เพื่อสร้างงานคัดลอกใหม่เพื่อนําเข้าข้อมูลจาก Azure SQL DB ผ่าน CDC ไปยัง Azure SQL DB อื่น:

  1. ตรวจสอบให้แน่ใจว่ามีการเปิดใช้งานการเปลี่ยนแปลงการเก็บข้อมูล (CDC) บนฐานข้อมูลและตารางของคุณในที่เก็บแหล่งข้อมูลที่ได้รับการสนับสนุน ในกรณีนี้ คือ Azure SQL DB

    สกรีนช็อตที่แสดงวิธีการเปิดใช้งาน cdc db

    สกรีนช็อตที่แสดงวิธีการเปิดใช้งานตาราง cdc

    Note

    • เราขอแนะนําให้คุณเปิดใช้งาน CDC สําหรับตารางทั้งหมดที่กล่าวถึงข้างต้น
    • ตรวจสอบให้แน่ใจว่ามีการเปิดใช้งาน supports_net_changes
    • คอลัมน์ทั้งหมดในตารางต้นทางจะต้องถูกระบุว่าเป็นคอลัมน์ที่จับภาพไว้เป็นค่าเริ่มต้น

    เรียนรู้เพิ่มเติมใน เปิดใช้งานและปิดใช้งานการจับภาพข้อมูลการเปลี่ยนแปลง - SQL Server | SQL Server Microsoft Learn

  2. เลือก + รายการใหม่ เลือกไอคอน คัดลอกงาน ตั้งชื่องานคัดลอกของคุณ แล้วคลิก สร้าง

    สกรีนช็อตที่แสดงตําแหน่งที่จะนําทางไปยังโฮมเพจ Data Factory และสร้างงานคัดลอกใหม่

  3. เลือกที่เก็บข้อมูลเพื่อคัดลอกข้อมูล ในตัวอย่างนี้ เลือก Azure SQL DB

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกแหล่งข้อมูลสําหรับงานคัดลอก

  4. ป้อน เส้นทางเซิร์ฟเวอร์ และข้อมูล ประจําตัว ของคุณเพื่อเชื่อมต่อกับ Azure SQL DB คุณสามารถคัดลอกข้อมูลได้อย่างปลอดภัยภายในสภาพแวดล้อม VNET โดยใช้เกตเวย์ภายในองค์กรหรือเกตเวย์ VNET

    สกรีนช็อตแสดงตําแหน่งที่จะป้อนข้อมูลประจําตัว

  5. คุณควรสามารถมองเห็นตารางแหล่งข้อมูลที่เปิดใช้งาน CDC ได้อย่างชัดเจน เลือก ตารางที่มี CDC เปิดใช้งาน เพื่อคัดลอก

    ตารางที่เปิดใช้งาน CDC: สกรีนช็อตที่แสดงไอคอนตาราง cdc

    ตารางที่ไม่มีการเปิดใช้งาน CDC: สกรีนช็อตที่แสดงไอคอนตาราง cdc ที่ไม่มี

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกตาราง cdc สําหรับงานคัดลอก

    Note

    • ขณะนี้ไม่สามารถตรวจพบตาราง Fabric Lakehouse ได้ว่าเปิดใช้งาน CDF หรือไม่
  6. เลือกร้านค้าปลายทางของคุณ ในตัวอย่างนี้ ให้เลือก Azure SQL DB อื่น

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกที่เก็บปลายทางสําหรับงานคัดลอก

  7. ควรตั้งค่า เมธอด Update เริ่มต้นเป็น ผสาน และคอลัมน์คีย์ที่จําเป็นจะตรงกับคีย์หลักที่กําหนดไว้ในที่เก็บต้นทางตามค่าเริ่มต้น

    สกรีนช็อตที่แสดงวิธีการอัปเดตสําหรับ CDC

  8. เลือก สําเนาที่เพิ่มขึ้น และคุณจะเห็นคอลัมน์ส่วนเพิ่มสําหรับแต่ละตารางที่จําเป็นต้องป้อนเพื่อติดตามการเปลี่ยนแปลง

    Note

    ในตอนแรกงานคัดลอกจะดําเนินการโหลดเต็มรูปแบบ และดําเนินการคัดลอกส่วนเพิ่มในภายหลังในการเรียกใช้ที่ตามมาผ่านทาง CDC

    สกรีนช็อตแสดงตําแหน่งที่จะเลือก CDC

  9. ตรวจสอบสรุปงาน ตั้งค่าตัวเลือกการเรียกใช้ไปตามกําหนดเวลา แล้วคลิก บันทึก + เรียกใช้

    สกรีนช็อตแสดงตําแหน่งที่จะตรวจทานและบันทึกงานสําเนาที่สร้างขึ้นใหม่

    Note

    โปรดตรวจสอบให้แน่ใจว่าระยะเวลาการเก็บรักษาข้อมูลบันทึก CDC ของคุณนานกว่าช่วงเวลาระหว่างการเรียกใช้ที่กําหนดไว้ มิฉะนั้น ข้อมูลที่เปลี่ยนแปลงโดย CDC อาจสูญหายถ้าไม่ได้รับการประมวลผลภายในระยะเวลาการเก็บข้อมูล

  10. งานคัดลอกของคุณจะเริ่มต้นทันที การเรียกใช้ครั้งแรกจะคัดลอกสแนปช็อตแบบเต็มเริ่มต้น

    สกรีนช็อตที่แสดงแผงคัดลอกงานซึ่งคุณสามารถตรวจสอบสแนปช็อตแบบเต็มเริ่มต้นได้

  11. อัปเดตตารางต้นทางของคุณโดยการแทรก อัปเดต หรือลบแถว

    สกรีนช็อตที่แสดงวิธีการอัปเดตแถว

  12. เรียกใช้งาน คัดลอก อีกครั้งเพื่อบันทึกและทําซ้ําการเปลี่ยนแปลงทั้งหมด รวมถึงแถวที่แทรก อัปเดต และถูกลบ ไปยังปลายทาง

    สกรีนช็อตที่แสดงแผงคัดลอกงานที่คุณสามารถตรวจสอบการจับภาพและจําลองการเปลี่ยนแปลงทั้งหมดได้

ข้อจำกัดที่ทราบ

  • เมื่อเลือกทั้งตารางแหล่งข้อมูลที่เปิดใช้งาน CDC และไม่ได้เปิดใช้งาน CDC ในงานคัดลอก จะถือว่าตารางทั้งหมดเป็นสําเนาแบบเพิ่มหน่วยตามลายน้ํา
  • ไม่รองรับอินสแตนซ์การจับภาพแบบกําหนดเอง รองรับเฉพาะอินสแตนซ์การจับภาพเริ่มต้นเท่านั้น
  • SCD2 ไม่ได้รับการสนับสนุนสําหรับที่เก็บข้อมูลแหล่งข้อมูลที่เปิดใช้งาน CDC
  • DDL ยังไม่ได้รับการสนับสนุนในงานคัดลอก
  • ไม่ว่าจะเปิดใช้งาน CDF หรือไม่บนตาราง Fabric Lakehouse จะไม่สามารถตรวจพบได้โดยอัตโนมัติ