บทนำ
Apache Spark เป็นเฟรมเวิร์กการประมวลผลแบบขนานของโอเพนซอร์สสําหรับการประมวลผลและการวิเคราะห์ข้อมูลขนาดใหญ่ Spark ได้รับความนิยมในสถานการณ์การประมวลผล "ข้อมูลขนาดใหญ่" และพร้อมใช้งานในการใช้งานหลายแพลตฟอร์ม รวมถึง Azure HDInsight, Azure Synapse Analytics และ Microsoft Fabric
มอดูลนี้จะสํารวจวิธีที่คุณสามารถใช้ Spark ใน Microsoft Fabric เพื่อนําเข้า ประมวลผล และวิเคราะห์ข้อมูลในเลคเฮ้าส์ ในขณะที่เทคนิคหลักและรหัสที่อธิบายไว้ในโมดูลนี้เป็นเรื่องปกติสําหรับการใช้งานทั้งหมดของ Spark เครื่องมือแบบรวมและความสามารถในการทํางานกับ Spark ในสภาพแวดล้อมเดียวกันกับบริการข้อมูลอื่น ๆ ใน Microsoft Fabric ทําให้การรวมการประมวลผลข้อมูลโดยใช้ Spark เข้ากับโซลูชันการวิเคราะห์ข้อมูลโดยรวมของคุณได้ง่ายขึ้น