แชร์ผ่าน


คําจํากัดความของงาน Apache Spark คืออะไร

ข้อกําหนดงาน Apache Spark คือรายการรหัส Microsoft Fabric ที่ช่วยให้คุณสามารถส่งชุดงาน/การสตรีมไปยังคลัสเตอร์ Spark ได้ ด้วยการอัปโหลดไฟล์ไบนารีจากเอาต์พุตการคอมไพล์ของภาษาต่างๆ (เช่น .jar จาก Java) คุณสามารถใช้ตรรกะการแปลงที่แตกต่างกันกับข้อมูลที่โฮสต์บนเลคเฮาส์ได้ นอกจากไฟล์ไบนารีแล้ว คุณยังสามารถปรับแต่งพฤติกรรมของงานเพิ่มเติมได้โดยการอัปโหลดไลบรารีและอาร์กิวเมนต์บรรทัดคําสั่งเพิ่มเติม

เมื่อต้องการเรียกใช้ข้อกําหนดงาน Spark คุณต้องมีเลคเฮาส์อย่างน้อยหนึ่งเลคเฮาส์ที่เกี่ยวข้อง บริบทเลคเฮาส์เริ่มต้นนี้ทําหน้าที่เป็นระบบไฟล์เริ่มต้นสําหรับรันไทม์ของ Spark สําหรับโค้ด Spark ใดๆ ที่ใช้เส้นทางสัมพัทธ์ในการอ่าน/เขียนข้อมูล ข้อมูลจะถูกให้บริการจากเลคเฮาส์เริ่มต้น

สําคัญ

เมื่อต้องการเรียกใช้รายการข้อกําหนดงาน Spark คุณต้องมีไฟล์ข้อกําหนดหลักและบริบทเลคเฮาส์เริ่มต้น ถ้าคุณไม่มีเลคเฮาส์ ให้สร้างเลคเฮาส์โดยทําตามขั้นตอนใน สร้างเลคเฮาส์

ขั้นตอนถัดไป