หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ ORC ในไปป์ไลน์ของ Data Factory ใน Microsoft Fabric
ความสามารถที่รองรับ
รูปแบบ ORC ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นต้นทางและปลายทาง
| หมวดหมู่ | ตัวเชื่อมต่อ/กิจกรรม |
|---|---|
| ตัวเชื่อมต่อที่สนับสนุน | อเมซอน S3 |
| เข้ากันได้กับ Amazon S3 | |
| ที่เก็บข้อมูล Azure Blob | |
| Azure Data Lake Storage Gen1 | |
| Azure Data Lake Storage รุ่น2 | |
| ไฟล์ Azure | |
| ระบบไฟล์ | |
| FTP | |
| พื้นที่เก็บข้อมูล Google Cloud | |
| HTTP | |
| ไฟล์ของเลคเฮ้าส์ | |
| ที่เก็บข้อมูล Oracle Cloud | |
| SFTP | |
| กิจกรรมที่ได้รับการสนับสนุน | คัดลอกกิจกรรม (ต้นทาง/ปลายทาง) |
| ค้นหากิจกรรม | |
| กิจกรรม GetMetadata | |
| ลบกิจกรรมข้อมูล |
รูปแบบ ORC ในกิจกรรมการคัดลอก
เมื่อต้องการกําหนดค่ารูปแบบ ORC ให้เลือกการเชื่อมต่อของคุณในต้นทางหรือปลายทางของกิจกรรมการคัดลอกไปป์ไลน์ แล้วเลือก ORC ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้
รูปแบบ ORC เป็นแหล่งข้อมูล
หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ
- ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้อ่านไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy
รูปแบบ ORC เป็นปลายทาง
หลังจากที่คุณเลือก การตั้งค่า คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ
- ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy
ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ ปลายทาง คุณสมบัติที่เกี่ยวข้องกับรูปแบบ ORC ต่อไปนี้จะแสดงขึ้นมา
- แถวสูงสุดต่อไฟล์: เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์
-
คํานําหน้าชื่อไฟล์: ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้:
<fileNamePrefix>_00000.<fileExtension>ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล
ข้อมูลสรุปของตาราง
ORC เป็นแหล่งข้อมูล
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมคัดลอกเมื่อใช้รูปแบบ ORC
| ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
|---|---|---|---|---|
| รูปแบบไฟล์ | รูปแบบไฟล์ที่คุณต้องการใช้ | ORC | ใช่ | type (ภายใต้ datasetSettings):Orc |
| ชนิดการบีบอัด | ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ ORC |
ไม่มี zlib snappy |
ไม่ | orcCompressionCodec: ไม่มี zlib snappy |
ORC เป็นปลายทาง
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนคัดลอกปลายทางกิจกรรมเมื่อใช้รูปแบบ ORC
| ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
|---|---|---|---|---|
| รูปแบบไฟล์ | รูปแบบไฟล์ที่คุณต้องการใช้ | ORC | ใช่ | type (ภายใต้ datasetSettings):Orc |
| ชนิดการบีบอัด | ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC |
ไม่มี zlib snappy |
ไม่ | orcCompressionCodec: ไม่มี zlib snappy |
| แถวสูงสุดต่อไฟล์ | เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์ | <แถวสูงสุดของคุณต่อไฟล์> | ไม่ | maxRowsPerFile |
| คํานําหน้าชื่อไฟล์ | ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้: <fileNamePrefix>_00000.<fileExtension> ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล |
<คํานําหน้าชื่อไฟล์ของคุณ> | ไม่ | fileNamePrefix |