แชร์ผ่าน


ทางลัด OneLake

ทางลัดใน Microsoft OneLake รวมข้อมูลของคุณในโดเมน ระบบคลาวด์ และบัญชีต่างๆ เข้าด้วยกัน โดยทําให้ OneLake เป็นที่จัดเก็บข้อมูลดิบเสมือนเดียวสําหรับทั้งองค์กรของคุณ ประสบการณ์แฟบริคและกลไกการวิเคราะห์สามารถเชื่อมต่อกับแหล่งข้อมูลที่มีอยู่ของคุณ รวมถึง Azure, Amazon Web Services (AWS) และ OneLake ผ่านเนมสเปซแบบรวม OneLake จัดการสิทธิ์และข้อมูลประจําตัวทั้งหมด ดังนั้นคุณไม่จําเป็นต้องกําหนดค่าปริมาณงาน Fabric แต่ละรายการแยกต่างหากเพื่อเชื่อมต่อกับแต่ละแหล่งข้อมูล นอกจากนี้ คุณยังสามารถใช้ทางลัดเพื่อกําจัดสําเนาขอบของข้อมูล และลดเวลาแฝงของกระบวนการที่เกี่ยวข้องกับสําเนาข้อมูลและการแบ่งระยะได้

ทางลัดคืออะไร

ทางลัดคือวัตถุใน OneLake ที่ชี้ไปยังตําแหน่งที่เก็บข้อมูลอื่น ตําแหน่งที่ตั้งสามารถอยู่ภายในหรือภายนอกไปยัง OneLake ได้ ตําแหน่งที่ตั้งที่ทางลัดชี้ไปที่คือ เส้นทางเป้าหมาย ของทางลัด ตําแหน่งที่คําสั่งลัดแสดงคือเส้นทางทางลัด

ทางลัดจะปรากฏเป็นโฟลเดอร์ใน OneLake และบริการหรือปริมาณงานที่มีสิทธิ์เข้าถึง OneLake สามารถใช้ได้ ทางลัดทํางานเหมือนกับลิงก์ที่เป็นสัญลักษณ์ ซึ่งเป็นวัตถุอิสระจากเป้าหมาย ถ้าคุณลบปุ่มลัด เป้าหมายยังคงไม่ได้รับผลกระทบ ถ้าคุณย้าย เปลี่ยนชื่อ หรือลบเส้นทางเป้าหมาย ทางลัดสามารถหยุดได้

แผนภาพที่แสดงวิธีการที่ทางลัดเชื่อมต่อแฟ้มและโฟลเดอร์ที่จัดเก็บไว้ในตําแหน่งที่ตั้งอื่น

ฉันสามารถสร้างทางลัดได้ที่ไหน

คุณสามารถสร้างทางลัดในฐานข้อมูล lakehouses และ Kusto Query Language (KQL) ได้

คุณสามารถใช้พอร์ทัล Fabric เพื่อสร้างทางลัดแบบโต้ตอบ และคุณสามารถใช้ REST API เพื่อสร้างทางลัดโดยทางโปรแกรมได้

เลคเฮ้าส์

เมื่อสร้างทางลัดในเลคเฮ้าส์ คุณต้องทําความเข้าใจโครงสร้างโฟลเดอร์ของรายการ เลคเฮาส์มีโฟลเดอร์ระดับบนสุดสองโฟลเดอร์: โฟลเดอร์ตารางและโฟลเดอร์ไฟล์ โฟลเดอร์ตารางมีไว้สําหรับชุดข้อมูลที่มีโครงสร้าง โฟลเดอร์ไฟล์มีไว้สําหรับข้อมูลที่ไม่มีโครงสร้างหรือกึ่งโครงสร้าง

ในโฟลเดอร์ตาราง คุณสามารถสร้างทางลัดได้เฉพาะในระดับบนสุดเท่านั้น OneLake ไม่สนับสนุนทางลัดในไดเรกทอรีย่อยของโฟลเดอร์ตาราง โดยทั่วไปทางลัดในส่วนตารางจะชี้ไปยังแหล่งข้อมูลภายในภายใน OneLake หรือลิงก์ไปยังแอสเซทข้อมูลอื่น ๆ ที่สอดคล้องกับรูปแบบตาราง Delta ถ้าเป้าหมายของทางลัดมีข้อมูลในรูปแบบ Delta Parquet เลคเฮาส์จะซิงโครไนซ์ข้อมูลเมตาโดยอัตโนมัติและจดจําโฟลเดอร์เป็นตาราง ทางลัดในส่วนตารางสามารถเชื่อมโยงไปยังตารางเดียวหรือเค้าร่าง ซึ่งเป็นโฟลเดอร์หลักสําหรับตารางหลายตาราง

หมายเหตุ

รูปแบบ Delta ไม่สนับสนุนตารางที่มีอักขระช่องว่างในชื่อ OneLake ไม่รู้จักทางลัดใด ๆ ที่มีช่องว่างในชื่อเป็นตารางเดลต้าในเลคเฮาส์

ในโฟลเดอร์ไฟล์ จะไม่มีข้อจํากัดเกี่ยวกับตําแหน่งที่คุณสามารถสร้างทางลัดได้ คุณสามารถสร้างทางลัดในระดับใดก็ได้ของลําดับชั้นของโฟลเดอร์ การค้นพบตารางจะไม่เกิดขึ้นในโฟลเดอร์ไฟล์ ทางลัดที่นี่สามารถชี้ไปที่ OneLake ภายในและระบบจัดเก็บข้อมูลภายนอกที่มีข้อมูลในรูปแบบใดก็ได้

ไดอะแกรมที่แสดงมุมมอง แฟ้ม และมุมมอง ตาราง เคียงข้างกัน

ฐานข้อมูล KQL

เมื่อคุณสร้างทางลัดในฐานข้อมูล KQL จะปรากฏใน โฟลเดอร์ ทางลัด ของฐานข้อมูล ฐานข้อมูล KQL จะถือว่าทางลัดเช่นตารางภายนอก เมื่อต้องการคิวรีทางลัด ให้ใช้ external_table ฟังก์ชันของภาษาคิวรี Kusto

สกรีนช็อตของทางลัดภายในฐานข้อมูล KQL

ฉันจะเข้าถึงทางลัดได้ที่ไหน

การบริการ Fabric หรือ non-Fabric ใด ๆ ที่สามารถเข้าถึงข้อมูลใน OneLake สามารถใช้ทางลัดได้ ทางลัดจะโปร่งใสสําหรับบริการใดๆ ที่เข้าถึงข้อมูลผ่าน OneLake API ทางลัดจะปรากฏเป็นโฟลเดอร์อื่นใน lake Apache Spark, SQL, Real-Time Intelligence และ Analysis Services สามารถใช้ทางลัดทั้งหมดเมื่อทําการคิวรีข้อมูล

Apache Spark

Apache Spark notebooks และ Apache Spark job สามารถใช้ทางลัดที่คุณสร้างใน OneLake ได้ ใช้เส้นทางไฟล์สัมพัทธ์เพื่ออ่านข้อมูลโดยตรงจากทางลัด นอกจากนี้ ถ้าคุณสร้างทางลัดในส่วน ตาราง ของ lakehouse และอยู่ในรูปแบบ Delta คุณสามารถอ่านเป็นตารางที่มีการจัดการโดยใช้ไวยากรณ์ Apache Spark SQL

df = spark.read.format("delta").load("Tables/MyShortcut")
display(df)
df = spark.sql("SELECT * FROM MyLakehouse.MyShortcut LIMIT 1000")
display(df)

SQL

คุณสามารถอ่านทางลัดในส่วน ตาราง ของเลคเฮ้าส์ผ่านจุดสิ้นสุดการวิเคราะห์ SQL สําหรับเลคเฮ้าส์ คุณสามารถเข้าถึงจุดสิ้นสุดการวิเคราะห์ SQL ผ่านตัวเลือกโหมดของเลคเฮ้าส์หรือผ่าน SQL Server Management Studio (SSMS) ได้

SELECT TOP (100) *
FROM [MyLakehouse].[dbo].[MyShortcut]

ระบบอัจฉฉริยะในเวลาจริง

ทางลัดในฐานข้อมูล KQL จะถูกรับรู้ว่าเป็นตารางภายนอก เมื่อต้องการคิวรีทางลัด ให้ใช้ external_table ฟังก์ชันของภาษาคิวรี Kusto

external_table('MyShortcut')
| take 100

Analysis Services

คุณสามารถสร้างแบบจําลองเชิงความหมายสําหรับเลคเฮ้าส์ที่มีทางลัดในส่วน ตาราง ของเลคเฮ้าส์ เมื่อแบบจําลองความหมายทํางานในโหมด Direct Lake Analysis Services สามารถอ่านข้อมูลได้โดยตรงจากปุ่มลัด

บริการที่ไม่ใช่ Fabric

แอปพลิเคชันและบริการภายนอก Fabric ยังสามารถเข้าถึงทางลัดผ่าน OneLake API ได้ OneLake สนับสนุนชุดย่อยของ API ที่เก็บข้อมูล ADLS Gen2 และ Blob เมื่อต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ OneLake API ดูการเข้าถึง OneLake ด้วย API

https://onelake.dfs.fabric.microsoft.com/MyWorkspace/MyLakhouse/Tables/MyShortcut/MyFile.csv

ชนิดของทางลัด

ทางลัด OneLake สนับสนุนแหล่งข้อมูลระบบไฟล์หลายแหล่ง แหล่งข้อมูลเหล่านี้รวมถึงตําแหน่งที่ตั้ง OneLake ภายในและแหล่งข้อมูลภายนอกหรือที่ไม่ใช่ของ Microsoft

คุณยังสามารถ สร้างทางลัดไปยังตําแหน่งที่ตั้งภายในองค์กรหรือเครือข่ายที่จํากัด ได้โดยใช้เกตเวย์ข้อมูลภายในองค์กร (OPDG) แบบ Fabric

ทางลัด OneLake ภายใน

ใช้ทางลัด OneLake ภายในเพื่ออ้างอิงข้อมูลภายในรายการ Fabric ที่มีอยู่ รวมถึง:

  • ฐานข้อมูล KQL
  • เลคเฮ้าส์
  • แค็ตตาล็อก Azure Databricks ที่มิเรอร์
  • ฐานข้อมูลมิเรอร์
  • แบบจําลองความหมาย
  • ฐานข้อมูล SQL
  • คลังสินค้า

สําหรับคําแนะนําในการสร้างทางลัดภายใน โปรดดู สร้างทางลัด OneLake ภายใน

ทางลัดสามารถชี้ไปยังตําแหน่งโฟลเดอร์ภายในรายการเดียวกัน ข้ามรายการภายในพื้นที่ทํางานเดียวกัน หรือแม้กระทั่งข้ามรายการในพื้นที่ทํางานอื่น เมื่อคุณสร้างทางลัดข้ามรายการ ชนิดหน่วยข้อมูลไม่จําเป็นต้องตรงกัน ตัวอย่างเช่น คุณสามารถสร้างทางลัดในเลคเฮาส์ที่ชี้ไปยังข้อมูลในคลังข้อมูล

เมื่อผู้ใช้เข้าถึงข้อมูลจากตําแหน่งที่ตั้ง OneLake อื่นผ่านทางลัด OneLake จะใช้ข้อมูลประจําตัวของผู้ใช้ที่โทรเพื่ออนุญาตการเข้าถึงข้อมูล ผู้ใช้นี้ต้องมีสิทธิ์ในตําแหน่งที่ตั้งเป้าหมายในการอ่านข้อมูล

สำคัญ

เมื่อผู้ใช้เข้าถึงทางลัดผ่านแบบจําลองความหมายของ Power BI โดยใช้ DirectLake ผ่าน กลไกจัดการ SQL หรือ T-SQL ในโหมด ข้อมูลประจําตัวที่ได้รับมอบหมาย ข้อมูลประจําตัวของผู้ใช้ที่เรียกจะไม่ถูกส่งผ่านไปยังเป้าหมายทางลัด แต่ข้อมูลประจําตัวของเจ้าของรายการที่เรียกจะถูกส่งผ่าน ซึ่งจะมอบสิทธิ์การเข้าถึงให้กับผู้ใช้ที่โทร เมื่อต้องการแก้ไขข้อจํากัดนี้ ให้ใช้แบบจําลองความหมายของ Power BI ใน DirectLake ผ่านโหมด OneLake หรือ T-SQL ในโหมดข้อมูลประจําตัวของผู้ใช้

ทางลัด OneLake ภายนอก

สําหรับคําแนะนําโดยละเอียดในการสร้างประเภทคําสั่งลัดที่เฉพาะเจาะจง ให้เลือกบทความจากรายการแหล่งข้อมูลภายนอกที่รองรับนี้:

การแคช

การแคชทางลัดสามารถลดค่าใช้จ่ายในการเข้าถึงข้อมูลข้ามคลาวด์ได้ เมื่อ OneLake อ่านไฟล์ผ่านทางลัดภายนอก บริการจะจัดเก็บไฟล์ในแคชสําหรับพื้นที่ทํางาน Fabric OneLake ตอบสนองต่อคําขออ่านที่ตามมาจากแคชแทนที่จะเป็นผู้ให้บริการที่เก็บข้อมูลระยะไกล คุณสามารถกําหนดระยะเวลาการเก็บรักษาสําหรับไฟล์ที่แคชไว้ระหว่าง 1-28 วัน ทุกครั้งที่คุณเข้าถึงไฟล์ ระยะเวลาการเก็บรักษาจะถูกรีเซ็ต หากที่เก็บข้อมูลระยะไกลมีไฟล์เวอร์ชันล่าสุดกว่าเวอร์ชันของแคช OneLake จะให้บริการคําขอจากผู้ให้บริการที่เก็บข้อมูลระยะไกลและอัปเดตไฟล์ในแคช หากคุณไม่เข้าถึงไฟล์ภายในระยะเวลาการเก็บรักษาที่เลือก ไฟล์นั้นจะถูกลบออกจากแคช แต่ละไฟล์ที่มีขนาดมากกว่า 1 GB จะไม่ถูกแคช

หมายเหตุ

ปัจจุบันการแคชทางลัดรองรับ Google Cloud Storage (GCS), S3, S3 ที่เข้ากันได้กับ S3 และทางลัดเกตเวย์ข้อมูลในองค์กร

หากต้องการเปิดใช้งานการแคชสําหรับทางลัด ให้เปิดแผง การตั้งค่า พื้นที่ทํางาน เลือกแท็บ OneLake สลับการตั้งค่าแคชไปเป็น เมื่อ และเลือกระยะเวลาการเก็บข้อมูล

คุณสามารถล้างแคชได้ตลอดเวลา จากหน้าการตั้งค่าเดียวกัน เลือกปุ่ม รีเซ็ตแคช การดําเนินการนี้จะเป็นการลบไฟล์ทั้งหมดออกจากแคชทางลัดในพื้นที่ทํางานนี้

สกรีนช็อตของแผงการตั้งค่าพื้นที่ทํางานที่เลือกแท็บ OneLake

ทางลัดใช้การเชื่อมต่อระบบคลาวด์อย่างไร

คําสั่งลัด ADLS และ S3 มอบสิทธิ์การอนุญาตโดยใช้การเชื่อมต่อระบบคลาวด์ เมื่อคุณสร้างทางลัด ADLS หรือ S3 ใหม่ คุณต้องสร้างการเชื่อมต่อใหม่หรือเลือกการเชื่อมต่อที่มีอยู่สําหรับแหล่งข้อมูล การตั้งค่าการเชื่อมต่อสําหรับทางลัดคือการดําเนินการที่ผูกไว้ เฉพาะผู้ใช้ที่มีสิทธิ์ในการเชื่อมต่อเท่านั้นที่สามารถทําการดําเนินการผูกได้ ถ้าคุณไม่มีสิทธิ์ในการเชื่อมต่อ คุณจะไม่สามารถสร้างทางลัดใหม่โดยใช้การเชื่อมต่อนั้นได้

สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการดูและการอัปเดตการเชื่อมต่อระบบคลาวด์ ให้ดูที่ การจัดการการเชื่อมต่อสําหรับทางลัด

การรักษาความปลอดภัยทางลัด

ทางลัดต้องการสิทธิ์บางอย่างในการจัดการและใช้ ความปลอดภัยของทางลัด OneLake จะอธิบายสิทธิ์ที่คุณต้องการในการสร้างทางลัดและเข้าถึงข้อมูลผ่านทางลัดเหล่านั้น

ทางลัดจัดการกับการลบอย่างไร

คําสั่งลัดไม่รองรับการลบแบบเรียงซ้อน เมื่อคุณลบทางลัด คุณจะลบเฉพาะออบเจ็กต์ทางลัดเท่านั้น ข้อมูลในเป้าหมายคําสั่งลัดจะไม่เปลี่ยนแปลง อย่างไรก็ตาม ถ้าคุณลบแฟ้มหรือโฟลเดอร์ภายในทางลัด และคุณมีสิทธิ์ในเป้าหมายทางลัดเพื่อดําเนินการลบ คุณก็ลบแฟ้มหรือโฟลเดอร์ในเป้าหมายด้วย

ตัวอย่างเช่น พิจารณาเลคเฮ้าส์ที่มีเส้นทางดังต่อไปนี้: MyLakehouse\Files\MyShortcut\Foo\Bar MyShortcut เป็นทางลัดที่ชี้ไปยังบัญชี ADLS Gen2 ที่มีไดเรกทอรี Foo\Bar

ถ้าคุณลบ MyLakehouse\Files\MyShortcutคุณจะลบทางลัด MyShortcut ออกจากเลคเฮาส์ แต่ไฟล์และไดเร็กทอรีในบัญชี ADLS Gen2 Foo\Bar จะไม่ได้รับผลกระทบ

ถ้าคุณลบ MyLakehouse\Files\MyShortcut\Foo\Barและคุณมีสิทธิ์ในการเขียนในบัญชีผู้ใช้ ADLS Gen2 คุณลบไดเรกทอรี Bar ออกจากบัญชีผู้ใช้ ADLS Gen2

มุมมองสายข้อมูลพื้นที่ทํางาน

เมื่อคุณสร้างทางลัดระหว่างรายการ Fabric หลายรายการภายในพื้นที่ทํางาน คุณสามารถแสดงภาพความสัมพันธ์ทางลัดผ่านมุมมองสายข้อมูลพื้นที่ทํางาน เลือก ปุ่มมุมมอง สายข้อมูล ( ) ที่มุมบนขวาของตัวสํารวจพื้นที่ทํางาน

สกรีนช็อตของหน้าจอมุมมองสายข้อมูลเพื่อแสดงความสัมพันธ์ของทางลัด

หมายเหตุ

มุมมองสายข้อมูลมีขอบเขตอยู่ในพื้นที่ทํางานเดียว ทางลัดไปยังตําแหน่งที่ตั้งภายนอกพื้นที่ทํางานที่เลือกจะไม่ปรากฏขึ้น

ข้อจํากัดและข้อควรพิจารณา

  • ไอเท็ม Fabric แต่ละรายการรองรับทางลัดได้สูงสุด 100,000 รายการ ในบริบทนี้ คําว่า item หมายถึงแอป เลคเฮาส์ คลังสินค้า รายงาน และอื่นๆ
  • เส้นทาง OneLake เดียวรองรับทางลัดได้สูงสุด 10 ทาง
  • จํานวนสูงสุดของทางลัดโดยตรงไปยังลิงก์ทางลัดคือ 5
  • ชื่อทางลัด OneLake พาธหลัก และเส้นทางเป้าหมายไม่สามารถมีอักขระ "%" หรือ "+" ได้
  • ทางลัดไม่สนับสนุนอักขระที่ไม่ใช่ละติน
  • สายข้อมูลสําหรับทางลัดไปยังคลังข้อมูลและแบบจําลองความหมายไม่พร้อมใช้งานในขณะนี้
  • ทางลัด Fabric ซิงค์กับแหล่งข้อมูลเกือบจะทันที แต่เวลาการเผยแพร่อาจแตกต่างกันเนื่องจากประสิทธิภาพของแหล่งข้อมูล มุมมองที่แคช หรือปัญหาการเชื่อมต่อเครือข่าย
  • อาจใช้เวลาถึงหนึ่งนาทีในการจดจําทางลัดใหม่สําหรับ API ของตาราง