แชร์ผ่าน


โครงสร้างที่เก็บข้อมูลสําหรับกระแสข้อมูลการวิเคราะห์คืออะไร

กระแสข้อมูลการวิเคราะห์จัดเก็บทั้งข้อมูลและข้อมูลเมตาใน Azure Data Lake Storage กระแสข้อมูลใช้โครงสร้างมาตรฐานเพื่อจัดเก็บและอธิบายข้อมูลที่สร้างขึ้นในที่จัดเก็บข้อมูลดิบ ซึ่งเรียกว่าโฟลเดอร์ Common Data Model ในบทความนี้ คุณจะได้เรียนรู้เพิ่มเติมเกี่ยวกับมาตรฐานการจัดเก็บข้อมูลที่กระแสข้อมูลใช้เบื้องหลัง

ที่เก็บข้อมูลต้องการโครงสร้างสําหรับกระแสข้อมูลการวิเคราะห์

ถ้า กระแสข้อมูลเป็นมาตรฐาน ข้อมูลจะถูกเก็บไว้ใน Dataverse Dataverse เปรียบเสมือนระบบฐานข้อมูล มีแนวคิดของตาราง มุมมอง และอื่นๆ Dataverse เป็นตัวเลือกการจัดเก็บข้อมูลที่มีโครงสร้างที่ใช้โดยกระแสข้อมูลมาตรฐาน

อย่างไรก็ตาม เมื่อกระแสข้อมูลเป็น การวิเคราะห์ ข้อมูลจะถูกเก็บไว้ใน Azure Data Lake Storage ข้อมูลและเมตาดาต้าของกระแสข้อมูลจะถูกเก็บไว้ในโฟลเดอร์ Common Data Model เนื่องจากบัญชีที่เก็บข้อมูลอาจมีกระแสข้อมูลหลายรายการที่เก็บไว้ในนั้น จึงมีการนําลําดับชั้นของโฟลเดอร์และโฟลเดอร์ย่อยมาใช้เพื่อช่วยจัดระเบียบข้อมูล โฟลเดอร์และโฟลเดอร์ย่อยอาจแสดงถึงพื้นที่ทํางาน (หรือสภาพแวดล้อม) แล้วโฟลเดอร์ Common Data Model ของกระแสข้อมูล ทั้งนี้ขึ้นอยู่กับผลิตภัณฑ์ ภายในโฟลเดอร์ Common Data Model ทั้ง Schema และข้อมูลของตารางกระแสข้อมูลจะถูกเก็บไว้ โครงสร้างนี้เป็นไปตามมาตรฐานที่กําหนดไว้สําหรับ Common Data Model

ไดอะแกรมของกระแสข้อมูลการวิเคราะห์ที่จัดเก็บข้อมูลในโครงสร้าง Common Data Model

โครงสร้างการจัดเก็บ Common Data Model คืออะไร

Common Data Model เป็นโครงสร้างข้อมูลเมตาที่กําหนดไว้เพื่อนํามาซึ่งความสอดคล้องและความสอดคล้องสําหรับการใช้ข้อมูลในหลายแพลตฟอร์ม Common Data Model ไม่ใช่ที่เก็บข้อมูล แต่เป็นวิธีการจัดเก็บและกําหนดข้อมูล

โฟลเดอร์ Common Data Model กําหนดวิธีการจัดเก็บ Schema ของตารางและข้อมูล ใน Azure Data Lake Storage ข้อมูลจะถูกจัดระเบียบในโฟลเดอร์ โฟลเดอร์สามารถแสดงถึงพื้นที่ทํางานหรือสภาพแวดล้อม ภายใต้โฟลเดอร์เหล่านั้น จะมีการสร้างโฟลเดอร์ย่อยสําหรับกระแสข้อมูลแต่ละรายการ

สกรีนช็อตของโครงสร้างโฟลเดอร์พื้นที่ทํางาน

มีอะไรอยู่ในโฟลเดอร์กระแสข้อมูล

โฟลเดอร์กระแสข้อมูลแต่ละโฟลเดอร์ประกอบด้วยโฟลเดอร์ย่อยสําหรับแต่ละตารางและไฟล์เมตาดาต้าที่ชื่อmodel.json

ไดอะแกรมของโฟลเดอร์ Common Data Model ที่มีโฟลเดอร์ย่อยสําหรับแต่ละตารางและไฟล์ข้อมูล

ไฟล์ข้อมูลเมตา: model.json

model.jsonไฟล์คือข้อกําหนดข้อมูลเมตาของกระแสข้อมูล ไฟล์นี้เป็นไฟล์เดียวที่มีข้อมูลเมตาของกระแสข้อมูลทั้งหมด ซึ่งประกอบด้วยรายการของตาราง คอลัมน์ และชนิดข้อมูลในแต่ละตาราง ความสัมพันธ์ระหว่างตาราง และอื่นๆ คุณสามารถส่งออกไฟล์นี้จากกระแสข้อมูลได้อย่างง่ายดาย แม้ว่าคุณจะไม่สามารถเข้าถึงโครงสร้างโฟลเดอร์ Common Data Model ก็ตาม

สกรีนช็อตของรายการกระแสข้อมูลที่แสดงวิธีการส่งออกไฟล์ model.json จากกระแสข้อมูล

คุณสามารถใช้ไฟล์ JSON นี้เพื่อโยกย้าย (หรือนําเข้า) กระแสข้อมูลของคุณไปยังพื้นที่ทํางานหรือสภาพแวดล้อมอื่นได้

สกรีนช็อตของหน้าการสร้างกระแสข้อมูลที่มีการเลือก นําเข้าแบบจําลอง

เมื่อต้องการเรียนรู้ว่าไฟล์เมตาดาต้าของ model.json มีอะไรบ้าง ไปที่ ไฟล์เมตาดาต้า (model.json) สําหรับ Common Data Model

ไฟล์ข้อมูล

นอกจากไฟล์เมตาดาต้าแล้ว โฟลเดอร์กระแสข้อมูลยังมีโฟลเดอร์ย่อยอื่นๆ กระแสข้อมูลจะจัดเก็บข้อมูลสําหรับแต่ละตารางในโฟลเดอร์ย่อยที่มีชื่อของตาราง ข้อมูลสําหรับตารางอาจถูกแบ่งออกเป็นหลายพาร์ติชันข้อมูล ซึ่งจัดเก็บในรูปแบบ CSV

วิธีการดูหรือเข้าถึงโฟลเดอร์ Common Data Model

ถ้าคุณกําลังใช้กระแสข้อมูลที่ใช้ที่เก็บข้อมูลที่จัดทําโดยผลิตภัณฑ์ที่สร้างขึ้น คุณจะไม่สามารถเข้าถึงโฟลเดอร์เหล่านั้นได้โดยตรง ในกรณีดังกล่าว การรับข้อมูลจากกระแสข้อมูลจําเป็นต้องใช้ตัวเชื่อมต่อกระแสข้อมูล Microsoft Power Platform ที่มีอยู่ในผลิตภัณฑ์ รับประสบการณ์ข้อมูล ในบริการของ Power BI, Power Apps และ Dynamics 35 Customer Insights หรือใน Power BI Desktop

สกรีนช็อตของหน้า เลือกแหล่งข้อมูล โดยเน้นตัวเชื่อมต่อกระแสข้อมูล Power Platform

หากต้องการเรียนรู้วิธีการทํางานของกระแสข้อมูลและการรวม Data Lake Storage ภายใน ไปที่ กระแสข้อมูลและการรวม Azure Data Lake (พรีวิว)

หากองค์กรของคุณเปิดใช้งานกระแสข้อมูลเพื่อใช้ประโยชน์จากบัญชี Data Lake Storage และถูกเลือกเป็นเป้าหมายการโหลดสําหรับกระแสข้อมูล คุณยังคงสามารถรับข้อมูลจากกระแสข้อมูลได้โดยใช้ตัวเชื่อมต่อกระแสข้อมูล Power Platform ตามที่กล่าวไว้ก่อนหน้านี้ แต่คุณยังสามารถเข้าถึงโฟลเดอร์ Common Data Model ของกระแสข้อมูลได้โดยตรงผ่านที่จัดเก็บข้อมูลดิบ แม้จะอยู่นอกเครื่องมือและบริการของ Power Platform การเข้าถึงที่จัดเก็บข้อมูลดิบสามารถทําได้ผ่านพอร์ทัล Azure, Microsoft Azure Storage Explorer หรือบริการหรือประสบการณ์อื่นๆ ที่รองรับ Azure Data Lake Storage สําหรับข้อมูลเพิ่มเติม ไปที่ เชื่อมต่อ Azure Data Lake Storage Gen2 สําหรับที่เก็บข้อมูลกระแสข้อมูล