Azure 資料目錄是完全受控的雲端服務,能讓使用者探索所需的資料來源,並理解所找到的資料來源。 同時,資料目錄可協助組織從現有的投資中獲得更多價值。
任何使用者 (分析師、資料科學家或開發人員) 都能在其資料橫向中利用資料目錄來探索、了解及取用資料來源。 資料目錄包含中繼資料和註釋的群眾協作模型,以便每個人都能參與,提升資料的可探索性和可用性。 它是單一的中心位置,能讓組織的所有使用者貢獻其專業知識,並建置資料的社群和文化特性。
探索資料取用者面臨的挑戰
傳統上,探索企業資料來源一向都是根據部落知識的一項有機程序。 對於想要從資訊資產取得最大價值的公司,這個方法會帶來許多挑戰:
- 使用者可能不知道某個資料來源是否存在,除非他們在其他流程中與它接觸。 沒有集中註冊資料來源的位置。
- 除非使用者知道資料來源的位置,否則他們無法使用用戶端應用程式連線到資料。 資料取用體驗需要使用者知道連接字串或路徑。
- 除非使用者知道資料來源文件的位置,否則無法了解資料的用途。 資料來源和文件可能會存在於許多地方,且可透過各種不同的體驗來取用。
- 如果使用者有關於資訊資產的疑問,必須洽詢負責資料的專家或小組,並讓它們離線參與。 資料與具有其使用觀點的專家之間,沒有任何明確的關聯。
- 除非使用者了解要求存取資料來源的程序,否則,探索資料來源及其文件仍無法協助他們存取資料。
探索資料產生者面臨的挑戰
雖然資料取用者面臨先前所述的挑戰,但負責產生和維護的資訊資產的使用者本身也面臨挑戰:
- 將資料來源加上描述性中繼資料註釋通常是徒勞無功。 用戶端應用程式通常會忽略儲存在資料來源的描述。
- 為資料來源建立文件往往是徒勞無功的努力。 讓文件與資料來源保持同步是持續性責任。 使用者可能對於即將過期的文件缺乏信任感。
- 建立及維護資料來源文件既複雜又耗時。 而要讓使用資料來源的每個使用者可隨時取得文件可能會更為艱鉅。
- 限制資料來源的存取權,並確保資料取用者知道如何要求存取,是一項持續的挑戰。
這些挑戰結合起來,會形成更大的障礙,使得公司更難以鼓勵和推動使用企業資料並加以了解。
Azure 資料目錄能提供協助
資料目錄旨在解決這些問題,有助於讓企業能夠充分利用現有的資訊資產。 資料目錄能讓管理資料的使用者輕鬆地探索和了解資料來源。
資料目錄提供雲端型服務,其中可以註冊資料來源。 資料會保留在現有的位置,但其中繼資料的複本會連同資料來源位置的參考,一起新增至資料目錄。 此中繼資料也會編製索引,以便透過搜尋輕鬆找到每個資料來源,並讓使用者容易理解它。
註冊資料來源之後,即可充實其中繼資料。 進行註冊的使用者或企業中的其他使用者可以新增中繼資料。 任何使用者都可以提供描述、標記或其他中繼資料 (例如要求資料來源存取的文件和程序) 來加註資料來源。 此描述性中繼資料可補充資料來源中已註冊的結構化中繼資料 (例如資料行名稱和資料類型)。
註冊來源的主要目的是為了探索和了解資料來源及其用途。 企業使用者可能需要的資料,是需要正確資料的資料商業智慧、應用程式開發、資料科學,或任何其他工作。 他們可以使用資料目錄探索體驗,快速尋找符合其需求的資料、了解資料以評估其適合的用途,並在其選擇的工具中開啟資料來源來取用資料。
同時,使用者可以透過標記、記錄和註解已註冊的數據來源來貢獻目錄。 他們也可以註冊新的資料來源,接著資料目錄的使用者社群便可加以探索、了解和取用。
深入了解資料目錄
若要深入了解資料目錄的功能,請參閱︰