• <noframes id="4bvqq"><button id="4bvqq"><delect id="4bvqq"></delect></button></noframes>

      <legend id="4bvqq"></legend>
      <kbd id="4bvqq"></kbd>

      1. <strike id="4bvqq"><label id="4bvqq"><td id="4bvqq"></td></label></strike>
        <strike id="4bvqq"></strike>
        當前位置:首頁(yè) ? 新手上路 ? 談?wù)剶祿幙椗c數據網(wǎng)格、數據虛擬化、數據湖的區別

        談?wù)剶祿幙椗c數據網(wǎng)格、數據虛擬化、數據湖的區別

        來(lái)源:數據驅動(dòng)智能 作者:曉曉 更新時(shí)間:2023/2/27 10:22:59

        摘要:與數據湖不同,數據編織不需要將數據移動(dòng)到集中位置,而是依賴(lài)強大的數據治理策略來(lái)實(shí)現數據管理統一。

        什么是數據虛擬化

        根據Gartner的定義,虛擬化是IT資源的抽象,它向資源用戶(hù)掩蓋了它們的物理性質(zhì)和邊界。將定義擴展到數據,數據虛擬化是數據集成的概念,它通過(guò)消除數據孤島和連接所有數據資產(chǎn)來(lái)創(chuàng )建虛擬抽象層。它為數據生態(tài)系統中的不同應用程序提供了一個(gè)通用層。

        DAMA(國際數據管理協(xié)會(huì ))是這樣定義數據虛擬化的:

        數據虛擬化使分布式數據庫和多個(gè)異構數據存儲能夠作為單個(gè)數據庫進(jìn)行訪(fǎng)問(wèn)和查看。因此,數據虛擬化服務(wù)器不是使用轉換引擎對數據進(jìn)行物理ETL,而是虛擬地執行數據提取、轉換和集成。

        數據虛擬化的目標是構建所有數據的單一視圖,無(wú)論來(lái)源或格式如何,而無(wú)需物理復制或移動(dòng)該數據。

        什么是數據湖

        數據湖是存儲從各種源系統(事務(wù)數據庫、傳感器設備、SaaS應用程序、文件共享系統等)收集的信息副本的存儲庫,以其本機格式供ML解決方案處理、備份和歸檔、大數據分析等。

        首先,從各種來(lái)源獲取的信息進(jìn)入著(zhù)陸區,在那里它暫時(shí)保持原樣。當一家公司建立了持續攝取、提取、轉換和加載(ETL)和變更數據捕獲(CDC)能力時(shí),多類(lèi)型信息可以在創(chuàng )建后立即進(jìn)入數據湖。一旦數據進(jìn)入湖中,每組數據都會(huì )被分配一個(gè)唯一的指示符或索引,以及一個(gè)元數據標簽,以加快查詢(xún)速度并幫助用戶(hù)快速查找請求的數據。之后,數據可能會(huì )經(jīng)過(guò)清洗、重復數據刪除、重新格式化、豐富等操作,然后移至可信區域進(jìn)行永久存儲。當信息準備好供下游用戶(hù)使用時(shí),它可能會(huì )直接進(jìn)入報告和儀表板,或者經(jīng)過(guò)另一輪ETL并存儲在數據倉庫中以供進(jìn)一步處理。

        什么是數據編織

        數據編織是一種設計方法,它意味著(zhù)將數據生態(tài)系統的復雜組件組合到一個(gè)統一的平臺中,以提供完整和有凝聚力的數據管理。與數據湖不同,數據編織不需要將數據移動(dòng)到集中位置,而是依賴(lài)強大的數據治理策略來(lái)實(shí)現數據管理統一。

        為了促進(jìn)跨不同系統訪(fǎng)問(wèn)信息、管理其生命周期并將其公開(kāi)給最終用戶(hù),DataFabric架構支持:

        數據整合

        任何信息,無(wú)論其類(lèi)型、數量和位置如何,都可以被用戶(hù)整合和訪(fǎng)問(wèn),因為數據編織允許利用數據虛擬化層來(lái)整合數據,而無(wú)需移動(dòng)數據和創(chuàng )建大量副本。除此之外,為了保證數據的完整性,DataFabric可以采用ETL、CDC、流處理等。

        智能數據目錄

        數據目錄是企業(yè)擁有的所有數據的詳細清單。隨著(zhù)數據編織統一了大量信息,數據目錄維護元數據以幫助數據消費者(包括分析師、數據庫工程師、科學(xué)家、業(yè)務(wù)用戶(hù)等)查找和理解數據、跟蹤其沿襲、評估和管理數據等等.

        動(dòng)態(tài)元數據管理

        數據編織通常采用人工智能功能,幫助自動(dòng)檢測、分析、收集和激活元數據。

        數據治理

        數據治理確保數據消費者在各自的策略(訪(fǎng)問(wèn)策略、屏蔽策略、數據質(zhì)量策略等)的幫助下只能訪(fǎng)問(wèn)他們需要的高質(zhì)量信息,這些策略由于元數據激活功能而自動(dòng)執行。

        什么是數據網(wǎng)格

        數據網(wǎng)格是一種分布式數據架構,在集中管理和互操作性標準化下,由共享和協(xié)調的自助數據基礎設施支持。數據網(wǎng)格模式代表分散的和特定領(lǐng)域的數據所有權,這些數據所有權很容易被發(fā)現并可供組織中的每個(gè)人使用。

        數據網(wǎng)格有幾個(gè)區別于其他模式的關(guān)鍵特征:

        數據所有權:數據網(wǎng)格跨不同域存儲數據。此數據由領(lǐng)域專(zhuān)家維護和管理。

        數據作為產(chǎn)品:每個(gè)數據域都被視為一個(gè)產(chǎn)品,用戶(hù)就是它的客戶(hù)。

        自助數據平臺:數據網(wǎng)格提倡建立一個(gè)生態(tài)系統,支持創(chuàng )建、使用和維護數據產(chǎn)品,而無(wú)需專(zhuān)業(yè)知識或復雜工具和技術(shù)方面的專(zhuān)業(yè)知識。

        聯(lián)合計算治理:分散的數據產(chǎn)品可能導致數據孤島。聯(lián)合治理方法將與數據相關(guān)的規則、定義和過(guò)程標準化。

        數據網(wǎng)格脫離了集中存儲、轉換和處理分析數據的概念。相反,它提倡每個(gè)業(yè)務(wù)領(lǐng)域負責托管、準備數據并將其提供給自己的領(lǐng)域和更大的受眾。

        比較:數據編織與數據虛擬化

        數據編制是一種用于現代數據管理的端到端架構。數據結構用于簡(jiǎn)化數據發(fā)現、治理和主動(dòng)元數據管理。當組織需要一個(gè)集中式平臺來(lái)訪(fǎng)問(wèn)、管理和治理所有數據時(shí),應使用數據結構。數據虛擬化創(chuàng )建了一個(gè)數據抽象層來(lái)集成所有數據,而無(wú)需物理移動(dòng)數據。當需要快速集成數據時(shí),使用數據虛擬化。數據虛擬化應被視為數據結構架構的核心元素之一。

        數據虛擬化改變了數據到達分析師、數據科學(xué)家、企業(yè)或應用程序手中的方式。它不是將數據物理地移動(dòng)到云端或本地,而是創(chuàng )建一個(gè)抽象層或數據虛擬化層。因此,它連接到不同的數據源、攝取數據、執行 ETL 過(guò)程并創(chuàng )建虛擬數據層,從而允許用戶(hù)實(shí)時(shí)利用來(lái)自多個(gè)來(lái)源的數據。

        Data Virtualization 是支持 Data Fabric 的技術(shù)之一。Data Fabric 是一個(gè)端到端數據管理架構,其目標或用例不僅僅是在云端或業(yè)務(wù)分析師手中獲取數據,而是處理更廣泛的情況,如客戶(hù)智能或客戶(hù) 360 度視圖或物聯(lián)網(wǎng)分析。Data Fabric 適用于更大范圍的技術(shù)堆棧。

        比較:數據編織與數據湖

        數據湖是數據和數據資產(chǎn)的存儲庫,而數據編織是提取和利用此類(lèi)信息的方法。許多專(zhuān)家認為這兩個(gè)短語(yǔ)是同義詞,使用數據編織從存儲的數據中提取最大價(jià)值是最好的方法。但是,它們之間存在顯著(zhù)差異。

        數據湖是未排序或索引的原始形式的數據存儲庫。數據可能是從簡(jiǎn)單文件到大型二進(jìn)制對象的任何內容,例如視頻、音頻、圖像或多媒體文件。提取數據后,會(huì )對其進(jìn)行評估和操作以使其可用。

        術(shù)語(yǔ)“數據編織”是指一個(gè)組織的數據在所有存儲和使用場(chǎng)景中使用的系統,它使用同一組協(xié)議、流程、組織和安全性。

        比較:數據編織與數據網(wǎng)格

        盡管數據編織和數據網(wǎng)格這兩個(gè)術(shù)語(yǔ)有時(shí)可以互換使用,但它們代表了截然不同的概念。一般來(lái)說(shuō),數據編織和數據網(wǎng)格的相似之處在于它們都是識別企業(yè)如何管理大量存儲信息的技術(shù)。數據編織方法旨在通過(guò)在數據保存的地方構建一個(gè)管理層來(lái)規范數據。后者與前者的不同之處在于,某些類(lèi)型的數據管理的各個(gè)方面由組織內利用該信息的團隊或小組處理。

        另一方面,數據編織是一種以技術(shù)為中心的架構方法,可解決數據和元數據的難題。相比之下,數據網(wǎng)格更側重于組織變革,強調人員和程序而不是架構。

        機房360微信公眾號訂閱
        掃一掃,訂閱更多數據中心資訊

        本文地址:http://www.digitalgaraz.com/news/2023227/n3649151543.html 網(wǎng)友評論:閱讀次數:
        版權聲明:凡本站原創(chuàng )文章,未經(jīng)授權,禁止轉載,否則追究法律責任。
        轉載聲明:凡注明來(lái)源的文章其內容和圖片均為網(wǎng)上轉載,非商業(yè)用途,如有侵權請告知,會(huì )刪除。
        相關(guān)評論
        正在加載評論列表...
        評論表單加載中...
        • 我要分享
        推薦圖片
        久久免费中文视频_自拍亚洲欧美变态重口_国产亚洲精品久久久久久久无码_天天日天天cao