數據衰減,指數據的老化和過時,由于數據的完整性、一致性和準確性喪失而不再可用。不再容易解讀的數據無法被有效利用,因此缺乏價值。在接下來的5年中,全球預計將產生超過180 ZB的數據,這意味著數據衰減肯定會以比現在更快的速度發生。
數據衰減的產生
數據衰減一般是數據管理不善的癥狀,多數是因為數據生命周期流程很少或沒有到位,通常有幾種情況會導致數據衰減。最常見的情況是客戶記錄(例如銷售、營銷和 CRM 數據)沒有得到維護。一般情況下,任何組織都沒有單一的數據源,而是跨多個平臺、格式和視圖的數據存儲庫。在不斷變化和發展的業務系統中,如果維護不當,數據集的鏈接和完整性可能很快就會損壞和過時。
另一個導致數據衰減的是人為因素。很多情況下,在業務流程的某個節點或時間,數據是手動輸入的。一旦輸入錯誤或不正確的信息進入系統,就會發生數據不一致、數據衛生不良和衰減。當前,企業正以平均每文件12次的速度復制數據,這意味著單個錯誤可能會產生指數級損害的復合影響。此外,所有數據都有一個生命周期——這意味著數據被創建、使用和監控,并且在某個時候,它不再適合存儲必須被安全地處理。
數據衰減的應對
我們生活在一個由數據驅動的世界,幾乎每個組織都必然會發生數據衰減。老化和囤積過多的文件并不少見,從安全和監管的角度來看,企業需要采取積極措施防止損壞。
建議采用以下流程:
盡可能減少手動操作,通過自動化手段輸入信息。
確保所有數據創建都發生在其源頭(例如,來自客戶),并通過強大的輸入驗證,在可能的情況下進行獨立驗證(例如,地址數據庫、政府 ID 的校驗和驗證等)。
在所有數據存儲中定期進行數據完整性檢查來驗證所有記錄集之間強壯、安全的鏈接。
持續監控所有數據位置,以確保負責驗證數據的人員首先知道數據位置。隨著數據跨端點、服務器、電子郵件、業務應用程序、第三方和云存儲使用和存儲,數據衰減或數據丟失,仍然是組織面臨的最大挑戰之一,組織需要持續提高管理數據,并確保其機密性、完整性和可用性的能力。