引用格式:徐睿,劉金,馮志,等. 基于知識圖譜與本體驅動的數據建模框架[J].網絡安全與數據治理,2025,44(8):39-45.
引言
數據建模作為數據治理的核心任務,通常采用實體-關系模型,通過定義實體、屬性和關系等抽象結構來描述數據的語義,再映射為具體的數據庫表、字段及約束,從而實現數據的存儲與管理。然而,隨著數據量的迅猛增長以及業務需求的日益復雜,傳統的關系型數據建模方法逐漸暴露出諸多局限性。例如,傳統方法依賴于靜態的表結構和字段定義,難以有效處理多維度、動態變化的數據關系,也很難適應異構數據源的集成需求。隨著大數據、人工智能和知識圖譜等新興技術的快速發展,數據建模的范式也在發生深刻變化。
在這一背景下,知識圖譜和動態本體技術可以在數據治理領域發揮重要作用。知識圖譜通過圖結構表示實體及其關系,并能夠通過語義推理揭示數據之間的深層次聯系。本體則為知識圖譜提供了一個規范的語義框架,幫助明確各類實體及其屬性的定義及相互關系。知識圖譜和動態本體的結合,不僅提供了更靈活的建模手段,還能夠促進跨系統的數據集成,提升數據的語義理解與質量控制。
這一映射過程不僅是技術創新,也體現了對人類認知與理解世界方式的模擬。認知科學認為人類通過抽象符號、分類和關系表達知識,本體與知識圖譜正是構建這種抽象模型的工具。在智能化趨勢下,知識圖譜作為模擬人類認知的“圖式語言”,幫助機器理解、推理與學習數據,例如結合圖神經網絡(Graph Neural Network,GNN)進行推理與分析[1]。在網絡安全領域,知識圖譜能夠通過路徑推理識別攻擊者的潛在利用路徑(如漏洞→系統→攻擊者),或通過關系映射發現未修復漏洞的關聯防御措施。
在此基礎上,考慮到當前大部分業務系統的數據仍主要存儲于結構化數據庫中,而知識圖譜直接應用于業務系統的落地尚存在較大挑戰,因此本文提出一種基于知識圖譜和本體驅動的數據建??蚣堋Mㄟ^將知識圖譜中的實體、屬性和關系有效映射到數據庫表結構,實現從語義建模到結構化數據存儲的高效轉化;并結合威脅情報自動抽取、跨系統數據融合等業務應用場景驗證框架能力。
本文詳細內容請下載:
http://m.xxav2194.com/resource/share/2000006649
作者信息:
徐睿1,2,劉金1,2,馮志1,2,張雅勤1,2,董偉1,2
(1.中國信息安全研究院有限公司, 北京102209;
2.華北計算機系統工程研究所, 北京100083)