產(chǎn)品介紹
近年來,隨著云計算和物聯(lián)網(wǎng)概念的提出,信息技術(shù)得到了快速的發(fā)展,而大數(shù)據(jù)則是在此基礎(chǔ)上對現(xiàn)代信息技術(shù)革命的又一次顛覆,所以大數(shù)據(jù)技術(shù)主要是從多種巨量的數(shù)據(jù)中快速的挖掘和獲取有價值的信息技術(shù),因而在云時代的今天,大數(shù)據(jù)技術(shù)已經(jīng)被我們所關(guān)注,所以數(shù)據(jù)挖掘技術(shù)成為最為關(guān)鍵的技術(shù)。尤其是在當前在日常信息關(guān)聯(lián)和處理中越來越離不開數(shù)據(jù)挖掘技術(shù)和信息技術(shù)的支持。大數(shù)據(jù),而主要是對 的數(shù)據(jù)量較大的一個概括,且每年的數(shù)據(jù)增長速度較快。而數(shù)據(jù)挖掘,主要是從多種模糊而又隨機、大量而又復(fù)雜且不規(guī)則的數(shù)據(jù)中,獲得有用的信息知識,從數(shù)據(jù)庫中抽絲剝繭、轉(zhuǎn)換分析,從而掌握其潛在價值與規(guī)律。
北京理工大學大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的KGB知識圖譜引擎,KGB知識圖譜引擎(Knowledge Graph Builder)是基于自然語言理解、漢語詞法分析,采用KGB語法從結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文檔中抽取各類知識,大數(shù)據(jù)語義智能分析與知識推理,深度挖掘知識關(guān)聯(lián),實時 構(gòu)建知識圖譜。
KGB知識圖譜引擎功能介紹
一、文檔提取
1、輕松解析多種格式文檔:KGB知識圖譜引擎,可輕松解析多種格式、多種版本文檔:TXT、DOC、EXCEL、PPT、PDF、XML等。對于圖片信息,OCR可自動識別并抽取圖片中的文字信息。
2、結(jié)構(gòu)化表格數(shù)據(jù)知識抽?。篕GB能夠自適應(yīng)解讀并抽取結(jié)構(gòu)化表格數(shù)據(jù),實現(xiàn)知識的快速生成
3、非結(jié)構(gòu)化文檔知識抽取:KGB知識規(guī)則引擎,快速定位非結(jié)構(gòu)化文檔中的關(guān)鍵信息(主體、時間、金額等), 抽取知識。
二、知識關(guān)聯(lián)
KGB知識圖譜引擎深入挖掘知識關(guān)聯(lián),將知識實體鏈接為有意義的知識事實。并具有強大的知識推理能力,推理暗含的知識與結(jié)論,豐富知識圖譜。
三、知識推理
KGB具有強大的知識推理能力,推理出暗含的知識,獲取更多知識與結(jié)論,豐富知識圖譜。
1、演繹歸納推理(一般—特殊):KGB能夠完成由一般特征到特殊個案的演繹知識推理和由特殊個案到一般特征的歸納知識推理,擴充大量暗含的知識,豐富知識圖譜。
2、知識計算(數(shù)值知識的加減乘除計算):對于數(shù)值型知識,KGB能夠識別并對數(shù)值型知識進行加減乘除的知識計算推理,并可對知識計算的準確性進行核查。
3、知識庫檢查:KGB能夠?qū)崟r檢查知識庫,糾正知識錯誤與沖突,保證知識圖譜正確性與一致性。