產品介紹
隨著現代信息傳播技術手段和方式不斷豐富,信息獲取、信息傳遞、信息處理、信息再生、信息利用等功能應用日益多樣化,智能化信息系統逐漸形成一個信息網絡體系,人類社會的生產方式、工作方式、學習方式、交往方式、生活方式、思維方式等發生了極其深刻的變革,互動化、即時性、全媒體等成為常態性的信息生態環境,傳統的數據庫組織架構和信息服務模式己經難以適應信息社會現實需要,整個信息技術架構的革命性重構勢在必行,大數據成為信息技術發展的必由之路。
在大數據時代,數據挖掘是最關鍵的工作。大數據的挖掘是從海量、不完全的、有噪聲的、模糊的、隨機的大型數據庫中發現隱含在其中有價值的、潛在有用的信息和知識的過程,也是一種決策支持過程。其主要基于人工智能,機器學習,模式學習,統計學等。通過對大數據高度自動化地分析,做出歸納性的推理,從中挖掘出潛在的模式,可以幫助企業、商家、用戶調整市場政策、減少風險、理性面對市場,并做出正確的決策。
北京理工大學大數據搜索與挖掘實驗室張華平主任研發的NLPIR大數據語義智能分析技術是滿足大數據挖掘對語法、詞法和語義的綜合應用。NLPIR大數據語義智能分析平臺是根據中文數據挖掘的綜合需求,融合了網絡采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯網內容處理的全技術鏈條的共享開發平臺。
NLPIR大數據語義智能分析平臺主要有采集、文檔轉化、新詞發現、批量分詞、語言統計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉換等十余項功能模塊,平臺提供了客戶端工具,云服務與二次開發接口等多種產品使用形式。各個中間件API可以無縫地融合到客戶的各類復雜應用系統之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統平臺,可以供Java,Python,C,C#等各類開發語言使用。
大數據挖掘已成為大數據技術最重要的應用,它從大數據中提取、挖掘對業務發展有價值的、潛在的知識,找出趨勢,為決策層提供有力依據,對產品或服務發展方向起到積極作用,將有力推動企業內部的科學化、信息化管理。在信息管理領域,綜合應用數據分析技術和人工智能技術,獲取用戶知識、文獻知識等各類知識,將是實現知識檢索和知識管理發展的必經之路。