• <ul id="usaou"></ul>
  • 靈玖中科軟件(北京)有限公司
    主營產品:大數據搜索與挖掘
    產品展示 Products
    新聞動態 News
    NLPIR大數據分詞技術行業信息挖掘的推動者
    • 聯系人:張先生
    • QQ號碼:2794994234
    • 電話號碼:010-62648216
    • 手機號碼:13681251543
    • Email地址:2794994234@qq.com
    • 公司地址:北京市市轄區海淀區蘇州街盈智大廈
    產品介紹
      北京理工大學大數據搜索與挖掘實驗室張華平主任研發的NLPIR大數據語義智能分析技術是滿足大數據挖掘對語法、詞法和語義的綜合應用。NLPIR大數據語義智能分析平臺是根據中文數據挖掘的綜合需求,融合了網絡采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯網內容處理的全技術鏈條的共享開發平臺。
      NLPIR大數據語義智能分析平臺十三大功能:
      采集:對境內外互聯網海量信息實時采集,有主題采集(按照信息需求的主題采集)與站點采集兩種模式(給定網址列表的站內定點采集功能)。
      文檔轉化:對doc、excel、pdf與ppt等多種主流文檔格式,進行文本信息轉化,效率達到大數據處理的要求。
      新詞發現:從文本中挖掘出新詞、新概念,用戶可以用于專業詞典的編撰,還可以進一步編輯標注,導入分詞詞典中,提高分詞系統的準確度,并適應新的語言變化。
      批量分詞:對原始語料進行分詞,自動識別人名地名機構名等未登錄詞,新詞標注以及詞性標注。并可在分析過程中,導入用戶定義的詞典。
      語言統計:針對切分標注結果,系統可以自動地進行一元詞頻統計、二元詞語轉移概率統計。針對常用的術語,會自動給出相應的英文解釋。
      文本聚類:能夠從大規模數據中自動分析出熱點事件,并提供事件話題的關鍵特征描述。同時適用于長文本和短信、微博等短文本的熱點分析。
      文本分類:根據規則或訓練的方法對大量文本進行分類,可用于新聞分類、簡歷分類、郵件分類、文檔分類、區域分類等諸多方面。
      摘要實體:對單篇或多篇文章,自動提煉出內容摘要,抽取人名、地名、機構名、時間及主題關鍵詞;方便用戶快速瀏覽文本內容。
      智能過濾:對文本內容的語義智能過濾審查,內置國內詞庫,智能識別多種變種:形變、音變、繁簡等多種變形,語義排歧。
      情感分析:針對事先指定的分析對象,系統自動分析海量文檔的情感傾向:情感極性及情感值測量,并在原文中給出正負面的得分和句子樣例。
      文檔去重:快速準確地判斷文件集合或數據庫中是否存在相同或相似內容的記錄,同時找出所有的重復記錄。
      全文檢索:支持文本、數字、日期、字符串等各種數據類型,多字段的 搜索,支持AND/OR/NOT以及NEAR鄰近等查詢語法,支持維語、藏語、蒙語、阿拉伯、韓語等多種少數民族語言的檢索。
      編碼轉換:自動識別內容的編碼,并把編碼統一轉換為其他編碼。
    主站蜘蛛池模板: 欧美国产成人久久精品| 无码国产乱人伦偷精品视频| 最新国产乱人伦偷精品免费网站| 97久久精品人妻人人搡人人玩| 欧美精品黑人粗大| 91精品国产品国语在线不卡| 久久99精品久久只有精品| 精品人妻伦一二三区久久| 高清在线亚洲精品国产二区| 中文字幕精品无码一区二区| 国产精品麻豆入口| 久久夜色精品国产亚洲| 国产网红无码精品视频| 日韩精品一区二区三区不卡| 99在线精品免费视频| 久久丫精品国产亚洲av| 污污网站国产精品白丝袜| A级毛片无码久久精品免费| 国产成人精品高清在线观看99| 亚洲精品无码久久久久sm| 精品久久久久一区二区三区| 欧美亚洲国产精品第一页| A级精品国产片在线观看| 亚洲AV无码成人精品区在线观看| 欧美日韩精品| 国产在线精品国自产拍影院| 国产99久久九九精品无码| 国产福利91精品一区二区三区| 久久久国产乱子伦精品作者| 亚洲精品乱码久久久久久蜜桃不卡 | 中文字幕精品亚洲无线码一区| 国产欧美日韩综合精品一区二区三区 | 亚洲综合国产精品第一页| 精品99久久aaa一级毛片| 国产午夜亚洲精品理论片不卡| 91精品在线国产| 久热这里只精品99re8久| 久久国产精品国产自线拍免费| 久久国产精品-国产精品| 9999国产精品欧美久久久久久| 一级香蕉精品视频在线播放|