產(chǎn)品介紹
ei檢索學(xué)術(shù)論文發(fā)表周期,ei期刊發(fā)表黃金期、ei檢索出版物、ei不收純理論文章
EI檢索論文相似性檢索24小時(shí)服務(wù)熱線:177-3280-1703 WX
QQ:130-4296-054 楊編輯
E-mail:qikanfabiaoyang@
研究背景隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展和流行,Web已經(jīng)成為人們查詢科技論文的主要形式。目前的搜索引擎部分地解決了Web資源的定位問(wèn)題,但搜索模式仍限于分類或關(guān)鍵字索引,也因此帶來(lái)了諸多不利。目前EI檢索論文主要采用基于查詢項(xiàng)匹配的EI檢索方法。這種方法首先對(duì)全文進(jìn)行索引,然后計(jì)算文檔和查詢?cè)~匯之間的相似度,查詢結(jié)果按照相似度進(jìn)行排序輸出。通常使用的計(jì)算相似度的方法是向量空間模型(Salton,1989),這種模型可以對(duì)文檔關(guān)鍵字的權(quán)值賦值,但無(wú)法表達(dá)關(guān)鍵字之間的聯(lián)系。
其帶來(lái)的問(wèn)題:(1)關(guān)鍵字不能準(zhǔn)確表達(dá)用戶需求。用戶很難選擇準(zhǔn)確的關(guān)鍵字來(lái)進(jìn)行搜索,因?yàn)槠渲猩婕暗讲樵兒透拍钪g的語(yǔ)義映射問(wèn)題,用戶給出的查詢關(guān)鍵字不能很好地反映用戶的意圖(2)關(guān)鍵字不能反映論文內(nèi)容。如果關(guān)鍵詞外延太大,就很難或者無(wú)法EI檢索到相關(guān)論文。(3)一詞多義現(xiàn)象。由于關(guān)鍵字匹配技術(shù)很難解決一詞多義現(xiàn)象,往往會(huì)EI檢索出大量無(wú)關(guān)信息。(4)關(guān)鍵字以同義方式在文中出現(xiàn)。用戶的查詢關(guān)鍵字有時(shí)并不在文中直接出現(xiàn),而是以同義詞、近義詞或者關(guān)鍵字的其他構(gòu)詞方式出現(xiàn),這樣,論文就不能EI檢索到。