国产精品欧美一区二区久久不卡-久久综合婷婷亚洲五月-美女视频免费看是黄的-国产一区在线观看视频网站

起重學(xué)院
下載手機(jī)APP
當(dāng)前位置: 首頁(yè) ? 起重學(xué)院 ? 電子商務(wù) ? 正文

聚類搜索引擎概念和基本工作步驟解析

來(lái)源:中國(guó)起重機(jī)械網(wǎng)
|
|
|

隨著互聯(lián)網(wǎng)技術(shù)和互聯(lián)網(wǎng)應(yīng)用系統(tǒng)的快速發(fā)展,各個(gè)領(lǐng)域的互聯(lián)網(wǎng)應(yīng)用系統(tǒng)都已經(jīng)積累了海量的Web數(shù)據(jù),包括產(chǎn)品數(shù)據(jù)、用戶數(shù)據(jù)、評(píng)價(jià)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、狀態(tài)數(shù)據(jù)等等。這些數(shù)據(jù)不僅內(nèi)容極其豐富,而且很大程度上都開(kāi)放給互聯(lián)網(wǎng)用戶,可以免費(fèi)的訪問(wèn)、下載和處理。這就為進(jìn)一步集成和開(kāi)發(fā)這些Web數(shù)據(jù)的潛在價(jià)值,建立增值應(yīng)用提供了重要基礎(chǔ)。聚類搜索是近年來(lái)發(fā)展最為迅速的互聯(lián)網(wǎng)數(shù)據(jù)集成和增值技術(shù)。

 

聚類搜索是在垂直搜索基礎(chǔ)上發(fā)展起來(lái)的新型搜索技術(shù)。垂直搜索是主要針對(duì)行業(yè)的專業(yè)搜索,側(cè)重于某一行業(yè)領(lǐng)域,其目的是使用戶能夠更加方便地找出所需的專業(yè)信息。而聚類搜索是為了進(jìn)一步提高搜索的精度使其符合用戶的搜索習(xí)慣和興趣,在搜索引擎的搜索結(jié)果中進(jìn)行聚類,把搜索出來(lái)的信息進(jìn)行分類處理,將使信息資源更加清晰明了。

 

所謂聚類搜索引擎,就是運(yùn)用聚類技術(shù)對(duì)搜索結(jié)果進(jìn)行自動(dòng)聚類分析的搜索工具。其特點(diǎn)是去重性強(qiáng)、分類性強(qiáng)、匯集性強(qiáng),即可以及時(shí)去除重復(fù)信息,對(duì)搜索的結(jié)果進(jìn)行分門別類,并可以匯集各大知名搜索引擎的信息資源。

 

目前,典型的聚類搜索引擎的基本工作步驟為:①依據(jù)用戶查詢的關(guān)鍵字,從一個(gè)或多個(gè)搜索引擎獲取搜索結(jié)果;②對(duì)搜索結(jié)果進(jìn)行預(yù)處理,過(guò)濾掉重復(fù)、無(wú)效信息;③將文檔中關(guān)鍵短語(yǔ)作為特征提取出來(lái)生成聚類標(biāo)簽;④將文檔分配到生成的聚類標(biāo)簽下;⑤將聚類后的搜索結(jié)果進(jìn)行排序并顯示給用戶。

?

移動(dòng)版:聚類搜索引擎概念和基本工作步驟解析

?
恩施市| 即墨市| 滦南县| 沂源县| 三原县| 卢湾区| 大同市| 颍上县| 大新县| 临泽县| 左贡县| 鹿泉市| 都安| 石狮市| 措勤县| 阳城县| 文登市| 铁岭县| 郎溪县| 交城县| 黄陵县| 大英县| 商河县| 三河市| 毕节市| 珲春市| 盱眙县| 合山市| 玉田县| 始兴县| 聂拉木县| 湛江市| 互助| 阿拉善左旗| 广丰县| 资阳市| 沛县| 开平市| 南澳县| 平昌县| 阿坝县|