• 模板建站
    培戀網博客
    企業動態 技術分享 行業動態

    搜索引擎如何實現用戶圖片檢索的需求滿足

    seo2023-04-20模板建站分享網站建設網站建設培戀網博客 模板網站優化 seo網站建設 培戀網博客
      一、什么是需求滿足   1.1什么是需求滿足   用戶來搜索“章魚保羅”,就文本相關性而言,搜索引擎只要返回和“章魚保羅”內容相關的結果就可以了,這樣用戶是否滿意呢?   用戶甲:聽說章魚帝掛了,來看看最新結果,怎么全是8月份的,往后翻頁中…   用戶乙:今天同事們在討論章魚哥掛了,章魚哥是啥?我又out了,來搜索一下章魚帝生平事跡是啥,怎么全是最新的結果,沒有章魚哥的介紹啊,變換個query看看   用戶丙:我是鐵桿球迷,看完章魚哥,再看看足球相關的吧,魯尼,杰拉德是否又進球了,怎么連個相關推薦都沒有,還得我親自輸入。   用戶丁:找個章魚哥的頭像用一下吧,一定很拉風,怎么全是結果沒有方圖呢,這么扁的圖怎么用啊   用戶戊:換個章魚哥的壁紙,也許下次買彩票能發大財,咦,怎么全是小尺寸的圖… 搜索引擎如何實現用戶圖片檢索的需求滿足   (以上信息通過分析2010-10-27用戶session得出。)   籠統的說,用戶向搜索引擎表達他的需求,搜索引擎理解用戶需求,提供各不同的需求下的資源,這整個過程可統稱為需求滿足。簡單說,就是除了基礎文字相關性之外的rank工作,都屬于需求滿足的范疇,也就是說,提供給用戶的檢索結果,不僅僅要求在字面上是和用戶輸入的文字相關的,還要滿足用戶的各種不同需求。   需求滿足在rank體系中所處的位置:   1.2為什么需要需求滿足   用戶通過query表達了自己的需求,而對于大部分query來說,尤其是具有隱含需求的query,僅僅字面匹配的查詢結果未必能夠滿足其需求。目前我們的排序系統是主要是基于文本相關性這個維度的,權值體現了query中的term與obj的相關程度,在這個體系下,相關的結果未必能夠滿足用戶需求。   例如前面提到的“章魚保羅”的例子,顯然,這些需求在文本相關性這個維度下很難解決,尤其涉及到突發時效性需求,泛需求等。   1.3需求滿足包含哪些工作   從上面的例子中,可以看出,需求滿足需要解決時效性需求問題,多需求問題,相關推薦,size需求,素材類需求,瀏覽引導等問題。除了基礎文本相關性以外的rank策略以及為了這些所做的query分析工作可認為屬于需求滿足的工作,另外還包括前端結果展現與用戶引導瀏覽的工作。   Image需求滿足,按照不同的維度,可以劃分為如下幾個方面:   a.需求識別   b.資源建設   c.需求調權   d.結果組織與推薦   e.用戶引導交互   二、需求滿足如何做   需求滿足要解決的核心問題:   需求識別   資源建設   需求調權   2.1需求的識別   2.1.1需求的類型   識別query有哪些需求,以及需求的強弱,是最基礎的工作。首先要有需求的體系,能完備的描述各種需求,其次是如何識別這些需求,把每個query的需求對應到這個體系中去。   基于統計的需求識別   通過對大量的數據統計分析,可以識別出query有哪些方面的共性。可供分析的數據很多,比如用戶行為數據,點擊反饋,檢索結果等。   比如:搜索“章魚保羅壁紙”,通過統計用戶點擊圖片的長寬數據,發現用戶點擊的圖片,大部分是長寬比較大的圖片,而“章魚保羅頭像”則恰恰相反。   又比如通過分析大量用戶的檢索數據,發現相當部分的用戶在檢索“章魚保羅”之后,又檢索了足球相關的關鍵詞,那么可以識別“章魚保羅”和足球有著很高的關聯度,在給用戶推薦相關搜索時,可以插入足球相關的推薦。   專名&需求詞   判斷query中包含專名或者需求詞等關鍵詞,是最直接的方式。比如“章魚保羅頭像”,用戶在query中顯示的表達了頭像方面的需求,其中就包含了尺寸方面的需求,頭像是需要小尺寸的圖,如右圖所示,這時候出一張大的圖片就不符合用戶需求了。   時效性需求   時效性需求的識別,主要是通過用戶檢索量的突發以及資源數的突發來判斷。   檢索量的突發,可以通過累積每個query的每天的用戶檢索頻率,用連續多天的用戶檢索頻率,計算當天檢索量和歷史比較,是否有突發,進而判斷是否有時效性需求的強弱。資源數方面的判斷,可通過類似的方式挖掘。   比如“章魚保羅”,在世界杯期間,該query,以及相關query的檢索量,相比世界杯之前,用戶檢索量有了爆發性的增長,并且持續保持在高檢索量的狀態,則可認為是有時效性需求的query。   2.2需求的滿足   識別出query有哪些需求,下一步的工作就是提供相應的資源。   2.2.1資源的挖掘   如何獲得滿足需求的資源,是需求滿足的另一個核心問題。在資源上,通過某一個或者幾個特征組合,能夠把滿足要求的資源和不滿足要求的資源區分開,找到用戶需求需要的資源,去掉不滿足要求的資源,是主要的工作。   內容屬性特征   對內容屬性維度來說,可以分為底層的物理特征,中層的物體識別和高層的語義特征。   對于底層的物理特征,相對比較簡單,包括尺寸,顏色,格式,清晰度飽和度等,中層特征,有人與非人的,色情圖片的,整車的識別,手機圖片的識別等;對于高層的語義特征,包括場景的識別,圖片風格的識別,情感的識別,比如是室內還是室外,是否非主流風格等,都可以作為資源篩選的特征。   話題屬性維度   話題屬性維度,是指動物,植物,帥哥,美女,軍事,體育等等各種不同的話題,我們希望把圖片能按照這樣一個分類進行一個劃分。   比如,通過這個分類,我們可以知道哪些圖片是頭像類的,哪些是壁紙的,哪些是足球體育相關的。用戶在搜索“章魚保羅”時,可以推薦足球相關的資源。   時效性資源的收錄   時效性資源,可以很容易的通過收錄時間來判斷,和非時效性資源區分開。時效性資源的來源一般包括新聞站點,各大論壇,bbs等社區類網站。   2.2.2需求調權   明確了query的需求,挖掘了滿足需求的資源,那么如何把滿足需求的資源rank到前端呢?   對于各種不同的需求維度,都有自己的調權的策略。比如“章魚保羅壁紙”,我們識別出有尺寸方面的需求,那么可以把尺寸比較大的圖片,進行加權;又比如時效性的需求,可以直接在前三頁插入的時效性庫的結果,這是因為時效性需求是一個強需求維度,簡單的加權,不能保證結果調整到前三頁。   目前這種策略直接疊加的調權方式,優點是簡單,直接,缺點也比較多,最大的是不可控,一個維度上的調權,會對最后結果造成多大的影響,他說的話分量有多大,不知道。 搜索引擎如何實現用戶圖片檢索的需求滿足   三、結語   對于需求滿足未來,要向智能化,自動化,多樣化的方向持續發展。我們最終的目標是把需求滿足這個方向做沒了,需求挖掘,資源滿足全部自動化,做到“手中無劍心中有劍”。

    培戀網原創版權,網站建設提供網站代運營、模板網站制作轉載請注明出處,本文地址:http://www.gdszrq.com/news/media/74915.html

    培戀網網站模板 培戀網 網站模板
    培戀網咨詢在線咨詢
    Copyright © 2002-2019 培戀網 版權所有 東莞網站地圖 網站相關鏈接:|SEO優化技巧|成都seo優化| 粵ICP備17138810號
  • 东京热网址