1、內(nèi)容質(zhì)量好:
百度搜索引擎認(rèn)為內(nèi)容質(zhì)量好的網(wǎng)頁,花費了較多時間和精力編輯,傾注了編者的經(jīng)驗和專業(yè)知識;內(nèi)容清晰、完整且豐富;資源有效且優(yōu)質(zhì);信息真實有效;安全無毒;不含任何作弊行為和意圖,對用戶有較強(qiáng)的正收益。對這部分網(wǎng)頁,百度搜索引擎會提高其展現(xiàn)在用戶面前的機(jī)率。例如:
專業(yè)醫(yī)療機(jī)構(gòu)發(fā)布的內(nèi)容豐富的醫(yī)療專題頁面;
資深工程師發(fā)布的完整解決某個技術(shù)問題的專業(yè)文章;
專業(yè)視頻網(wǎng)站上,播放清晰流暢的正版電影或影視全集頁面;
知名 B2C 網(wǎng)站上,一個完整有效的商品購買頁;
權(quán)威新聞?wù)驹瓌?chuàng)或經(jīng)過編輯整理的熱點新聞報道;
經(jīng)過網(wǎng)友認(rèn)真編輯,內(nèi)容豐富的詞條;
問答網(wǎng)站內(nèi),回答的內(nèi)容可以完美解決提問者的問題。
2、內(nèi)容質(zhì)量中:
內(nèi)容質(zhì)量中等的網(wǎng)頁往往能滿足用戶需求,但未花費較多時間和精力進(jìn)行制作編輯,不 能體現(xiàn)出編者的經(jīng)驗和專業(yè)知識;內(nèi)容完整但并不豐富;資源有效但質(zhì)量欠佳;信息雖真實 有效但屬采集得來;安全無毒;不含作弊行為和意圖。在互聯(lián)網(wǎng)中,中等質(zhì)量網(wǎng)頁其實是一 個比較大的數(shù)量集合,種類面貌也繁雜多樣,百度搜索引擎在評價這類網(wǎng)頁時往往還要考慮 其它非常多因素。在這里,我們僅部分舉例來讓各位感受一下:
論壇類網(wǎng)站里一個普通的帖子;
一個普通的問答網(wǎng)頁;
沒有進(jìn)行任何編輯,直接轉(zhuǎn)載其它網(wǎng)站的新聞;
無版權(quán)信息的普通電影播放頁
采集知名小說網(wǎng)站的盜版小說頁。
3、內(nèi)容質(zhì)量差:
百度搜索引擎認(rèn)為主體內(nèi)容信息量較少,或無有效信息、信息失效過期的都屬于內(nèi)容質(zhì) 量差網(wǎng)頁,對用戶沒有什么實質(zhì)性的幫助,應(yīng)該減少其展現(xiàn)的機(jī)會。同時,如果一個網(wǎng)站內(nèi) 該類網(wǎng)頁的占比過大,也會影響百度搜索引擎對站點的評級,尤其是 UGC 網(wǎng)站、電商網(wǎng)站、 黃頁網(wǎng)站要尤其重視對過期、失效網(wǎng)頁的管理。例如:
已下架的商品頁,或已過期的團(tuán)購頁;
已過有效期的招聘、交易頁面;
資源已失效,如視頻已刪除、軟件下載后無法使用等。
4、沒有內(nèi)容質(zhì)量可言:
沒有內(nèi)容質(zhì)量可言的網(wǎng)頁指那些制作成本很低,粗制濫造;從別處采集來的內(nèi)容未經(jīng)最 起碼的編輯整理即放置線上;掛木馬等病毒;含有作弊行為或意圖;完全不能滿足用戶需求, 甚至含有欺騙內(nèi)容的網(wǎng)頁。例如:
內(nèi)容空短,有很少量的內(nèi)容,卻不能支撐頁面的主要意圖;
問答頁有問無答,或回答完全不能解決問題;
站內(nèi)搜索結(jié)果頁,但沒有給出相關(guān)信息
除上述網(wǎng)頁外,欺騙用戶和搜索引擎的網(wǎng)頁在無內(nèi)容質(zhì)量可言集合里占很高比例。百度搜索引擎對作弊網(wǎng)頁的定義是:不以滿足用戶需求為目的,通過不正當(dāng)手段欺騙用戶和搜索引擎從而獲利的網(wǎng)頁。目前互聯(lián)網(wǎng)上這部分網(wǎng)頁還屬少數(shù),但作弊網(wǎng)頁的價值是負(fù)向的,對 用戶的傷害非常大,對這類網(wǎng)頁,搜索引擎持堅決打擊態(tài)度。
2.2 衡量網(wǎng)頁質(zhì)量的維度——瀏覽體驗
不同質(zhì)量的網(wǎng)頁帶給用戶的瀏覽體驗會有很大差距,一個優(yōu)質(zhì)的網(wǎng)頁給用戶的瀏覽體驗應(yīng)該是正向的。用戶希望看到干凈、易閱讀的網(wǎng)頁,排版混亂、廣告過多會影響用戶對網(wǎng)頁主體內(nèi)容的獲取。在百度搜索引擎網(wǎng)頁質(zhì)量體系中,用戶對網(wǎng)頁主體內(nèi)容的獲取成本與瀏覽體驗呈反比,即獲取成本越高,瀏覽體驗越低。面對內(nèi)容質(zhì)量相近的網(wǎng)頁,瀏覽體驗佳者更容易獲得更高的排位,而對于瀏覽體驗差的網(wǎng)頁,百度搜索引擎會視情況降低其展現(xiàn)的機(jī)率甚至拒絕收錄。
影響用戶瀏覽體驗好壞的因素很多,目前百度搜索引擎主要從內(nèi)容排版、廣告影響兩方面對網(wǎng)頁進(jìn)行考量。
內(nèi)容排版
用戶進(jìn)入網(wǎng)頁第一眼看到的就是內(nèi)容排版,排版決定了用戶對網(wǎng)頁的第一印象,也 決定了用戶對內(nèi)容獲取的成本。
廣告影響
百度搜索引擎理解網(wǎng)站的生存發(fā)展需要資金支持,對網(wǎng)頁上放置正當(dāng)廣告持支持態(tài) 度。網(wǎng)頁應(yīng)該以滿足用戶需求為主旨,最佳狀態(tài)即“主體內(nèi)容與廣告一起滿足用戶 需求,內(nèi)容為主,廣告為輔”,而不應(yīng)讓廣告成為網(wǎng)頁主體。
下面我們通過舉例來感受一下百度搜索引擎是如何對網(wǎng)頁的瀏覽體驗進(jìn)行分類的,站長 可以據(jù)此對比檢驗自己站點的瀏覽體驗如何:
1、瀏覽體驗好:
頁面布局合理,用戶獲取主體內(nèi)容成本低,一般具有以下特征:
排版合理,版式美觀,易于閱讀和瀏覽;
用戶需要的內(nèi)容占據(jù)網(wǎng)頁最重要位置;
能夠通過頁面標(biāo)簽或頁面布局十分清楚地區(qū)分出哪些是廣告;
廣告不搶占主體內(nèi)容位置,不阻礙用戶對主要內(nèi)容的獲?。?/p>
2、瀏覽體驗差:
頁面布局和廣告放置影響了用戶對主體內(nèi)容的獲取,提高了用戶獲取信息的成本,令用 戶反感。包括但不僅限于以下情況:
正文內(nèi)容不換行或不分段,用戶閱讀困難;
字體和背景顏色相近,內(nèi)容辨別困難;
頁面布局不合理,網(wǎng)頁首屏看不到任何有價值的主體內(nèi)容;
廣告遮擋主體內(nèi)容;或者在通用分辨率下,首屏都是廣告,看不到主體內(nèi)容;
彈窗廣告過多;
影響閱讀的浮動廣告過多
點擊鏈接時,出現(xiàn)預(yù)期之外的彈窗;
廣告與內(nèi)容混淆,不易區(qū)分;
2.3 衡量網(wǎng)頁質(zhì)量的維度——可訪問性
用戶希望快速地從搜索引擎獲取到需要的信息,百度搜索引擎盡可能為用戶提供能一次 性直接獲取所有信息的網(wǎng)頁結(jié)果。百度搜索引擎認(rèn)為不能直接獲取到主體內(nèi)容的網(wǎng)頁對用戶 是不友好的,會視情況調(diào)整其展現(xiàn)機(jī)率。
百度搜索引擎會從正常打開、權(quán)限限制、有效性三方面判斷網(wǎng)頁的可訪問性,對于可以 正常訪問的網(wǎng)頁,可以參與正常排序;對于有權(quán)限限制的網(wǎng)頁,再通過其它維度對其進(jìn)行觀 察;對于失效網(wǎng)頁,會降權(quán)其展現(xiàn)機(jī)制甚至從數(shù)據(jù)庫中刪除。
1、可正常訪問的網(wǎng)頁
無權(quán)限限制,能直接訪問所有主體內(nèi)容的網(wǎng)頁。
2、有權(quán)限限制的網(wǎng)頁
此類網(wǎng)頁分為兩種:打開權(quán)限和資源獲取權(quán)限
1)打開權(quán)限
指打開網(wǎng)頁都需要登錄權(quán)限,沒有權(quán)限完全無法看到具體內(nèi)容,普通用戶無法獲取或獲取成本很高,百度搜索引擎會降低其展現(xiàn)機(jī)率。不包括以登錄為主要功能的網(wǎng)頁。
2)資源獲取權(quán)限
指獲取網(wǎng)頁主要內(nèi)容,如文檔、軟件、視頻等,需要權(quán)限或者需要安裝插件才能獲得完 整內(nèi)容。此時會分三種情況:
提供優(yōu)質(zhì)、正版內(nèi)容的網(wǎng)站,由于內(nèi)容建設(shè)成本很高,盡管查看全文或下載時需要權(quán)限或安裝插件,但屬于用戶預(yù)期之內(nèi),百度搜索引擎也不認(rèn)為權(quán)限行為對用戶造成傷害,給予與正??稍L問頁面相同的對待。
對于一些非優(yōu)質(zhì)、非正版的資源,來自于用戶轉(zhuǎn)載甚至機(jī)器采集,本身成本較低,內(nèi)容也不獨特,用戶獲取資源還有權(quán)限限制——需要用戶注冊登錄或者付費查看,百度搜索引擎會根據(jù)具體情況決定是否調(diào)整其展現(xiàn)。
還有一些視頻、下載資源頁,也許自身資源質(zhì)量并不差,但需要安裝非常冷門的插件才能正常訪問,比如要求安裝“xx 大片播放器”,百度搜索引擎會懷疑其有惡意傾向。
3、失效網(wǎng)頁
往往指死鏈和主體資源失效的網(wǎng)頁。百度搜索引擎認(rèn)為這部分網(wǎng)頁無法提供有價值信息, 如果站點中此類網(wǎng)頁過多,也會影響百度搜索引擎對其的收錄和評級。建議站長對此類網(wǎng)頁 進(jìn)行相應(yīng)設(shè)置,并及時登錄百度站長平臺,使用死鏈提交工具告知百度搜索引擎。
失效網(wǎng)頁包括但不僅限于:
404、403、503 等網(wǎng)頁;
程序代碼報錯網(wǎng)頁;
打開后提示內(nèi)容被刪除,或因內(nèi)容已不存在跳轉(zhuǎn)到首頁的網(wǎng)頁;
被刪除內(nèi)容的論壇帖子,被刪除的視頻頁面(多出現(xiàn)在 UGC 站點)
3 互聯(lián)網(wǎng)網(wǎng)頁資源現(xiàn)狀
CNNIC2014 年年初發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》中稱:截至 2013 年 12 月,中國網(wǎng)頁數(shù)據(jù)為 1500 億,相比 2012 年同期增長了 22.2%。2013 年中國單個網(wǎng)站的 平均網(wǎng)頁數(shù)和單個網(wǎng)頁的平均字節(jié)數(shù)均維持增長,顯示出中國互聯(lián)網(wǎng)上的內(nèi)容更為豐富:平 均網(wǎng)站的網(wǎng)頁數(shù)達(dá)到 4.69 萬個,較去年同期增長 2.3%。
為了保證搜索質(zhì)量、提高用戶使用滿意度,百度搜索引擎每周都會進(jìn)行網(wǎng)頁質(zhì)量抽樣評 估。然而從近一年的評估數(shù)據(jù)中我們發(fā)現(xiàn),優(yōu)質(zhì)網(wǎng)頁的絕對數(shù)量非常少,且?guī)缀鯖]有增長; 普通網(wǎng)頁的占比在下降,相應(yīng)的,質(zhì)差網(wǎng)頁的比例卻有明顯上漲。截至 2014 年 5 月,統(tǒng)計 數(shù)據(jù)顯示,在百度網(wǎng)頁搜索發(fā)現(xiàn)的海量網(wǎng)頁中,優(yōu)質(zhì)網(wǎng)頁僅占 7.4%,質(zhì)差網(wǎng)頁高達(dá) 21%, 其余普通網(wǎng)頁為 71.6%。
百度網(wǎng)頁搜索通過一系列篩選、識別、分析、賦權(quán)等工作,努力將更多優(yōu)質(zhì)網(wǎng)頁呈現(xiàn)在 用戶面前,每天約打擊上萬質(zhì)量差網(wǎng)站,涉及網(wǎng)頁達(dá)百萬量級,盡可能減少質(zhì)量差網(wǎng)頁給用 戶帶來的干擾。從下圖 2014 年 5 月的網(wǎng)頁展現(xiàn)分析數(shù)據(jù)顯示,目前展現(xiàn)在用戶面前的網(wǎng)頁 質(zhì)量分布中,優(yōu)質(zhì)網(wǎng)頁占比為 40%,質(zhì)量差網(wǎng)頁降為 11%——雖然這個變化已經(jīng)非常明顯, 但百度網(wǎng)頁搜索還是希望能和廣大站長一起努力,將質(zhì)量差占比降到更低。
上述質(zhì)量差網(wǎng)頁包括低質(zhì)網(wǎng)頁和垃圾網(wǎng)頁兩部分,低質(zhì)網(wǎng)頁問題分布如下圖所示:
從上圖我們看出,目前低質(zhì)網(wǎng)頁中最嚴(yán)重的問題即因廣告過多、占據(jù)網(wǎng)頁主要位置以及 超預(yù)期彈窗帶來的瀏覽體驗差,內(nèi)容空短、網(wǎng)頁需要權(quán)限才能獲取資源和過期信息也是低質(zhì) 網(wǎng)頁的重要組成部分。
質(zhì)量差網(wǎng)頁中除了低質(zhì)網(wǎng)頁外,無任何質(zhì)量可言的垃圾頁面的問題分布如下圖所示:
死鏈對用戶、網(wǎng)站和搜索引擎來說都已沒有存在的意義,垃圾網(wǎng)頁中占比最大。其次是 對用戶和搜索引擎?zhèn)薮蟮淖鞅拙W(wǎng)頁,資源無效、有問無答和不相關(guān)搜索結(jié)果頁這些極大 浪費用戶時間的網(wǎng)頁也是搜索引擎不希望呈現(xiàn)給用戶的。
4 百度搜索引擎給站長的建議
上面介紹了百度搜索引擎對網(wǎng)頁質(zhì)量的判定標(biāo)準(zhǔn),與這些標(biāo)準(zhǔn)相應(yīng)的,站長在實際工作 中應(yīng)該遵循幾項原則:
設(shè)計網(wǎng)頁時主要考慮的是用戶,而非搜索引擎
永遠(yuǎn)將用戶體驗放在首位
根據(jù)用戶需求制作內(nèi)容
多考慮如何讓自己的網(wǎng)站具有獨特價值
將目光放長遠(yuǎn),濫放廣告弊大于利
及時刪除低質(zhì)內(nèi)容
不要企圖用任何方式欺騙用戶和搜索引擎