網(wǎng)站seo優(yōu)化:TF-IDF算法如何做詞頻和密度
相信很多互聯(lián)網(wǎng)工程師和網(wǎng)站優(yōu)化人員都知道TF-IDF算法。TF-IDF算法包含兩個(gè)值,一個(gè)是TF值,另一個(gè)則是IDF值。
TF值我們這里可以理解為關(guān)鍵詞密度(布局相關(guān)),只要相關(guān)度足夠高、可以直接修改某個(gè)關(guān)鍵詞的排名!
而IDF則是逆文檔頻次,這里可以用搜索引擎收錄總量除以包含某關(guān)鍵詞結(jié)果數(shù),然后再求結(jié)果的LOG值。
很多人聽了這個(gè)就是一個(gè)懵圈,其實(shí)在日常的優(yōu)化中,特別是企業(yè)網(wǎng)站優(yōu)化時(shí),這個(gè)值特別重要。搜索引擎優(yōu)化就是把比自己做到好的網(wǎng)站擠下去,讓自己的網(wǎng)站有好的排名,這就可以去看看排名比自己好的網(wǎng)站是怎么做到的?
經(jīng)過分析搜索結(jié)果頁(yè)每個(gè)鏈接,你會(huì)驚奇的發(fā)現(xiàn),TF-IDF值最高的,比如兩個(gè)關(guān)鍵詞最后一名,TFIDF值都是40+,和排名第一差距一倍多,但是排名也差N多(流量也差N多),并不是所有的東西越高越好。反觀也是一樣,TFIDF值為0或是比第一低很多的,同樣排名也并不好。這就告訴我們TF-IDF值并不是越高越好。
也就是說(shuō)在優(yōu)化網(wǎng)站搭建內(nèi)容的時(shí)候要選定一個(gè)TF-IDF值范圍,例如:我們要做離心機(jī)這個(gè)關(guān)鍵詞,可以計(jì)算出來(lái)排名在首頁(yè)網(wǎng)頁(yè)的TFIDF值,參考TF-IDF值布局關(guān)鍵詞,使自己網(wǎng)頁(yè)TFIDF值處于一個(gè)合適的位置,當(dāng)然這個(gè)合適的位置也有說(shuō)法,就拿這個(gè)詞舉例,排名第一的值為18,排名2,3的值均在10以下,我們可以把自己的值定在這區(qū)間,根據(jù)排名分析,如果網(wǎng)頁(yè)的TFIDF值太高、或是過低都不利于排名,那我們就取中間位置或平均值。
在網(wǎng)站內(nèi)容搭建時(shí),模擬搜索結(jié)果中關(guān)鍵詞的位置、個(gè)數(shù)、分詞、語(yǔ)序來(lái)搭建網(wǎng)站內(nèi)容,來(lái)達(dá)到網(wǎng)站的TFIDF值。網(wǎng)站搭建內(nèi)容達(dá)到數(shù)值的區(qū)間范圍也是有極強(qiáng)的技巧的。網(wǎng)站排名關(guān)鍵詞的數(shù)量和網(wǎng)站流量,都跟網(wǎng)站的詞庫(kù)相關(guān),網(wǎng)站詞庫(kù)和搜索引擎的詞庫(kù)關(guān)鍵詞匹配相同的關(guān)鍵詞數(shù)量越多,達(dá)到網(wǎng)站關(guān)鍵詞的密度要求,才會(huì)有排名、有流量。
?
中企網(wǎng)站認(rèn)為:網(wǎng)站優(yōu)化是一個(gè)關(guān)聯(lián)著網(wǎng)站建設(shè)、互聯(lián)網(wǎng)技術(shù)、搜索技術(shù)、算法 、語(yǔ)言的綜合體現(xiàn),網(wǎng)站結(jié)構(gòu)和頁(yè)面是基礎(chǔ),搜索引擎技術(shù)是載體,原創(chuàng)內(nèi)容是SEO的根本,也是打動(dòng)用戶形成流量轉(zhuǎn)化的核心。