搜索引擎和搜索引擎優化(SEO)一直是一對矛盾,合理的優化有助于搜索引擎對網站內容的識別,有助于網站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以期達到增加頁面收錄數和頁面排名的目的。

早期的要害字堆砌SPAM作弊方式之一,是將中文詞庫中的單詞直接用軟件拼湊成文章,這樣的文章沒有實際的意義,只能給搜索引擎看。那么對于這樣的文章,搜索引擎是通過什么方式來識別的呢?

我們知道,每個搜索引擎都有網頁質量監控部門,對于百度等摻雜人工處理的搜索引擎而言,用戶發現這樣的網站,投訴到百度,百度直接封了這個網站了事。但對于Google這樣的封站也是自動處理的搜索引擎而言,對要害字堆砌作弊的識別就顯得更為重要了。

對于要害字堆砌作弊方式的識別,搜索引擎一般采用統計分析的方法進行。

搜索引擎首先將網頁進行分詞,分詞完成后可以得到詞的數量N和文章長度L,從大量文章的統計中發現文章的長度L和詞的數量N兩個數字之間存在一定的分布關系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說一篇長度為1000字節的文章中,應該有125-250個分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個比值的范圍會有所不同。假如搜索引擎發現L/N非凡大,那么這篇文章就存在就存在要害字堆砌現象了,假如L/N非凡小,則可能是這篇文章是由一些詞所組成的沒有意義的文章,筆者對泥胚文章中的不同作者發表的文章進行了驗證,基本上都服從這個比值范圍。

進一步,通過大量正常文章統計發現,文章中密度最高的幾個要害字出現的次數之和與N/L存在一定的分布關系,搜索引擎就可以通過網頁中的分布與統計結果的分布圖進行比較得出文章是否存在要害字堆砌的現象。

此外,搜索引擎還將從停止字的比例來判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,假如文章中停止字的比例在正常的比例范圍之外,這個網頁應提交到網頁質量監控部門審核。

當然,還有更多的算法可以對網頁與自然語言的文章進行比較分析,以判別文章是否為自然文章。

所謂魔高一尺、道高一丈,有些作弊者已經放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過爬蟲或其它方式獲得網上文章的句子,并用軟件將數十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語義的分析來判定是否作弊了,然而目前關于語義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。

然而我們仍然不能將自動文章生成一棍子打死,基于人工智能的文章生成仍然是人類研究自身語言以及自身智能的一個重要方向。作弊與反作弊,將能促使人類對人工智能的研究。

假如到最后,軟件能生成人類能夠理解的文章,這是SPAM還是精華?你能肯定地說目前存在的智能化程度還不夠高的RSS聚合文章一定是SPAM嗎?然而,假如這樣的文章海量的出現,我們又該如何去面對這個現象?

參考文獻:《搜索引擎原理、實踐和應用》盧亮、張博文,2007

EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()

百度經過將近一個月的“調整”,終于在昨天即3月13號對網站收錄、排名進行了大更新。論壇里又出現了很多問百度更新網站被k,要害字排名下降等等問題。伴隨著百度的每一次調整,總少不了站長們的哀聲抱怨或滿心喜悅。
不過為什么,說百度K站的人多呢?其實獲得好排名的網站也不少,只是在網站方面,很多站長是報憂不報喜罷了。排名上去了,自己興奮不告訴別人,因為沒有必要拿自己的成績去炫耀。


中國人有一個特點。當你在外闖蕩江湖的時候,假如你處境好,賺錢了,你會說:哎呀,窮死了,啥都沒賺到;當你處境窘迫時,你會說:還不錯,賺了點錢了。呵呵,面子問題。在網站上,同樣適用。有錢人不會說自己有錢,別人只能猜測而已。


很多人問:網站被K,被百度降權了,怎么辦?我的回答很簡單:去掉網站上任何過度優化的地方,保持更新,維持一定的優質外鏈,baidu不會拋棄你的。而這只是需要時間,耐心等待。


這次百度大更新是有來頭的。昨天,我看一些網站的快照時間已經變成了2.25號的樣子了,百度快照回檔的現象也不是少見了,這往往就是百度要更新的前兆,果不其然,今天再到百度查詢要害字,百度快照時間已經更新為昨天的的快照也就是3.13號的。百度快照的時間雖然發生變化,但點擊快照進去查看內容,可以發現,內容并沒有發生變化,虛假的快照時間,還是那句話,百度伺服器數據同步問題。


另外,“無為”提醒大家:網站改版要謹慎,尤其是網站的首頁標題,一旦改版,百度很有可能會封存你的網站一段時間,雖然不會降權你的網站,但是百度就是不更新你的任何頁面,估計那滋味也不好受。假如你的又被百度封存了,你可以采用我上面的這篇文章里提到的方法來刺激一下百度,不過這個方法要少用;用多了,惹惱了百度,直接?嚓。

EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()

半年前我寫了《中國SEOer的幾個級別,你屬于哪類?》后,不少朋友加我QQ說幫助他們了解到自己的水平。今天這篇《SEOer發展過程中的5道檻》,其實是記錄KYW在SEO道路上,心智成熟的過程。希望可以對有志于在SEO道路上前行的朋友有借鑒作用。

下面是KYW在不同時期的心理變化(本文說心理狀態,不說SEO技術)。

第一道檻:剛接觸SEO的時候

心理特征:

1. 好奇心:滿世界的找SEO教程,想了解更多。

2. 興奮:看了些教程后,感覺SEO并不神秘,教程一看就明白,心理說:“不難啊”,因此會一口氣看非常多的文章,連續好些日子,只看文章不實踐。

Kyw回頭看:回想這段日子,文章看的的確多,但記住的很少,能沉淀下來實際用上的就更少了。早點實踐,會更好。

第二道檻:第一個案例不知道為啥排名還不上去的時候

心理特征:
1. 迷茫:KYW的第一個案例是www.jinpingmei.org.cn,當時根據教程,把能優化的方法都用上后,就天天更新,想著排名會上升。但2個月過去了,排名依然在50名開外,這時就迷茫了,心里說:“還能怎樣優化?”。

2. 焦慮:開始尋找相關的案例,開始在論壇發問。

Kyw回頭看:這個階段,其實缺乏耐心,對排名周期的不了解造成了不知所措,手忙腳亂。其實大可不必這樣,耐心更新網站就可以了。另外,這個時期,加外鏈的概念還很淡,也不知道怎么加外鏈。

第三道檻:碰到群發軟件時

心理特征:

1. 好奇心:滿世界找群發軟件,了解黑帽SEO。

2. 依靠感:一旦你用群發軟件有成功案例后,你對黑帽的依靠會非常大,開始天天群發,不花時間看白帽技術,自己的SEO技術也及停滯不前了。

Kyw回頭看:當年我用的群發軟件是《全能營銷破解版》,里面有個TB群發的功能。找到后自然很興奮,群發了一天。第二天,依舊打開全能營銷,開始發發發,看著上面嘩嘩的群發記錄,幾秒鐘后我忽然就把軟件關了,接著卸載軟件徹底刪除“全能營銷”。這樣做的原因有2個:(我曾經這樣刪除過魔獸、浩方、跑跑卡丁車)

1. 我意識到自己的變化:沒用群發前我一開電腦,就泡在ZAC、老黑、點石等博客中,大量閱讀大量學習。但用了群發后,很難控制那種依靠感,群發一開,你對白帽就完全放棄了,沒心情看那些SEO高手寫的博客,并且把SEO技術和群發畫上了等號。

2. 軟件效率低:群發也很討厭,弄的機器很慢,而且成功率太低。

第四道檻:面對發展機會

心理特征:

1. 自信:當不斷的有人找你咨詢,有客戶要求服務時,自信開始建立。

2. 稚嫩:面對合作機會,你會考慮的很少,馬上開始執行,并沒有深入研究。

Kyw回頭看:這個階段,也就在我博客排名和人氣開始攀升的時候,客戶、獵頭、愛好者圍繞著你。這個階段布滿自信甚至自大,感覺SEO可以和任何行業合作,開展電子商務,未來前途光明。假如你在這個階段找KYW合作開展電子商務,我當下就會答應,開始起草合同,建立網站。這時期的KYW考慮合作項目多,合作伙伴的人品等方面考慮的少。

第五道檻:面對金錢

心理特征:

1. 成熟:有人要求合作或服務時,我把對方人品考慮進去,不會急于展開合作。

2. 坦然:經過大量SEO實踐后,面對一切SEO技術上的問題,例如“收錄下降”“排名丟失”感覺都很正常,不慌不忙的進行因對和觀察。

3. 平和:面對項目帶來的利潤,你對分配方式有自己的考慮,是拋棄合作伙伴,還是繼續深度合作呢?

Kyw回頭看:假如你現在正和伙伴開著網店賺著錢,請千萬不要有下面的想法:

1. 網站流量都是我創造的,我已經可以脫離合伙人了。

2. 網站利潤也是我創造的,當時簽合作協議時,上面的利潤分配應我應該要求更多。

假如你有上面的想法,并且天天纏繞著你,KYW是不看好這樣的合作伙伴的。

EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()

關鍵詞排名是SEO的一部分,而且是比較初級的那部分。真正的全面的SEO所包含的內容,比關鍵詞排名要廣泛的多。這一點很多人都在談,大部分人也都承認。可是從很多博客及論壇帖子來看,要真正理解并且貫徹到SEO工作中,卻并不容易。口頭上說是一回事,真正做起來時,很多人還是把關鍵詞排名做為SEO的主要部分。

我個人對關鍵詞排名及SEO總體的認識,也是經過了一段時間。剛開始時,由于經驗和自己做站的局限,同樣也是只把注意力放在關鍵詞排名上。每天查看要做的關鍵詞名單排名的變化,記錄下排名變化與網站所做的改變之間的關系。必須說這種方法是有效的,但是現在看來卻是很片面的。

關鍵詞排名在我的頭腦里大大貶值的觸發點是給客戶優化的一個SEO案例。自己做的站通常都比較小,不過幾百個頁面而已。那次接了一個客戶的網站,是電子商務網站,產品有上萬種,所以網站頁面也是上萬。當然,這比起國內很多站長來說,還是小菜一碟。這個站卻給了我很大震動。

給這個網站做完關鍵詞調查,然后整站做完頁面優化后,三個星期之內,流量提高了十倍。但吊詭的是,主要關鍵詞排名只是從七八十位,提高到四五十位,從主要關鍵詞來的流量很少很少,基本沒什么變化。流量之所以提高十倍,是由于網站整體結構及頁面因素的全面優化,很容易的使長尾關鍵詞排名提高。

那個時候好像還沒看到長尾這本書,但是卻不得不驚訝于這些小詞的力量。其實不用費很大勁,卻能使流量有如此巨大變化。而且不是從幾十個IP到幾百個IP,而是幾千IP到幾萬IP。

在前兩天的SEO專家訪談帖子留言中,讀者太累人說:

一個星期完成項目,我希望ZAC說的清楚一些,是一個星期PR值到了幾了。還是關鍵詞排名升呢第一位,還是外部鏈接,通過雇員到PR>4的博客發留言呢?還是怎么沒技術含量的工作。難道SEO門檻這么低,會打字就會SEO?那也太傻瓜了。

其實就我的經驗,很多網站流量有質的飛躍,靠網站結構及頁面因素優化就能做到。但是你卻看不出PR和關鍵詞排名有什么變化,也不用做什么外部鏈接。說它門檻低也不盡然,因為絕大部分人恰恰優化不好這些看似簡單的東西。

所以在我看來,SEO優化是個總體工作。只有在幾種情況下,才應該把關鍵詞排名看的比較重要:牽扯到品牌,商標等網站比較小,沒希望靠長尾來流量所針對的關鍵詞確實搜索量巨大,而且網站產品或服務比較單一,不容易擴展到其他長尾關鍵詞 對絕大部分網站來說,整體優化所帶來的流量提高,其性能價格比要比特定關鍵詞高的多。

EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()

The only purpose of 'customer service'...

is to change feelings. Not the facts, but the way your customer feels. The facts might be the price, or a return, or how long someone had to wait for service. Sometimes changing the facts is a shortcut to changing feelings, but not always, and changing the facts alone is not always sufficient anyway.

If a customer service protocol (your call center/complaints department/returns policy) is built around stall, deny, begrudge and finally, to the few who persist, acquiesce, then it might save money, but it is a total failure.

The customer who seeks out your help isn't often looking to deplete your bank account. He is usually seeking validation, support and a path to feeling the way he felt before you let him down.

The best measurement of customer support is whether, after the interaction, the customer would recommend you to a friend. Time on the line, refunds given or the facts of the case are irrelevant. The feelings are all that matter, and changing feelings takes humanity and connection, not cash.

http://sethgodin.typepad.com/seths_blog/2012/10/the-only-purpose-of-customer-service.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+typepad%2Fsethsmainblog+%28Seth%27s+Blog%29

EMBA的小眼睛 發表在 痞客邦 留言(0) 人氣()