1、提取(qu)文字
由于搜索引擎(qing)蜘蛛(zhu)抓取的(de)(de)(de)是頁(ye)面(mian)(mian)的(de)(de)(de)HTML代(dai)碼,里(li)面(mian)(mian)包(bao)含了大(da)量的(de)(de)(de)HTML標(biao)簽(qian)、js等無法用到排名(ming)上(shang)的(de)(de)(de)內容,所以搜索引擎(qing)索引首(shou)先要(yao)做的(de)(de)(de)就是那(nei)其中的(de)(de)(de)HTML標(biao)簽(qian)、js去掉,保(bao)留(liu)剩下的(de)(de)(de)頁(ye)面(mian)(mian)文字內容。
2、中(zhong)文分詞
中文(wen)分詞是搜索引(yin)(yin)擎特(te)有(you)的步驟,英(ying)文(wen)單(dan)詞之(zhi)間會有(you)空格(ge)做分隔(ge),而中文(wen)詞與(yu)詞之(zhi)間沒有(you)分隔(ge)符號,一(yi)個(ge)句子字(zi)與(yu)詞都是連在一(yi)起的。中文(wen)搜索引(yin)(yin)擎必須首先分辨那幾個(ge)字(zi)組(zu)成一(yi)個(ge)詞,那些(xie)字(zi)本(ben)身就是一(yi)個(ge)詞。
3、去停(ting)止詞(ci)
在(zai)頁面內容(rong)(rong)中會(hui)存(cun)在(zai)很多(duo)對(dui)內容(rong)(rong)沒有影響的詞(ci),比(bi)如“的”、“之”、“啊”之類。搜索引擎在(zai)索引時會(hui)把這些詞(ci)去掉,讓(rang)頁面內容(rong)(rong)的主題更突出。
4、去重(為什么偽原創弊大于利)
搜(sou)(sou)索引擎為了減(jian)少搜(sou)(sou)索結果中出現的重復內容會(hui)選(xuan)取頁(ye)面(mian)內容中出現頻率最高的詞(ci),通常會(hui)選(xuan)出10個左右(you)關于(yu)頁(ye)面(mian)的關鍵(jian)詞(ci)來(lai)計(ji)算頁(ye)面(mian)的“指紋”。
5、索引
經過以上(shang)步驟(zou)之后,搜索引擎就可以提煉出可以代表一個頁面(mian)內容的(de)一些(xie)關鍵詞,同時記(ji)錄這些(xie)詞在網頁上(shang)出現的(de)頻率(lv)、出現次(ci)數、格式、位(wei)置等信息。
6、鏈接(jie)關(guan)系計算
在(zai)頁面(mian)(mian)中(zhong)存在(zai)連(lian)接時,搜索引擎會計算這些(xie)鏈(lian)(lian)接都(dou)只想(xiang)那些(xie)頁面(mian)(mian),每個(ge)頁面(mian)(mian)都(dou)有哪些(xie)導入鏈(lian)(lian)接,鏈(lian)(lian)接使用了(le)什(shen)么文(wen)字,這些(xie)復雜(za)的鏈(lian)(lian)接指向(xiang)關系(xi)形成了(le)網站和頁面(mian)(mian)的鏈(lian)(lian)接權重。
7、頁面質量(liang)判斷
在這個階段(duan),搜索引擎會(hui)對頁面(mian)內(nei)容質量、鏈接質量等作(zuo)出判斷,比如百度的綠(lv)蘿、石(shi)榴算法。
北京網站優化不再是簡單的發發外鏈,更新站內內容就可以的,需要我們深入去研究做網站優化的。網站想要有排名有好的排名是很難做的。北京高端網站建設公司提醒您,做網站優化一定要多方學習參考。做網站優化,一定要了解搜索引擎是如何工作的。
文章出自:北京網站建設公司-前潮網絡 //50859539.cn 如需轉載請注明,010-57227103.
校園跑(pao)腿app開(kai)發(fa)要具(ju)備什么條件?校園跑(pao)腿業...
對于不少大學生來講(jiang),平(ping)時吃飯(fan)離(li)不開一些校(xiao)園(yuan)跑腿(tui)外賣(mai)類app軟(ruan)件,而且校(xiao)園(yuan)跑腿(tui)app之所以能(neng)夠吃得開,就(jiu)是因為學生...
2023-11-30
教(jiao)育app應該怎樣(yang)提升用戶體驗呢?...
互聯網的快速發展,對傳統(tong)的教育方(fang)式產生了很大的影響。學生借助(zhu)線(xian)上學習平臺,更(geng)快捷、方(fang)便(bian)地學習;教師通過線(xian)上...
2023-10-10
在線教育(yu)類(lei)APP怎么(me)樣才能做(zuo)好呢?...
隨著時代的發展,傳統教育(yu)培訓機構(gou)在移動互聯網沖擊下,很(hen)多企業(ye)都開始轉(zhuan)型定制開發在線教育(yu)類(lei)APP軟件,尤其2020...
2023-10-09
北京教育(yu)類app開發,助力(li)行(xing)業進一步數字化轉...
AIGC是指生成式人工智能,是以(yi)往(wang)人工智能技(ji)術的集(ji)大成者,推(tui)動了(le)人工智能進(jin)入(ru)2.0時(shi)代(dai),算法的迭代(dai)更新(xin)使得AIGC技(ji)...
2023-10-08