国产午夜成人免费看片无遮挡_日本免费xxxx色视频_免费人成网上在线观看_黄网址在线永久免费观看

當前位置:雨林木風下載站 > 網頁設計教程 > 詳細頁面

搜索引擎判定相似文章頁面的原理大解析

搜索引擎判定相似文章頁面的原理大解析

更新時間:2019-08-06 文章作者:未知 信息來源:網絡 閱讀次數:

SEO(Search Engine Optimization):漢譯為搜索引擎優化。是一種方式:利用搜索引擎的規則提高網站在有關搜索引擎內的自然排名。目的是:為網站提供生態式的自我營銷解決方案,讓其在行業內占據領先地位,獲得品牌收益;SEO包含站外SEO和站內SEO兩方面;為了從搜索引擎中獲得更多的免費流量,從網站結構、內容建設方案、用戶互動傳播、頁面等角度進行合理規劃,還會使搜索引擎中顯示的網站相關信息對用戶來說更具有吸引力。

  在上一篇文章中已經詳細的介紹了利用TF-IDF算法自動提取文章關鍵詞的原理。接下來,我們再來研究一下另一個相關的問題。這個問題也是我們做 SEO的最關心的,有些時候,我們除了要明白如何找到并提取文章關鍵詞,我們還需要找到與原文章相似的其他文章。比如,我們平時在搜索引擎的新聞欄目下搜索某條新聞的時候,在主新聞下方,還提供了多條相似的新聞。如下圖所示:

搜索引擎判定相似文章網頁的原理大解析 三聯

  為了找出相似的文章,我們就需要用到另外一個公式原理了,那就是“余弦相似性(cosine similiarity)”。

  一、什么是"余弦相似性"?

  余弦相似性是指通過測量兩個向量內積空間的夾角的余弦值來度量它們之間的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。從而兩個向量之間的角度的余弦值確定兩個向量是否大致指向相同的方向。兩個向量有相同的指向時,余弦相似度的值為1;兩個向量夾角為90° 時,余弦相似度的值為0;兩個向量指向完全相反的方向時,余弦相似度的值為-1。在比較過程中,向量的規模大小不予考慮,僅僅考慮到向量的指向方向。余弦相似度通常用于兩個向量的夾角小于90°之內,因此余弦相似度的值為0到1之間。

  值得注意的是余弦相似度可以用在任何維度的向量比較中,它尤其在高維正空間中的利用尤為頻繁。例如在信息檢索中,每個詞條擁有不同的度,一個文檔是由一個由有權值的特征向量表示的,權值的計算取決于詞條在該文檔中出現的頻率。余弦相似度因此可以給出兩篇文檔其主題方面的相似度。

  二、搜索引擎是如何判定相似文章的?

  下面,馬海祥還是以舉例子的方式來說明如何才能找出相似文章?

  為了簡單起見,我們先從句子著手。

  句子A: 我喜歡看電視,不喜歡看電影。

  句子B: 我不喜歡看電視,也不喜歡看電影。

  那么我們怎樣才能計算出上面兩句話的相似程度呢?

  馬海祥建議的基本思路是:如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。

  第1步:分詞

  句子A:我/喜歡/看/電視,不/喜歡/看/電影。

  句子B:我/不/喜歡/看/電視,也/不/喜歡/看/電影。

  第2步:列出所有的詞

  我,喜歡,看,電視,電影,不,也。

  第3步:計算詞頻

  句子A:我 1,喜歡 2,看 2,電視 1,電影 1,不 1,也 0。

  句子B:我 1,喜歡 2,看 2,電視 1,電影 1,不 2,也 1。

  第4步:寫出詞頻向量

  句子A:[1, 2, 2, 1, 1, 1, 0]

  句子B:[1, 2, 2, 1, 1, 2, 1]

  到這里,問題就變成了如何計算這兩個向量的相似程度。

  我們可以把它們想象成空間中的兩條線段,都是從原點([0, 0, ...])出發,指向不同的方向。兩條線段之間形成一個夾角,如果夾角為0度,意味著方向相同、線段重合;如果夾角為90度,意味著形成直角,方向完全不相似;如果夾角為180度,意味著方向正好相反。因此,我們可以通過夾角的大小,來判斷向量的相似程度。夾角越小,就代表越相似,如下圖所示:

2

  以二維空間為例,上圖的a和b是兩個向量,我們要計算它們的夾角θ。余弦定理告訴我們,可以用下面的公式求得:

3
4

  假定a向量是[x1, y1],b向量是[x2, y2],那么馬海祥覺得就可以將余弦定理改寫成下面的形式:

5
6

  數學家也已經證明,余弦的這種計算方法對n維向量也成立。假定A和B是兩個n維向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,則A與B的夾角θ的余弦等于:

7

  使用這個公式,我們就可以得到,句子A與句子B的夾角的余弦,如下圖所示:

8

  余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫“余弦相似性”。所以,上面的句子A和句子B是很相似的,事實上它們的夾角大約為20.3度。

  由此,我們就得到了“找出相似文章”的一種算法:

  (1)使用TF-IDF算法,找出兩篇文章的關鍵詞;

  (2)每篇文章各取出若干個關鍵詞(比如20個),合并成一個集合,計算每篇文章對于這個集合中的詞的詞頻(為了避免文章長度的差異,可以使用相對詞頻);

  (3)生成兩篇文章各自的詞頻向量;

  (4)計算兩個向量的余弦相似度,值越大就表示越相似。

  馬海祥覺得“余弦相似度”也可能只是搜索引擎在文章相識度其中的一方面的算法,但的確也是一種非常有用的算法,而且就是在其他領域的,只要是計算兩個向量的相似程度,都可以利用這個原理。

  本文為馬海祥博客原創文章,如有轉載,請注明原文摘自于http://www.mahaixiang.cn/seoyjy/293.html,注明出處;否則,禁止轉載,謝謝配合!

搜索引擎優化在國外發展迅速,國內也有眾多的優化愛好者。通過了解各類搜索引擎抓取互聯網頁面、進行索引以及確定其對特定關鍵詞搜索結果排名等技術,來對網頁進行相關的優化,使其提高搜索引擎排名。

溫馨提示:喜歡本站的話,請收藏一下本站!

本類教程下載

系統下載排行

国产午夜成人免费看片无遮挡_日本免费xxxx色视频_免费人成网上在线观看_黄网址在线永久免费观看

  • <label id="pxtpz"><meter id="pxtpz"></meter></label>
      1. <span id="pxtpz"><optgroup id="pxtpz"></optgroup></span>

        av不卡一区二区三区| 亚洲高清免费视频| 亚洲乱码中文字幕| 成人国产在线观看| 综合av第一页| 欧美羞羞免费网站| 免费在线成人网| 26uuu亚洲综合色欧美| 国产精品一卡二卡在线观看| 国产精品久线观看视频| 在线观看视频欧美| 久久99九九99精品| 自拍视频在线观看一区二区| 欧美亚洲综合色| 国产乱码字幕精品高清av| 国产精品女同一区二区三区| 欧美日韩情趣电影| 国产成人精品综合在线观看| 一级特黄大欧美久久久| 精品捆绑美女sm三区| 91玉足脚交白嫩脚丫在线播放| 五月激情丁香一区二区三区| 久久久精品一品道一区| 日本福利一区二区| 国产一区二区福利| 亚洲国产色一区| 日本一区二区三区在线不卡 | 国产精品一级二级三级| 亚洲三级在线看| 精品国产伦一区二区三区观看方式| 99久久99久久精品国产片果冻| 天堂成人免费av电影一区| 国产精品萝li| 久久久影院官网| 欧美精品黑人性xxxx| 国产91精品一区二区麻豆网站| 免费黄网站欧美| 国产精品久久免费看| 88在线观看91蜜桃国自产| av综合在线播放| 国产成人亚洲综合a∨婷婷| 丝袜美腿成人在线| 亚洲精品国产一区二区精华液| 欧美不卡一区二区| 欧美日韩二区三区| 91久久精品国产91性色tv| 国产高清亚洲一区| 麻豆国产91在线播放| 亚洲香肠在线观看| 亚洲视频一二区| 国产精品看片你懂得| 久久综合色一综合色88| 538prom精品视频线放| 欧美视频日韩视频| 欧美性色aⅴ视频一区日韩精品| 成人免费高清在线观看| 国产精品性做久久久久久| 卡一卡二国产精品| 久久福利资源站| 精品一区二区三区免费毛片爱| 天堂成人国产精品一区| 亚洲电影视频在线| 亚洲一二三级电影| 丝袜脚交一区二区| 奇米一区二区三区av| 日本一不卡视频| 老司机免费视频一区二区三区| 免费在线观看不卡| 国产精品一区二区三区网站| 福利视频网站一区二区三区| 99久久夜色精品国产网站| 99riav久久精品riav| 色综合一区二区| 欧美日韩一本到| 日韩三级av在线播放| 久久蜜桃av一区精品变态类天堂| 亚洲成人综合视频| 亚洲成人免费看| 日韩精品午夜视频| 另类调教123区| 东方欧美亚洲色图在线| 色噜噜久久综合| 欧美一级一区二区| 久久综合久久综合久久| 国产精品天美传媒| 亚洲444eee在线观看| 免费在线观看日韩欧美| 国产91露脸合集magnet| 色妞www精品视频| 欧美一区二区三区视频在线| 久久男人中文字幕资源站| 综合电影一区二区三区| 美女在线视频一区| k8久久久一区二区三区| 欧美男人的天堂一二区| 久久一日本道色综合| 亚洲福利视频导航| 国产成人无遮挡在线视频| 欧美三级电影一区| 一色桃子久久精品亚洲| 久久99国内精品| 在线观看三级视频欧美| 26uuu欧美日本| 日韩在线观看一区二区| 99久久伊人网影院| 精品少妇一区二区三区日产乱码 | 精品99999| 亚洲欧美日韩中文字幕一区二区三区 | 毛片不卡一区二区| 在线观看日韩毛片| 亚洲欧美自拍偷拍| 国产99久久久久| 日韩美女主播在线视频一区二区三区| 自拍偷拍国产精品| 国产一区二区导航在线播放| 91精品国产欧美一区二区 | 久久免费国产精品| 日韩和欧美一区二区三区| 91极品视觉盛宴| 国产精品美女久久久久久| 美女免费视频一区二区| 制服视频三区第一页精品| 亚洲最色的网站| 9色porny自拍视频一区二区| 久久久久99精品国产片| 精品一区二区三区不卡| 欧美成人三级电影在线| 麻豆成人在线观看| 欧美大片一区二区| 成人福利视频网站| 蜜桃一区二区三区四区| 91精品91久久久中77777| 亚洲手机成人高清视频| 99久久国产综合精品女不卡| 日本一区二区三区视频视频| 成人免费黄色在线| 成人免费在线视频观看| 91污在线观看| 亚洲久本草在线中文字幕| 97se亚洲国产综合在线| 亚洲色欲色欲www| 色哟哟欧美精品| 18欧美亚洲精品| 色成人在线视频| 亚洲国产中文字幕在线视频综合| 欧美亚洲尤物久久| 亚洲一区二区三区四区不卡| 精品视频在线看| 裸体歌舞表演一区二区| 欧美va天堂va视频va在线| 国产精品夜夜爽| 亚洲色图在线视频| 欧美亚洲动漫制服丝袜| 青青草国产精品97视觉盛宴 | 国产精品日日摸夜夜摸av| 不卡av免费在线观看| 夜夜嗨av一区二区三区网页| 欧美一区二区福利在线| 国产成人啪午夜精品网站男同| 欧美韩国一区二区| 欧洲视频一区二区| 另类小说图片综合网| 国产精品丝袜黑色高跟| 在线观看视频一区| 久久99精品久久久| 亚洲精品高清在线观看| 精品剧情v国产在线观看在线| jizzjizzjizz欧美| 免费成人在线视频观看| 国产精品毛片大码女人| 日韩免费电影一区| 色妹子一区二区| 久久 天天综合| 日韩理论电影院| 精品久久久久久最新网址| 91麻豆高清视频| 国产一区二区三区视频在线播放| 亚洲免费观看高清完整版在线观看熊 | 国产一区二区三区在线观看免费视频| 亚洲欧洲国产日本综合| 精品福利在线导航| 欧美三级电影精品| 91在线观看一区二区| 国产自产视频一区二区三区| 亚洲一区二区三区在线播放| 国产日韩欧美不卡在线| 91麻豆精品国产综合久久久久久| 成人丝袜高跟foot| 91免费小视频| 国产精品一二三在| 美国十次综合导航| 日韩高清不卡一区二区三区| 综合久久给合久久狠狠狠97色 | 国产伦精品一区二区三区免费迷| 亚洲一区二区三区视频在线 | 6080国产精品一区二区| 91视频免费播放| 成人av网站免费观看| 国产九九视频一区二区三区| 蓝色福利精品导航|