Google Sitemap詳細(xì)制作教程_Xml教程
推薦:在XsltArgumentList中調(diào)用xsl參數(shù)XmlDocument XmlDoc=new XmlDocument(); XmlDoc.Load(strFilePath); XslTransform xslt = new XslTransform()
熬了半個(gè)通宵,寫出了自己的Google SiteMap文件,在這里給出詳細(xì)教程,愿對(duì)大家有所幫助。Google SiteMap的作用及協(xié)議格式詳解
Google SiteMap Protocol是Google自己推出的一種站點(diǎn)地圖協(xié)議,此協(xié)議文件基于早期的robots.txt文件協(xié)議,并有所升級(jí)。在Google官方指南中指出加入了Google SiteMap文件的網(wǎng)站將更有利于Google網(wǎng)頁(yè)爬行機(jī)器人的爬行索引,這樣將提高索引網(wǎng)站內(nèi)容的效率和準(zhǔn)確度。文件協(xié)議應(yīng)用了簡(jiǎn)單的XML格式,一共用到6個(gè)標(biāo)簽,其中關(guān)鍵標(biāo)簽包括鏈接地址、更新時(shí)間、更新頻率和索引優(yōu)先權(quán)。
Google SiteMap文件生成后格式如下:
<!--StartFragment-->
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://hl5o.cn</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://hl5o.cn/300687.html</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
XML標(biāo)簽
- changefreq:頁(yè)面內(nèi)容更新頻率。
- lastmod:頁(yè)面最后修改時(shí)間
- loc:頁(yè)面永久鏈接地址
- priority:相對(duì)于其他頁(yè)面的優(yōu)先權(quán)
- url:相對(duì)于前4個(gè)標(biāo)簽的父標(biāo)簽
- urlset:相對(duì)于前5個(gè)標(biāo)簽的父標(biāo)簽
&amp;lt;urlset xmlns=&amp;quot;http://www.google.com/schemas/sitemap/0.84&amp;quot;&amp;gt; 這一行定義了此xml文件的命名空間,相當(dāng)于網(wǎng)頁(yè)文件中的<html>標(biāo)簽一樣的作用。&amp;lt;url&amp;gt; 這是具體某一個(gè)鏈接的定義入口,你所希望展示在SiteMap文件中的每一個(gè)鏈接都要用<url>和</url>包含在里面,這是必須的。- <loc>http://hl5o.cn</loc>
- 用<loc>描述出具體的鏈接地址,這里需要注意的是鏈接地址中的一些特殊字符必須轉(zhuǎn)換為XML(HTML)定義的轉(zhuǎn)義字符,如下表:
字符 轉(zhuǎn)義后的字符 HTML字符 字符編碼 and(和) & & & 單引號(hào) ' ' ' 雙引號(hào) " " " 大于號(hào) > > > 小于號(hào) < < < &amp;lt;lastmod&amp;gt;2005-06-03T04:20:32-08:00&amp;lt;/lastmod&amp;gt; <lastmod>是用來(lái)指定該鏈接的最后更新時(shí)間,這個(gè)很重要。Google的機(jī)器人會(huì)在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行比較,如果時(shí)間一樣就會(huì)跳過(guò)不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時(shí)的內(nèi)容有所改變,應(yīng)該更新該時(shí)間,讓Google下次索引時(shí)會(huì)重新對(duì)該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:- 年:YYYY(2005)
- 年和月:YYYY-MM(2005-06)
- 年月日:YYYY-MM-DD(2005-06-04)
- 年月日小時(shí)分鐘:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37 08:00)
- 年月日小時(shí)分鐘秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30 08:00)
&amp;lt;changefreq&amp;gt;always&amp;lt;/changefreq&amp;gt; 用這個(gè)標(biāo)簽告訴Google此鏈接可能會(huì)出現(xiàn)的更新頻率,比如首頁(yè)肯定就要用always(經(jīng)常),而對(duì)于很久前的鏈接或者不再更新內(nèi)容的鏈接就可以用yearly(每年)。這里可以用來(lái)描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。&amp;lt;priority&amp;gt;1.0&amp;lt;/priority&amp;gt; <priority>是用來(lái)指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0 - 1.0之間- 還有</url>和</urlset>,這兩個(gè)就是來(lái)關(guān)閉xml標(biāo)簽的,這和HTML中的</body>和</html>是一個(gè)道理
- 另外需要注意的是,這個(gè)xml文件必須是utf-8的編碼格式,不管你是手動(dòng)生成還是通過(guò)代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡(jiǎn)單的方法就是用記事本打開(kāi)xml然后另存為時(shí)選擇編碼(或轉(zhuǎn)換器)為UTF-8。
登陸Google提交你的SiteMap文件,讓Google開(kāi)始爬行吧打開(kāi)
https://www.google.com/webmasters/sitemaps/鏈接,如果還沒(méi)有注冊(cè)或者登陸Google,就先用自己的帳號(hào)登陸Google,登陸后轉(zhuǎn)到Y(jié)our Sitemaps狀態(tài)頁(yè)面,可以點(diǎn)擊那個(gè)Add a Sitemap 跳轉(zhuǎn)到提交頁(yè)面進(jìn)行Sitemap文件的提交。建議文件放在你的站點(diǎn)根目錄下。給Google提交你的Sitemap URL后可以看見(jiàn)在列表里已存在,不過(guò)這時(shí)候還沒(méi)有生效,必須過(guò)幾個(gè)小時(shí)后Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態(tài)標(biāo)示解釋看看是什么原因。
分享:解析WEB頁(yè)面工具語(yǔ)言XML(二)定義二、XML的定義 XML是一個(gè)精簡(jiǎn)的SGML,它將SGML的豐富功能與HTML的易用性結(jié)合到Web的應(yīng)用中。XML保留了SGML的可擴(kuò)展功能,這使XML從根本上有別于HTML。XML要比HTML強(qiáng)大得多,它不再是固定的標(biāo)記
- xml創(chuàng)建節(jié)點(diǎn)(根節(jié)點(diǎn)、子節(jié)點(diǎn))
- WML開(kāi)發(fā)教程之 WAP網(wǎng)站服務(wù)器配置方法
- WMLScript的語(yǔ)法基礎(chǔ)
- 收集的WML Script標(biāo)準(zhǔn)函數(shù)庫(kù)
- WML教程之文本框控件Input
- 無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)
- xml文件的結(jié)構(gòu)解讀
- 關(guān)于XSL - XSL教程
- 選擇模式 - XSL教程 - 2
- XPath入門 - XSL教程 - 3
- 匹配模式 - XSL教程 - 4
- 測(cè)試模式 - XSL教程 - 5
- 相關(guān)鏈接:
- 教程說(shuō)明:
Xml教程-Google Sitemap詳細(xì)制作教程
。