Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。你可从以下链接下载此架构:
有多种工具可帮助你根据此架构来验证你的 Sitemaps 结构。在下面的每一个位置你都可以找到 XML 相关的工具列表:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
为了根据某个架构验证你的Sitemaps或Sitemaps索引文件,XML 文件需要有附加的标头。如果你使用的是 Sitemaps 生成器,这些标头已经包含其中。如果你使用不同的工具创建 Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps:
<?xml version=’1.0′ encoding=’UTF-8′?>
<urlset xmlns=”http://www.google.com/schemas/sitemap/0.84″
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd”>
<url>
…
</url>
</urlset>
Sitemaps 索引文件:
<?xml version=’1.0′ encoding=’UTF-8′?>
<sitemapindex xmlns=”http://www.google.com/schemas/sitemap/0.84″
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/siteindex.xsd”>
<sitemap>
…
</sitemap>
</sitemapindex>
什么是链接锚文本?举个例子解释说明一下:诸如,有一个网站做了个点石的友情链接,其具体代码表现为 <a href=http://www.moneytreeblog.net>网络赚钱</a> ,其中“网络赚钱”即为该链接的锚文本。
搜索引擎可以根据指向某一个网页链接的锚文本描述来判断该网页的内容属性,如摇钱树博客是一个探讨网络赚钱的个人博客,所以有很多指向摇钱树的链接锚文本描述为“网络赚钱”,这样会让搜索引擎根据属性投票来给摇钱树网络赚钱的自然排名方面有一个考虑,尤其是这样的反向链接的质量和数量上升到一定层次时,这种排名优势也就越明显。很多网站的锚文本的形式诸如以下形式:more、更多、阅读详细信息、点击这里等,这样的做法没办法让搜索引擎对某一个被链接的网页内容属性有一个好的判断,从而影响网页排名。
每个页面的内容都不同,因此我们在进行关键词策略部署的时候,就应该针对某一个目标页面有一个关键词考虑。一般来说一个页面的核心关键词在1-3个范围(范围太大,关键词的权重就有可能被稀释),所以我们一般在其他页面做指向该页面的链接的锚文本描述中就应该布置预先规划的核心关键词,而且锚文本描述的形式应尽量多样化。
图片有一个ALT替换文本属性,在代码中填充某一个图片的ALT替换文本信息,如果这个图片在网页上显示不出来,在该图片的位置会出现替换文本的信息。
图片的ALT替换文本信息属性原本是考虑到残障人士(如盲人)的访问体验而准备的,他们在浏览网页的时候很难获取图片中的文字信息,只能通过ALT替换文本的描述来了解图片影像内容。
搜索引擎会把ALT部分的内容纳入整个页面的文本分析,所以建议在填写图片ALT部分的内容时要灵活地在描述中布置合适的关键词。
网站发布以后往往很多人都忘了写一个Robots文件,其实这个文件是非常有用的。我们知道搜索引擎的网络蜘蛛会沿着你的网站结构一直抓取下去,但是,我们有时候并不希望有些东西被搜索引擎抓取,这就涉及到如何保护网站的个人隐私问题,这时,Robots文件就派上用场了。
Robots的具体网页源码表现形式为:<meta name=”robots” content=” “>。Robots的content部分文字可以填写的内容为:all、none、index、noindex、follow和nofollow。对于Robots的content部分填充内容有如下说明解释:
- 设定为all:文件将被检索,且页面上的链接可以被查询;
- 设定为none:文件将不被检索,且页面上的链接不可以被查询;
- 设定为index:文件将被检索;
- 设定为follow:页面上的链接可以被查询;
- 设定为noindex:文件将不被检索,但页面上的链接可以被查询;
- 设定为nofollow:文件将不被检索,页面上的链接可以被查询。
一般来说,大部分网站并没有太多的内容禁止搜索引擎机器人索引,Robots的通用写法都是:<meta name=”robots” content=” all”>。如果想对Robots做一些个性化的设置,可以参照上面的相关说明来完善Robots的content部分内容。
说实话,没有人喜欢将自己的网站搬来搬去,可是有时候由于种种原因又不得不做出搬家的无赖选择。下面这篇文章来自谷歌网站管理员博客,看看,从搜索引擎的角度出发,网站搬家应该注意的几个问题,究竟怎样做才能不影响网站在谷歌搜索结果中的表现。
您希望这种迁移对于用户来说是毫无察觉地发生的,同时希望谷歌知道新页面应该与原网站页面得到相同的质量认可。当您迁移网站时,那些讨厌的404错误提示(无法找到文件) 不仅会伤害用户体验,还会给您的网站在谷歌搜索结果中的表现带来负面影响。
本文将介绍如何稳妥地将您的网站搬到一个新域名(例如从www.example.com变为www.example.org)。这与将网站搬到一个新的IP地址是不同的,如果想了解这方面的内容请阅读此文。
网站迁移的主要步骤如下:
首先通过移动一个目录或子域名的内容来测试整个网站的迁移过程。然后使用301重定向功能将原有网站网页重定向到您的新网站上。通过此方法可告知谷歌和其它搜索引擎:您的网站已经永久性地迁移了。
上述操作完成后,查看一下您新网站里的网页能否出现在谷歌的搜索结果里。如果您对这次小范围的迁移感到满意,就可以迁移整个网站了。请不要将旧网站中所有网页的流量都重定向到您的新主页上,这种一刀切式的重定向虽然会避免404错误,但它并不能为用户提供良好的体验。尽管页对页的重定向(旧网站中每一网页都重新定向到新网站的相应网页上)会带来更大的工作量,但这也会给您的用户带来更连贯和明晰的体验。如果在新旧网站中不是一对一的页面匹配,那么一定要努力确保旧网站中每一个网页至少要重定向到具有类似内容的新网页上。
如果网站因为要重新命名或重新设计而需变更域名,您可以分两个阶段进行:第一阶段,移动您的网站;第二阶段,开始重新设计。这样做,不仅可以掌控用户在每一阶段中感受到的变化幅度,而且可以使整个过程变得更顺利。把变化控制在最低限度可以使您更容易发现和解决各种意外情况。
检查您网站网页的内、外部链接。理想的情况是您应该联络每个链接到您网站上的其他网站的管理员,让他们把链接指向您新域名的相应网页。如果这难以实现,您要确保原网站中所有含有其他网站链接指向的网页都被重定向到您的新网站上。您也应该检查并更新所有旧网站里的内部链接,使它们指向新域名。当您的网站内容已经在新服务器上准备就绪后,您可以使用一个诸如Xenu的链接检查工具来确认在您的新站点上没有遗留的故障链接。这一点特别重要,如果您的原始内容包含绝对链接(如www.example.com/cooking/recipes/chocolatecake.html )而不是相对链接(如 …/recipes/chocolatecake.html)的话。
为防止混淆和混乱,您最好继续持有对原网站域名的控制权限至少180天。将您的新网站添加到网站管理员工具帐户中,并验证您对该网站的所有权。创建并提交一个Sitemap以显示出新网站的所有URL,这样谷歌就会知道您新网站里的内容现在已经可用,可以对其进行抓取了。
最后,确保您的新、旧网站都在网站管理员工具中得到验证,并定期检查抓取错误,确保来自旧网站的301重定向工作正常,同时新网站上也不会显示我们不想看到的404错误提示。我们承认,迁移从来就不是一件容易的事 —— 但是,这些步骤能帮助您确保原有网站的良好声誉在迁移的过程中不受损失。
昨天loveblogearn兄在网站上留言说偶博客的PR值升了,赶快查了一下,嘿嘿,还真的是变成4了。现在网络上有一种说法,卖链接会被Google惩罚。前几天还跟redleaffly兄讨论这事,他说他的几个站都是因为卖链接,结果PR被Google降为0,不过从摇钱树博客来看,似乎卖链接并不会被Google惩罚,还有一个原因,也许是偶运气好,Google网开一面哦,呵呵。
搜索引擎是通过分析网页源代码来分析页面文本信息的逻辑性,所以在编写网页代码的时候一定要尽可能使用合适的标签来体现文本表达的层次感,也即是让搜索引擎“看懂”哪些文本信息要重于其他部分。
标题标签
在Html代码中,标题的标签一共6个,它们的具体代码表现形式分别是:“<h1>标题1</h1>”、“<h2>标题2</h2>”、“<h3>标题3</h3>”、“<h4>标题4</h4>”、“<h5>标题5</h5>”和“<h6>标题6</h6>”,其中标题1的逻辑权重最大,其他的标题重要性随着h后的数字增大而减小。在搜索引擎的文本分析中,标题的信息权重要比文章正文的大,所以我们尤其要注意内容标题的规划和书写。
一篇文章中可能会出现很多标题,诸如正文大标题、副标题、段落标题等。我们应该根据标题的逻辑重要性分配合适的标题标签,正文大标题应该是<h1>,副标题可是是<h2>,而段落标题则可分配<h3>,其他的就可以以此类推了。我们不建议所有的标题都采用<h1>标签,这样不能向搜索引擎阐述哪些标题应该比其他的标题更加重要,因而显得标题没有层次逻辑性。
强调标签
为了说明文章正文部分的某些字词或者句子的重要性,我们应该要通过html强调代码来标识它们,从而使其与其他部分的字词或者句子区分开来。
一般强调标签:<em>,Html代码表现形式:“<em>强调的字词或句子</em>”,被<em>标签包括了的字词或句子在网页中表现为斜体。重点强调标签:<b>和<strong>,具体Html代码表现形式:“<b>强调的字词或句子</b>”和“<strong>强调的字词或句子</strong>”,被重点强调标签包括了字词或句子在网页中表现为粗体。<b>主要侧重于表现视觉上的强调,而<strong>则是指语意上的强调。
以上所谈的两类标签表达的文本逻辑性权重很大,所以其配合表现的字词句段在搜索引擎的文本分析中占有极大的评估优势,这也就不难理解为什么很多的SEO对它们十分重视了。网页设计师在编写代码的时候应当尽量使用丰富多样的标签,让网页的文本信息具有逻辑性,从而让搜索引擎能更好的读“懂”网页中的信息。对于搜索引擎优化人员来说,在这些标签中部署关键词是一个不错的选择。
最近很多网站的Alexa排名都有不同程度的提升,这是因为Alexa刚刚对其网站的排名算法进行了改进。这种改进主要体现在除Alexa在工具条之外,又增加了其它的数据源,虽然Alexa并没有说明这些其它的数据源是哪些。
这个改进对于很多中国站长来说无疑是个好消息,至少Alexa开始认识到并不是所有的上网者都乐意装上一个Alexa工具条来供其进行网站的排名统计,特别是在非英语的国家,安装Alexa工具条的人更是少之又少,这也是很多国内的网站流量大,而Alexa排名却很低的原因。改进后的Alexa排名可以更好的反映互联网用户对于网站的兴趣和习惯。
今天在用百度的时候突然发现其更多相关搜索页面不见了。这对用户来说并不是件好事,毕竟根据百度提供的更多相关搜索页面可以帮助我们更好的找到想搜索的东西。还有,我知道很多站长都喜欢用百度的更多相关搜索来选择比较冷门的关键词,现在百度取消了这项服务,估计受影响的站长不在少数。
但是,任何事物都是有其两面性的,从某一方面来说,百度此举也可以净化网络环境,毕竟有一小部分站长长期利用百度的更多相关搜索来做SEO,在网页中大量堆积一些所谓的热门关键词,更有胜者,一些软件开发商还利用百度的这个功能开发出SEO作弊软件,严重影响了互联网搜索用户的利益。
网络上一直都有关于百度的黑色星期四的传闻:百度是在星期四凌晨开始更新数据库的。那么星期三也就是百度蜘蛛抓取你网站最频繁的时候之一了。如果在这个时候,你的网站不能访问或出现任何类似于蜘蛛不能抓取的问题,那么恭喜你,很快你的网站收录数量将减少很多。
这种传言也绝对不是空穴来风,根据笔者的经验,除非在百度中权值非常高的网站,一般的网站都是即使你的网站天天更新,百度的搜录页面也不会跟着提升,而是要等到某一天,突然给你来个大惊喜,收录页面大涨。
笔者的一个网站,以前天天更新,百度天天收录,可是最近由于本人的懒惰,一连好几天都没有去碰它,结果导致该网站在百度中的权值降低,现在我又开始了天天更新的勤奋起来,可是百度却不像以前那样天天收录了。就在我一筹莫展的时候,一个阳光明媚的星期四的早晨,百度一下子收录了我一百多个页面。这个时候就是网站的关键时刻,却不能看百度又重新开始收录了就得意忘形不去更新网站,这个时候更要加快更新的频率,把百度蜘蛛吸引过来。如果不出意外的话,过不了几天,百度就会天天收录你的站了。
最后提醒大家:任何情况下,不能在星期三-星期四之间变迁服务器、域名解析等改变原有蜘蛛访问路线的操作。要进行以上操作,需要在数据全部转移后,在非以上时间段操作。