Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。你可从以下链接下载此架构:
有多种工具可帮助你根据此架构来验证你的 Sitemaps 结构。在下面的每一个位置你都可以找到 XML 相关的工具列表:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
为了根据某个架构验证你的Sitemaps或Sitemaps索引文件,XML 文件需要有附加的标头。如果你使用的是 Sitemaps 生成器,这些标头已经包含其中。如果你使用不同的工具创建 Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps:
<?xml version=’1.0′ encoding=’UTF-8′?>
<urlset xmlns=”http://www.google.com/schemas/sitemap/0.84″
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd”>
<url>
…
</url>
</urlset>
Sitemaps 索引文件:
<?xml version=’1.0′ encoding=’UTF-8′?>
<sitemapindex xmlns=”http://www.google.com/schemas/sitemap/0.84″
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/siteindex.xsd”>
<sitemap>
…
</sitemap>
</sitemapindex>
什么是链接锚文本?举个例子解释说明一下:诸如,有一个网站做了个点石的友情链接,其具体代码表现为 <a href=http://www.moneytreeblog.net>网络赚钱</a> ,其中“网络赚钱”即为该链接的锚文本。
搜索引擎可以根据指向某一个网页链接的锚文本描述来判断该网页的内容属性,如摇钱树博客是一个探讨网络赚钱的个人博客,所以有很多指向摇钱树的链接锚文本描述为“网络赚钱”,这样会让搜索引擎根据属性投票来给摇钱树网络赚钱的自然排名方面有一个考虑,尤其是这样的反向链接的质量和数量上升到一定层次时,这种排名优势也就越明显。很多网站的锚文本的形式诸如以下形式:more、更多、阅读详细信息、点击这里等,这样的做法没办法让搜索引擎对某一个被链接的网页内容属性有一个好的判断,从而影响网页排名。
每个页面的内容都不同,因此我们在进行关键词策略部署的时候,就应该针对某一个目标页面有一个关键词考虑。一般来说一个页面的核心关键词在1-3个范围(范围太大,关键词的权重就有可能被稀释),所以我们一般在其他页面做指向该页面的链接的锚文本描述中就应该布置预先规划的核心关键词,而且锚文本描述的形式应尽量多样化。
图片有一个ALT替换文本属性,在代码中填充某一个图片的ALT替换文本信息,如果这个图片在网页上显示不出来,在该图片的位置会出现替换文本的信息。
图片的ALT替换文本信息属性原本是考虑到残障人士(如盲人)的访问体验而准备的,他们在浏览网页的时候很难获取图片中的文字信息,只能通过ALT替换文本的描述来了解图片影像内容。
搜索引擎会把ALT部分的内容纳入整个页面的文本分析,所以建议在填写图片ALT部分的内容时要灵活地在描述中布置合适的关键词。
网站发布以后往往很多人都忘了写一个Robots文件,其实这个文件是非常有用的。我们知道搜索引擎的网络蜘蛛会沿着你的网站结构一直抓取下去,但是,我们有时候并不希望有些东西被搜索引擎抓取,这就涉及到如何保护网站的个人隐私问题,这时,Robots文件就派上用场了。
Robots的具体网页源码表现形式为:<meta name=”robots” content=” “>。Robots的content部分文字可以填写的内容为:all、none、index、noindex、follow和nofollow。对于Robots的content部分填充内容有如下说明解释:
- 设定为all:文件将被检索,且页面上的链接可以被查询;
- 设定为none:文件将不被检索,且页面上的链接不可以被查询;
- 设定为index:文件将被检索;
- 设定为follow:页面上的链接可以被查询;
- 设定为noindex:文件将不被检索,但页面上的链接可以被查询;
- 设定为nofollow:文件将不被检索,页面上的链接可以被查询。
一般来说,大部分网站并没有太多的内容禁止搜索引擎机器人索引,Robots的通用写法都是:<meta name=”robots” content=” all”>。如果想对Robots做一些个性化的设置,可以参照上面的相关说明来完善Robots的content部分内容。
我们一直都在强调在别人的博客上多留言的好处,但是这样的鼓励也造就了许多人肉垃圾评论。就以笔者的摇钱树博客为例,虽然装了WordPress的反垃圾评论插件,可是仍然挡不住那些毫无意义,令人讨厌的人肉垃圾评论。因此,我想在这里和大家探讨一下如何在别人的博客上留言。
1.在留言之前最好先把别人的文章看一篇。
这是对别人劳动成果的一个起码尊重,如果你连这点都做不到,那最好不要发表你的高见。
2.不要用粗体或斜体来凸显你的留言。
是的,博客留言可以为你带来流量,你可以让你的留言尽量风趣幽默些,但是请不要特意的将你的留言设为粗体或斜体来引人注意,这样只会让人反感。
3.关于签名。
经常看到有人在别人的博客上留言后还不忘带上一个链向自己网站的个人签名,拜托,博客不是论坛。其实一般的博客都会容许用户留言中带有一个链接,但是,你完全不用那么做,因为博客留言本身就提供了可带链接的签名。
4.不要再留言中带两个或两个以上的链接。
首先你在留言中带上这么多链接就给一种垃圾评论的嫌疑,除非博主觉得很有必要,否则他会毫不留情的把你的留言归为垃圾评论。
5.关于一字留言。
经常看到有些人留言的时候惜字如金,如“好”,“顶”等这些一字评论随处可见。如果你是博主,那你会怎样看待这样毫无意义的评论?结果不用我说,肯定不会通过博主的审核。
昝辉zac在其个人博客上发了一篇名为《我的理想网站》的帖子,为大家描绘出来一个理想的网站应该具有的元素。基本上写到我们每个站长的心坎上去了:
首先,网站应该是关于一个热门行业,没有赌博,色情,旅游,律师服务这么热门,但要仅次于这些行业。
这个行业应该是已经存在几百上千年,还将继续存在几百年上千年,与互联网,IT没什么关系的。
这个行业话题我懂一些,并且感兴趣。或者大家都懂,不用学的。
最好在哪儿捡到一个注册了十年,却准备出让的又不贵的域名。
网站内容是中文的,好方便我没事时看网站内容。英语毕竟不是母语,比较费神。
但Adsense点击单价和英文网站一样高。也许目标用户是住在欧美的华人?
网站带有web2.0性质,用户贡献内容。出于某种原因,用户们无怨无悔的积极写文章,发心得,贴帖子,写评论。
同时,Spammer找不到这个网站,不来发垃圾信息,省得我还得自己去或组织人去删垃圾。
网站程序已经有现成的开源软件,功能强大,升级简单,模板容易改。
网络营销方面,以SEO为主就能达到目标,不需要Email营销,博客营销,事件营销等。甭管它们多有效,可是很累呀!
网站上不卖自己的东西,只靠广告。不过Adsense点击单价即使不上升,也要保持不变。别像目前的网站这样,几年来只降不涨。
这个行业还有众多信誉好,产品好,价格合理的电子商务网站,能用他们的网站联盟再赚点钱。
网站能不断吸引新用户,而不是稳定在固定用户群上。同一批用户时间长了,谁也不点击广告了。
网站的创意本身能申请专利,不许别人抄袭。说起来恐怖,连SEO这个单词,在美国都有人在申请专利中,而且也已经偷偷进行到公告阶段。
我每天做什么呢?就上网站看自己喜欢的内容,每个小时查一下Adsense帐号。
当然,这只是一个站长的美好愿望罢了。天下没有免费的午餐,作为一个Blogger,尤其是想利用博客赚钱的Blogger,尤其是如此。好不容易开了博,自己辛辛苦苦写文章,找链接,可是每天来的IP还是寥寥无几,个人博客不可能像普通网站那样一天几百篇的更新,也不可能用钱来扎出流量。博客的流量只能用心培养起来,让每一个看过你博客的人都记住你的博客,成为你的常客,这样越集越多,最后就成就了一个成功的博客。至于如何才能留住用户,这就要看你的本事了。如果你不能做到这一点,那我建议你好好看看《博客真的适合你吗?》这篇文章,或许博客真的不适合你。
说实话,没有人喜欢将自己的网站搬来搬去,可是有时候由于种种原因又不得不做出搬家的无赖选择。下面这篇文章来自谷歌网站管理员博客,看看,从搜索引擎的角度出发,网站搬家应该注意的几个问题,究竟怎样做才能不影响网站在谷歌搜索结果中的表现。
您希望这种迁移对于用户来说是毫无察觉地发生的,同时希望谷歌知道新页面应该与原网站页面得到相同的质量认可。当您迁移网站时,那些讨厌的404错误提示(无法找到文件) 不仅会伤害用户体验,还会给您的网站在谷歌搜索结果中的表现带来负面影响。
本文将介绍如何稳妥地将您的网站搬到一个新域名(例如从www.example.com变为www.example.org)。这与将网站搬到一个新的IP地址是不同的,如果想了解这方面的内容请阅读此文。
网站迁移的主要步骤如下:
首先通过移动一个目录或子域名的内容来测试整个网站的迁移过程。然后使用301重定向功能将原有网站网页重定向到您的新网站上。通过此方法可告知谷歌和其它搜索引擎:您的网站已经永久性地迁移了。
上述操作完成后,查看一下您新网站里的网页能否出现在谷歌的搜索结果里。如果您对这次小范围的迁移感到满意,就可以迁移整个网站了。请不要将旧网站中所有网页的流量都重定向到您的新主页上,这种一刀切式的重定向虽然会避免404错误,但它并不能为用户提供良好的体验。尽管页对页的重定向(旧网站中每一网页都重新定向到新网站的相应网页上)会带来更大的工作量,但这也会给您的用户带来更连贯和明晰的体验。如果在新旧网站中不是一对一的页面匹配,那么一定要努力确保旧网站中每一个网页至少要重定向到具有类似内容的新网页上。
如果网站因为要重新命名或重新设计而需变更域名,您可以分两个阶段进行:第一阶段,移动您的网站;第二阶段,开始重新设计。这样做,不仅可以掌控用户在每一阶段中感受到的变化幅度,而且可以使整个过程变得更顺利。把变化控制在最低限度可以使您更容易发现和解决各种意外情况。
检查您网站网页的内、外部链接。理想的情况是您应该联络每个链接到您网站上的其他网站的管理员,让他们把链接指向您新域名的相应网页。如果这难以实现,您要确保原网站中所有含有其他网站链接指向的网页都被重定向到您的新网站上。您也应该检查并更新所有旧网站里的内部链接,使它们指向新域名。当您的网站内容已经在新服务器上准备就绪后,您可以使用一个诸如Xenu的链接检查工具来确认在您的新站点上没有遗留的故障链接。这一点特别重要,如果您的原始内容包含绝对链接(如www.example.com/cooking/recipes/chocolatecake.html )而不是相对链接(如 …/recipes/chocolatecake.html)的话。
为防止混淆和混乱,您最好继续持有对原网站域名的控制权限至少180天。将您的新网站添加到网站管理员工具帐户中,并验证您对该网站的所有权。创建并提交一个Sitemap以显示出新网站的所有URL,这样谷歌就会知道您新网站里的内容现在已经可用,可以对其进行抓取了。
最后,确保您的新、旧网站都在网站管理员工具中得到验证,并定期检查抓取错误,确保来自旧网站的301重定向工作正常,同时新网站上也不会显示我们不想看到的404错误提示。我们承认,迁移从来就不是一件容易的事 —— 但是,这些步骤能帮助您确保原有网站的良好声誉在迁移的过程中不受损失。
昨天loveblogearn兄在网站上留言说偶博客的PR值升了,赶快查了一下,嘿嘿,还真的是变成4了。现在网络上有一种说法,卖链接会被Google惩罚。前几天还跟redleaffly兄讨论这事,他说他的几个站都是因为卖链接,结果PR被Google降为0,不过从摇钱树博客来看,似乎卖链接并不会被Google惩罚,还有一个原因,也许是偶运气好,Google网开一面哦,呵呵。
今天收到一封来自Google AdSense的信,大致意思是说自 3 月 12 日至 27 日,在我的帐户中未显示带有 Google 工具栏的 Firefox 推介的收入。他们的工程师现已解决了该问题;但是,无法追溯并显示这些收入。但是,他们会根据我以前的带有 Google 工具栏的 Firefox 推介转换来估计每天的收入,并对损失的转换进行补偿。
看了这封信,笔者很有感触,Google AdSense 对用户认真负责的态度确实值得尊敬。再看看我们国内的一些广告联盟,不是严重扣量就是无端删号,一个比一个黑。网络广告市场这块蛋糕有太多的人想来分食,这些人龙蛇混杂,你很难一下子分辨出哪些是龙那些是蛇。一个新开的广告联盟,可能刚开始的时候服务态度贼好,也不扣量,付款也及时,可是越到后来其本性就慢慢显露出来了。笔者见过太多像这样的联盟,也见过太多受害的站长。
发了点感慨,呵呵。最后祝天下所有的站长们一路走好!
搜索引擎是通过分析网页源代码来分析页面文本信息的逻辑性,所以在编写网页代码的时候一定要尽可能使用合适的标签来体现文本表达的层次感,也即是让搜索引擎“看懂”哪些文本信息要重于其他部分。
标题标签
在Html代码中,标题的标签一共6个,它们的具体代码表现形式分别是:“<h1>标题1</h1>”、“<h2>标题2</h2>”、“<h3>标题3</h3>”、“<h4>标题4</h4>”、“<h5>标题5</h5>”和“<h6>标题6</h6>”,其中标题1的逻辑权重最大,其他的标题重要性随着h后的数字增大而减小。在搜索引擎的文本分析中,标题的信息权重要比文章正文的大,所以我们尤其要注意内容标题的规划和书写。
一篇文章中可能会出现很多标题,诸如正文大标题、副标题、段落标题等。我们应该根据标题的逻辑重要性分配合适的标题标签,正文大标题应该是<h1>,副标题可是是<h2>,而段落标题则可分配<h3>,其他的就可以以此类推了。我们不建议所有的标题都采用<h1>标签,这样不能向搜索引擎阐述哪些标题应该比其他的标题更加重要,因而显得标题没有层次逻辑性。
强调标签
为了说明文章正文部分的某些字词或者句子的重要性,我们应该要通过html强调代码来标识它们,从而使其与其他部分的字词或者句子区分开来。
一般强调标签:<em>,Html代码表现形式:“<em>强调的字词或句子</em>”,被<em>标签包括了的字词或句子在网页中表现为斜体。重点强调标签:<b>和<strong>,具体Html代码表现形式:“<b>强调的字词或句子</b>”和“<strong>强调的字词或句子</strong>”,被重点强调标签包括了字词或句子在网页中表现为粗体。<b>主要侧重于表现视觉上的强调,而<strong>则是指语意上的强调。
以上所谈的两类标签表达的文本逻辑性权重很大,所以其配合表现的字词句段在搜索引擎的文本分析中占有极大的评估优势,这也就不难理解为什么很多的SEO对它们十分重视了。网页设计师在编写代码的时候应当尽量使用丰富多样的标签,让网页的文本信息具有逻辑性,从而让搜索引擎能更好的读“懂”网页中的信息。对于搜索引擎优化人员来说,在这些标签中部署关键词是一个不错的选择。