百度外链工具发布已经有一段时间了,很多站长们也都在使用,毕竟对自己的站和其他网站可以进行一些分析。在百度外链工具中有一项数据是链接名称,很多人都会把它绑架为锚文本,这个正确不正确呢?正确,但是不完全正确。为什么这样说呢,从百度所的数据和真实网页信息比照来看,并不完全一样。不管是用户推荐的还是自己发的外链,这些数据都不够精准。以我手上一个网站为例,我们可以看一下百度是怎么提取数据的,先看一下连接名称中的内容。
当看到SEO网站优化这个词时就有点郁闷了,因为这个站是个加盟网站,为什么会出现这种情况呢?通过搜索链接名称框搜索SEO网站优化这个词发现有两个页面,打开之后就会发现下面的情景。
图片上显示在这个网站的文本链接前刚好出现了上面的词语,这就说明百度是会把前面最近的词当成该文本链接的内容解释,认为它和链接是最匹配的关系。这一点确实有点牵强附会了。那是不是在提醒我们以后如果要出现文本链接一定要在前面出现最相关的词语呢?只有这样,才会避免上面所发生的情况,避免使得一个毫不相关的词语竟然成了文本链接的链接名称。
这一点还不足以说明情况,我们通过外部链接页面的链接名称再来观察。打开一个链接可以看到,链接地址后面有对应链接名称,如图。
打开页面之后,我们发现该链接名称确实为锚文本链接,但是问题是在其右侧同样出现了文本链接,那到底百度是怎么确认的?是确认锚文本链接的文字名称还是职匹配文本链接左边的文字忽略锚文本呢?我们再找一下其它的链接名称进行确认一下即可知道。通过查一些另外的外链,可以发现锚文本链接百度是可以识别的。由此基本可以断定,如果是单独的锚文本链接,会直接抓取其文本名称作为链接名称;如果是文本链接的话,则会对其左边最近的文字进行匹配成为链接名称。
为了能证实以上观点的正确,笔者又对其它一些站点进行了观测,而且又找了一些英文链接名称,看看又会出现什么情况。文本链接的情况一样,依然是会自动匹配其左侧的字符。锚文本链接虽然依然会识别链接名称,但是链接的网址却不是我们查询的域名,而是域名的一级目录。这个问题暂且不考虑,又有新的问题出现了,如果链接名称不是一个单词,而是一个英文词组,百度会只抓取第一个英文词,这一点在其它网站上也得到了证实。由于百度是基于中文的搜索引擎,对于英文词语的理解肯定不是很好,出现这种情况在所难免。但是如果是SEO技术或者SEO案例这样的词如何抓取呢?笔者又进行了查看,发现可以完整抓取。为什么英文和中文组合就可以完整抓取呢?笔者仔细看了一下,我们通常在书写中文时,完整的词组中间是没有分隔符的,而英文的写法是每个单词之间有分隔符的,也就是空格,也许是这个原因造成百度抓取上的不同。假如英文单词之间没有空格或者中英文结合中间加上空格,可能就会出现另一种情况了,虽然英文锚文本被提取了,但是不知道意思了;本来完整的中英文组合被拆分抓取造成意义大相径庭。由于笔者没有亲自测试中英文分开的情况(有时不小心分开写了),有兴趣的朋友也可以测试看看结果。
以上通过实例解读了百度外链工具中链接名称的具体情况,可以说有值得借鉴的地方,也有有待完善的地方。如果百度的算法还没有升级的那么快,我想现在做外链的童鞋们可以利用这一小小的技术误差把关键词和文本链接合理匹配,这一定对于中文站关键词排名是有帮助的。虽然百度的英文理解力不好,如果做国外用户的英文关键词也不会选百度。如果是基于国内用户做英文词搜索,尽量保证词语的唯一性,成为品牌词,即使百度现在不能完全抓取链接名称,用户通过品牌名称也能快速找到网站的。我们不可能更改英文单词的书写习惯,只能等待百度更大的进步了。
当看到SEO网站优化这个词时就有点郁闷了,因为这个站是个加盟网站,为什么会出现这种情况呢?通过搜索链接名称框搜索SEO网站优化这个词发现有两个页面,打开之后就会发现下面的情景。
图片上显示在这个网站的文本链接前刚好出现了上面的词语,这就说明百度是会把前面最近的词当成该文本链接的内容解释,认为它和链接是最匹配的关系。这一点确实有点牵强附会了。那是不是在提醒我们以后如果要出现文本链接一定要在前面出现最相关的词语呢?只有这样,才会避免上面所发生的情况,避免使得一个毫不相关的词语竟然成了文本链接的链接名称。
这一点还不足以说明情况,我们通过外部链接页面的链接名称再来观察。打开一个链接可以看到,链接地址后面有对应链接名称,如图。
打开页面之后,我们发现该链接名称确实为锚文本链接,但是问题是在其右侧同样出现了文本链接,那到底百度是怎么确认的?是确认锚文本链接的文字名称还是职匹配文本链接左边的文字忽略锚文本呢?我们再找一下其它的链接名称进行确认一下即可知道。通过查一些另外的外链,可以发现锚文本链接百度是可以识别的。由此基本可以断定,如果是单独的锚文本链接,会直接抓取其文本名称作为链接名称;如果是文本链接的话,则会对其左边最近的文字进行匹配成为链接名称。
为了能证实以上观点的正确,笔者又对其它一些站点进行了观测,而且又找了一些英文链接名称,看看又会出现什么情况。文本链接的情况一样,依然是会自动匹配其左侧的字符。锚文本链接虽然依然会识别链接名称,但是链接的网址却不是我们查询的域名,而是域名的一级目录。这个问题暂且不考虑,又有新的问题出现了,如果链接名称不是一个单词,而是一个英文词组,百度会只抓取第一个英文词,这一点在其它网站上也得到了证实。由于百度是基于中文的搜索引擎,对于英文词语的理解肯定不是很好,出现这种情况在所难免。但是如果是SEO技术或者SEO案例这样的词如何抓取呢?笔者又进行了查看,发现可以完整抓取。为什么英文和中文组合就可以完整抓取呢?笔者仔细看了一下,我们通常在书写中文时,完整的词组中间是没有分隔符的,而英文的写法是每个单词之间有分隔符的,也就是空格,也许是这个原因造成百度抓取上的不同。假如英文单词之间没有空格或者中英文结合中间加上空格,可能就会出现另一种情况了,虽然英文锚文本被提取了,但是不知道意思了;本来完整的中英文组合被拆分抓取造成意义大相径庭。由于笔者没有亲自测试中英文分开的情况(有时不小心分开写了),有兴趣的朋友也可以测试看看结果。
以上通过实例解读了百度外链工具中链接名称的具体情况,可以说有值得借鉴的地方,也有有待完善的地方。如果百度的算法还没有升级的那么快,我想现在做外链的童鞋们可以利用这一小小的技术误差把关键词和文本链接合理匹配,这一定对于中文站关键词排名是有帮助的。虽然百度的英文理解力不好,如果做国外用户的英文关键词也不会选百度。如果是基于国内用户做英文词搜索,尽量保证词语的唯一性,成为品牌词,即使百度现在不能完全抓取链接名称,用户通过品牌名称也能快速找到网站的。我们不可能更改英文单词的书写习惯,只能等待百度更大的进步了。