在经历过一系列的预处理后所留下的独特的文章就是可以反映主题的内容,搜索引擎会把这些记录下来做成一个集合,记录在页面上出现关键词的频率,出现了多少次,出现的格式比如是黑体还是标题标签或者是锚文本等信息,然后是位置比如是开头段还是中间段落,或者是尾端,词频格式权重的等信息全部记录再按西鞥成一个对应的文件ID。做完了这些还不可以直接拿来用作排名资料,比如说有个用户搜索SEO,那么程序就需要找出所有ID,然后挨个扫描。找出相关比例和权重最大的那个网站,无疑这样的做的负担两是沉重的。所以为了减轻工作量搜索引擎会倒索引,也就是找出所有包含这个关键词的文章,然后再在按照之前的预处理做出一反应后在根据网站现在的权重做出排名。