1.爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面Html代码存入数据库。
2.预处理:索引程序对抓取来的页面数据进行文字提取。中文分词。索引等处理以备排名程序调用。
3.排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按照一定格式生产搜索结果页面。
1.爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面Html代码存入数据库。
2.预处理:索引程序对抓取来的页面数据进行文字提取。中文分词。索引等处理以备排名程序调用。
3.排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按照一定格式生产搜索结果页面。