serp
指Search Engine Results Page,中文叫做搜索引擎结果页。这里我们以google为例,实现对扫描结果的处理。
提醒:项目用于学习,不可用于商业用途。Google提供了一个免费的API,允许用户免费调佣100次。我们这里完成的爬虫案例如果尝试频繁获取大量数据,将会遇见reCAPTCHA 验证或IP被禁止,但是对于我们预想的目的来说,这个工具已经完全够用了。
我们需要从google搜索结果中提取以下要素:
- 搜索结果链接
- 相关链接
- 描述
- 摘要
- 推荐视频
- 结果页面数量
- ...
Top comments (0)