当前位置:秒懂库 > IT科技 > python网络爬虫是什么
手机版

python网络爬虫是什么

来源:秒懂库 阅读:3.08W 次

Python网络爬虫就是使用 Python 程序开发的网络爬虫(网页蜘蛛,网络机器人),是一种按照一定的规则自动地抓取万维网信息的程序或者脚本。主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站。

python网络爬虫是什么

拓展:爬虫分类

从爬取对象来看,爬虫可以分为通用爬虫和聚焦爬虫两类。

通用网络爬虫又称全网爬虫,爬行对象从一些种子 URL 扩充到整个 Web,主要为搜索引擎和大型 Web 服务提供商采集数据。

聚焦网络爬虫(Focused Crawler),是指选择性地爬取那些与预先定义好的主题相关页面的网络爬虫。

今天的分享就是这些,希望大家喜欢。

本文链接:https://www.miaodongku.com/itkj/vrdwz4.html

Copyright © 2024. 秒懂库 All right reserved. 黑ICP备20202358号-2

文字美图素材,版权属于原作者。部分文章内容由网友提供推送时因种种原因未能与原作者联系上,若涉及版权问题,敬请原作者联系我们,立即处理。