爬虫工作中遇到这些状态码的含义是什么 - 代理IP

代理IP知识 / 内容详情

爬虫工作中遇到这些状态码的含义是什么

站大爷官方 2020-11-18 16:08:43

在爬虫工作中经常遇到一些问题，我们可以通过返回的状态码找到出问题的原因以及解决方法，我们一起来看看都有哪些状态码，其代表的含义是什么。

爬虫工作中遇到这些状态码的含义是什么

200：请求成功，处理方式：获得响应的内容，进行处理。

201：请求完成，结果是创建了新资源。新创建资源的URI可在响应的实体中得到。处理方式：爬虫中不会遇到。

202：请求被接受，但处理尚未完成。处理方式：阻塞等待。

204：服务器端已经实现了请求，但是没有返回新的信息。如果客户是用户代理，则无须为此更新自身的文档视图。处理方式：丢弃。

300：该状态码不被HTTP/1.0的应用程序直接使用，只是作为3XX类型回应的默认解释。存在多个可用的被请求资源。处理方式：若程序中能够处理，则进行进一步处理，如果程序中不能处理，则丢弃。

301：请求到的资源都会分配一个永久的URL，这样就可以在将来通过该URL来访问此资源。处理方式：重定向到分配的URL。

302：请求到的资源在一个不同的URL处临时保存。处理方式：重定向到临时的URL。

304：请求的资源未更新，处理方式：丢弃。

400：非法请求，处理方式：丢弃。

401：未授权，处理方式：丢弃。

403：禁止，处理方式：丢弃。

404：没有找到，处理方式：丢弃。

500：服务器内部错误，服务器遇到了一个未曾预料的状况，导致了它无法完成对请求的处理。一般来说，这个问题都会在服务器端的源代码出现错误时出现。

501：服务器无法识别，服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法，并且无法支持其对任何资源的请求。

502：错误网关，作为网关或者代理工作的服务器尝试执行请求时，从上游服务器接收到无效的响应。

503：服务出错，由于临时的服务器维护或者过载，服务器当前无法处理请求。这个状况是临时的，并且将在一段时间以后恢复。

以上就是爬虫工作中经常遇到的一些状态码，最为常见的是200和403，200代表请求成功，403一般是触发反爬策略被限制了IP。

免费试用