Luminati 路觅:代理错误代码简介

很多客户翻开lpm一片红的时候就很慌张,对使用代理时收到的代理错误代码感到沮丧,尤其是联系不到客服的时候,六神无主。其实代理错误代码类似于 HTTP 状态代码,今天简单介绍一下,通过了解这些错误的含义,您可以顺利执行抓取活动并自动执行 IP 设置,能够顺利处理错误,尽可能减少你的损失。

什么是代理错误?

代理错误是一种 HTTP 错误状态,当通过代理发送到 Web 服务器的请求失败时,您将收到该状态作为响应。要继续使用代理,无论情况如何,您都必须找到解决方案。请求失败期间返回的响应可能看起来有点混乱。如果您熟悉 HTTP 状态代码,那么理解代理错误不是问题。

状态代码类

HTTP 状态代码以三位数显示。它们分为五个类别,每个错误代码的第一个数字描述了类别。

1. 1xx –信息

2. 2xx –成功

3. 3xx –重定向

4. 4xx –客户端错误

5. 5xx –服务器错误
 
例如luminati正常成功状态是200,上图错误给出的是502等

这里主要解释3XX,4XX,5XX三种错误类型及其应对方式。

一些最常见的 3xx 错误代码如下:

301 - 资源永久移动

当永久重定向设置为原始 URL 以将用户代理转发到不同的 URL 时,会收到此错误。

当 Web 服务器发送“301 – 永久移动”状态代码时,因为用户看不到原始 URL,搜索引擎只会将重定向的 URL 编入索引。大多数搜索引擎爬虫和用户代理最多可以跟踪单个 URL 的 5 个重定向。超过五个重定向可能会导致无限循环,Chrome 等浏览器会显示“重定向过多”之类的消息。

301 代码是所有 3xx 服务器响应代码中最受欢迎的。
 

302 - 资源临时移动

当临时重定向设置为原始 URL 时,会收到代码“302 – 临时移动”。这意味着一旦发出请求,用户代理就会被重定向到另一个 URL。

303 - 查看另一个资源

当请求的资源位于另一个 URL 地址时会收到“303 – See Another Resource”,并且应该使用“GET”方法而不是代码来请求它。请注意,只有在收到“200 – 成功”代码时,搜索引擎才会索引最初请求的页面。

304 - 资源未修改

如果请求的资源自上次请求后没有被修改,服务器将使用“304 – Resource Not Modified”代码响应。 

在这种情况下,服务器会假设不需要再次发送数据,因为客户端已经拥有一份未修改的请求资源副本。

请注意,请求标题行“If-Modified-Since”或“If-Match”中提到了“最后一次修改时间”。

另外,如果您的网页自上次搜索引擎爬虫访问您的网站以来没有更改,则建议返回 304 代码以加快索引编制并减少爬虫负载。

305 - 使用代理

如果请求的资源只能通过代理服务器访问,则会出现代码“305 – 使用代理”。代理服务器的地址也在响应中接收并显示在浏览器的窗口中。 

由于显示代理服务器的安全问题,某些浏览器(如Internet Explorer)将无法正确显示此响应。

306 - 切换代理

“306 – 切换代理”代码表示服务器应为以下请求使用指定的代理。

307 - 临时重定向

当请求的资源临时移动到请求的位置标头中提到的不同地址时,会收到代码“307 – 临时重定向”。这只是一个临时重定向,但下一个请求应该访问原始 URL。顺便说一句,只有 HTTP/1.1 协议使用此状态代码。

308 - 永久重定向

“ 308 -永久重定向”代码是一个实验代码来指示永久重定向(类似于307,其被设置为临时重定向)。307 和 308 代码与 302 和 301 代码类似,只是不改变 HTTP 方法略有不同。

4xx 客户端错误代码

HTTP 代理错误的主要类型是 4xx 和 5xx 错误代码。收到来自 4xx 系列的错误表明问题来自客户端。它可以是您的请求、浏览器或自动化机器人。

400 - 错误请求

这是一个通用响应,表明您发送的请求存在问题。有时可能是您的代理服务器或目标网站无法解析您的请求。问题可能是语法错误、格式无效或欺骗性请求路由。

401 - 未经授权

“401 – 未经授权”错误代码表示您正在尝试访问未经授权的网站,您必须在该网站上进行身份验证。 

该错误由代理服务器在 Web 服务器需要身份验证和授权时返回。提供凭据将允许您访问资源。

402 - 需要付款 

此响应代码主要是为将来使用而设置的。尽管此状态代码相对罕见且不存在标准约定,但创建此代码的目的是用于数字支付系统。

403 - 禁止

403表示您的请求有效并且被代理或网络服务器理解但拒绝响应。当您无权查看资源时会发生这种情况。

404 - 未找到

当请求的在线资源不可用时,即使请求有效,代理服务器也会返回此代码。尽管 404 主要被称为“客户端错误”,但它是由死链接引起的。这可能意味着 URL 已被删除、不正确或未经重定向而更改。

405 - 方法不允许

当服务器知道请求方法但已禁用且无法使用时,会收到 405。例如,API 请求可能禁止 

“删除”一个资源。这两个强制性方法,GET和HEAD,绝不能禁用,不应返回该错误代码。

406 – 不可接受

当 Web 服务器在执行服务器驱动的内容协商后没有找到任何符合用户代理给出的标准的内容时,将发送响应。

407 - 需要代理身份验证

代理在需要身份验证或隧道连接失败时会指示 407 代码。当您的抓取工具未通过代理提供商正确验证或凭据不准确时,可能会发生这种情况。另一个原因可能是不在代理设置中将您的 IP 列入白名单。

解决此错误需要您通过包含列入白名单的 IP 并输入正确的凭据来更新代理设置。另外,请确保请求中也包含所有必需的信息。

408 - 请求超时

当服务器配置为等待或保持时客户端未产生请求时会收到此错误代码。客户端可以随时重复请求而无需进行修改。 

如果 408 错误持续存在,请在检测到错误时检查 Web 服务器上创建的负载。另一种可能性可能是连接问题。

409 - 冲突

409 – 冲突通常与标准 Web 服务器权限或安全性无关,但与特定应用程序、HTTP 协议本身未定义的冲突有关。

当将客户端的请求视为合法请求时,Web 服务器正在响应此错误,但由于与资源的当前状态冲突而无法完成请求。响应正文通常包含足够的信息,供用户识别冲突的来源并修复错误。

410 - 不见了

当请求的资源不再通过服务器可用,将不再可用,并且不知道转发地址时,Web 服务器以该错误代码响应。此错误类似于 404 错误,但 410 是永久性错误。

411 – 长度要求

此错误代码表示服务器拒绝接受没有定义内容长度的请求。客户端应该通过添加一个有效的 content-length 头字段来重复请求,该字段包含请求消息中消息体的长度。

412 - 先决条件失败

当在一个或多个请求头字段中给出前提条件时,网络服务器响应此错误代码,这些字段在服务器上测试时被评估为 false。 

此状态代码允许客户端对当前资源元信息(头字段数据)设置先决条件,并防止请求的方法应用于最初预期的资源之外的资源。

413请求实体太大

服务器拒绝处理请求,因为请求实体大于服务器可以处理的实体。服务器可以关闭连接以防止客户端发送更多相同的请求。 

“什么构成'太大'部分取决于正在尝试的操作。例如,上传大文件的请求(通过 HTTP PUT 方法)可能会遇到由网络服务器设置的上传文件大小的限制。”

414 - 请求 URL 太长

Web 服务器在拒绝为请求提供服务时响应此错误,因为 Request-URL 的长度超出了服务器的处理能力。当客户端不正确地将“POST”请求转换为“GET”请求时,这种罕见的情况更有可能发生,一旦客户端下降到 URL 重定向“黑洞”(意味着重定向的 URL 前缀是指向它自己的后缀),或 

当服务器受到客户端试图利用某些服务器中存在的任何安全漏洞的攻击时,也可能会收到此错误代码,还使用固定长度的缓冲区来读取和操作请求 URL。通常,网络服务器会设置相当慷慨的真实 URL 长度限制。如果长 URL 有效并且您仍然收到 414 错误代码,则意味着可能需要重新配置 Web 服务器以允许此类 URL 通过。

415 - 不支持的媒体类型

网络服务器拒绝完成请求,因为请求实体的格式不受请求方法的请求资源支持。

416 - 请求的范围不满足

如果请求包含“Range”请求头字段,则当服务器的响应通常返回 416 时,会收到 416 状态代码。此字段中没有特定于范围的值与所选资源的当前范围重叠,并且请求没有 If-Range 请求标头字段。 

例如,如果资源是一个1000字节的文件,请求的范围是500-1500,就不能满足可接受的范围。

417 期待落空

当服务器无法满足在“Expect”请求头字段中收到的期望,或者如果服务器是代理并且有明确的证据表明下一跳服务器无法满足要求。

429 - 太多的请求

当使用相同的 IP 地址在有限的时间范围内发送太多请求时,可能会收到此错误。网站通常实施此类限制以防止攻击者并避免过载。

使用轮换代理,设置每个 IP 和每个特定时间范围的请求之间的延迟可以解决此错误代码。
 

5xx – 服务器错误

服务器成功接收到请求但无法处理请求或处理过程中遇到问题时,返回5xx系列。

要解决所有这些 5xx 错误,请轮换 IP,并更改代理网络和 IP 类型。在这种情况下,最好使用住宅代理网络来轮换 IP 并确保可靠性。

您可能会收到错误代码,例如 – 

500 - 内部服务器 

当服务器遇到意外情况时会收到错误代码“500 – 内部服务器”,阻止其响应请求。

501 - 未实施

当服务器由于请求中使用的方法不受支持或无法识别而无法提供请求的资源时,会收到“501 – 未实现”错误。

502错误的网关

当服务器充当网关或代理并收到来自另一台服务器的无效响应时,在数据收集过程中会经常发生此错误。 

当超级代理拒绝 Internet 连接或发送的请求时,会检测到 IP 对所选设置不可用,因为机器人指示 502 代码。

503 - 服务不可用

“503 – 服务不可用”代码是在服务器收到请求的同时其他请求使它过载,或者它处于计划停机/维护范围内时收到的代码。在这种情况下,如果可能,请检查请求的服务器的状态。

504网关超时

当服务器 (a) 充当外部网关或代理并且没有及时收到来自下一个服务器 (b) 的响应时,会收到“504 – 网关超时”,在请求链中进一步尝试访问以实现请求。

505 - 不支持 HTTP 版本

当服务器不支持 HTTP 协议版本并在请求消息中使用时,会收到“505 – HTTP 版本不支持”代码。

507 - 空间不足

“507 – Insufficient Storage” 表示服务器磁盘空间不足,无法再容纳请求。

510 – 缺少扩展

服务器无法处理请求,因为请求了不受支持的扩展,然后收到代码“510 – Not Extended”。

文章列表