HTTP Header

概述

参考:

一般情况下,在打开浏览器按的开发者工具(一般为 F12 键)后,查看到的首部大部分都是请求和响应首部,这俩首部的信息通常包含了通用首部中的信息

HTTP 请求和响应报文的 Header(头) 基本都是 Key/Value Pair(键/值对) 格式的 Field(字段),每个字段都是以冒号分割的 键/值对。此外,除了标准的 Header 字段之外,还可以添加自定义 Header,这就给 HTTP 带来了无限的扩展可能。注意,Key 不区分大小写

自定义 Header 历来以 X- 开头,但是该约定在 2012 年 6 月被弃用,因为它在非标准字段成为标准字段时会造成不必要的麻烦,详见 RFC 6648。IANA 维护了一个通用的 HTTP Header 列表,其中包括 RFC 中定义的标准头以及不在 RFC 中定义的扩展头;并且在同一个页面还有新的提议增加的 HTTP Header 列表。

HTTP(RFC 2616 版本) 规定了非常多的 Header 字段,可以实现各种各样的功能,但基本上可以分为以下几类

  1. General Header(通用头) # 在请求头和响应头里都可以出现;
  2. Request Header(请求头) # 仅能出现在请求头里,进一步说明请求信息或者额外的附加条件;
  3. Response Header(响应头) # 仅能出现在响应头里,补充说明响应报文的信息;
  4. Entity Header(实体头) # 它实际上属于通用字段,但专门描述 body 的额外信息。
  5. Extension Header(扩展头) # 不在标准规范中,可以通过自定义头实现更多定制化需求的 Header 信息。

对 HTTP 报文的解析和处理其实本质上就是对头字段的处理,HTTP 的连接管理,缓存控制,内容协商等都是通过头字段来处理的,理解了头字段,基本上也就理解了 HTTP,所以理解头字段非常重要。

新版 HTTP Header 规范

注意:上面描述分类是在 RFC 2616 标准中定义的,在新的 RFC 7231 中,已经看不到这种分类了,仅仅简单得分为请求头和响应头

而这两类头字段下,又有各自的子分类

在 2014 年之后的新版规范中,并非所有出现在请求中的 Header 都称为请求头,比如 Content-Length,在 RFC 2616 中称为 Entity Header(实体头),而在新版规范中,称之为元数据。这也为 HTTP 2.0 的 Header 压缩 打下了基础

Request Header(请求头)

Request Header(请求头) 主要是在每个 HTTP 的请求中指定。包含要获取的资源或请求某个资源的客户端本身的信息,以便服务端可以根据这些内容,来定制响应。

Request Header 中,将各种 Header 分为多个类别

  • Controls # 控制本次 HTTP 请求的行为
  • Conditionals # 条件相关 Header
  • Content Negotiation # 内容协商相关 Header
  • Authentication Credentials # 认证相关的 Header
  • Request Context # 请求上下文

Controls(控制)

Controls 类型的请求头用来指定客户端如何处理本次 HTTP 请求。

Cache-Control # 缓存控制

Expect # 期待服务器的特定行为

Host # 请求资源所在服务器。客户端指定自己想访问的服务器的 域名 或者 IP:PORT。例如:Host:www.baidu.com

  • Note:输入的什么网址,请求的就是什么,输入域名就是域名,输入 IP 就是 IP
  • Note:当服务器接到这个请求时,如果自身无法处理 ip 或者无法处理域名,则该请求就会丢弃(比如 k8s 的 ingress)。所以在测试的时候一般使用 curl 命令请求 IP 时加上 -H 参数以自己制定 URL 内容即可,否则如果服务器不处理 IP 的话,就会返回 404

Max-Forwards# 最大传输逐跳数

Pragma #

Range # 实体的字节范围请求

TE# 传输编码的优先级

Conditionals(条件)

If-Match # 比较实体标记(ETag)

If-None-Match # 比较实体标记(与 If-Match 相反)

If-Modified-Since # 比较资源的更新时间

If-Unmodified-Since# 比较资源的更新时间(与 If-Modified-Since 相反)

If-Range# 资源未更新时发送实体 Byte 的范围请求

Content Negotiation(内容协商)

Accept # 用户代理可处理的媒体类型

Accept-[ Charset | Encoding | Language] # 通知 server 自己可接收的媒体类型[字符集|编码格式|语言]

Authentication Credentials(认证)

Authorization # Web 认证信息。IANA 维护了一个身份验证方案的列表

  • Basic # 基本认证。就是用户名和密码。如果用户名和密码为 admin/admin1234 的话,该字段应该是这样的:
    • Authorization: Basic YWRtaW46YWRtaW4xMjM0
    • 也就是说,用户名和密码是 admin:admin1234 这样的 base64 编码后的格式
  • Bearer # 不记名令牌。
  • ……

Proxy-Authorization # 代理服务器要求客户端的认证信息

Request Context

From # 用户的电子邮箱地址

Referer # 对请求中 URI 的原始获取方

User-Agent # HTTP 客户端程序的信息。i.e. 本次请求是由什么程序发送的

Response Header(响应头)

包含有关响应的补充信息,如其位置或服务器本身(名称和版本等)的消息头。

Response Header 中,将各种 Header 分为多个类别:

  • Control Data
  • Validator Header Fields
  • Authentication Challenges
  • Response Context

Control Data(控制数据)

控制服务端如何处理 HTTP 响应

  • Age # 推算资源创建经过时间
  • Cache-Control #
  • Expires #
  • Data #
  • Location #
  • Retry-After #
  • Vary #
  • Warning #

Validator Header Fields(验证器头字段)

ETag # 资源的匹配信息

Last-Modified # 最后一次修改时间

Authentication Challenges

WWW-Authenticate # 服务器对客户端的认证信息

Proxy-Authorization # 代理服务器要求客户端的认证信息

Response Context

Accept-Ranges # 是否接受字节范围请求

Allow #

Server# HTTP 服务器的安装信息

Extension Header(扩展头)

通常情况下,一个 web 界面有 N 多个资源,比如 index.html 首页是一个资源,首页中有各种 img,css,js 等静态或动态资源,当用户访问一个网站后,除了要请求主页资源,还需要再请求主页上各个图片,板式,功能等资源,每一个资源都有一个单独的报文。也就说有可能每一类资源都可以单独存在在一个相对应的集群服务器群中,比如通过一个图片的 URL,可以直接访问该图片,而不用在网站主页才能看到;而这些资源都需要前端负载均衡器来进行调度用户请求到相应的服务器中去拿去资源,这时候 LB 的压力会非常大,为了解决这种问题,人们就可以根据自己的协商,定义一些标准之外的 Header。

MDN 的 HTTP Header 列表

RFC 7231 中 HTTP Header 分类方式好像并不是特别好的方式,在 RFC 9110 中,已经没有 RFC 7231 的那种请求头分类章节了。

很多 HTTP Header 既可以当做 Request Header 又可以当做 Response Header,比如 Cache-Control、等等。所以 MDN 使用 Header 的功能进行分类

  • 验证
  • 缓存
  • 控制
  • Cookie
  • 。。。等等

RFC 6265

HeaderHeader 分类Herader 用途
Cookie请求头客户端将存储的 cookie 在 Cookie 标头中发送到源服务器。
Set-Cookie响应头Set-Cookie HTTP 响应头用于将 cookie 从服务器发送到客户端。客户端接收到 Set-Cookie 响应头后,将会咱自身内部设置 cookie。

Notes: 如果想要设置 Cookie,服务端必须使用 Set-Cookie 将 cookie 的 key 和 value 发送给服务端。如果想要在登录时获取某些 Cookie 信息,也可以从 Set-Cookie 响应头中查找

比如登录京东

image.png