前言

在使用nginx时,我们配置最多的就是location项了。方向代理、负载均衡、静态资源服务器这些高频使用的共能点,几乎主要都在location配置。本文内容将包含上诉功能,并详细介绍location的匹配规则。

一、匹配语法及规则

1.基本语法

location [=|^~|~|~*] uri {
	...
}

location的匹配语法分成两个部分,[]括号中的是匹配符,决定以何种方式进行匹配,uri表示请求路径,例如http://www.baidu.com:8888/index/abc的uri就是/index/abc


2.匹配修饰符

匹配修饰符分为两种字符串匹配:= ^~正则匹配:~ ~*
注意下面表格中的优先级描述是针对同类型匹配规则的描述,不同类型匹配优先级,请看匹配优先级[^1]

字符串匹配

修饰符例子匹配路径描述优先级
=location = /index匹配/index
不匹配 /index/abc /index2
uri必须完全一致才能匹配一旦被匹配,则不执行后续匹配
^~location ^~ /index匹配 /index /index234 /index/bb
不匹配 /index2
匹配开头为/indexuri优先完全匹配 ,否则匹配规则最长的
规则1:location ^~ /index1
规则2:location ^~ /index12
uri=/index1 则匹配规则1
uri=/index1234则匹配规则2
  • 字符串匹配不区分大小写 location = /index 同时匹配 /index | /INDEx
  • location = index | location ^~ index 不能匹配 /index ,因为字符串匹配是从uri开头开始匹配的
  • 如果没有使用匹配修饰符,则默认为普通匹配,如: location /index 等效于 location ^~ /index

正则匹配

修饰符例子匹配路径描述优先级
~location ~ index[0-9]匹配 /index23 /aa/index23 /aa/index23/bb根据正则表达式匹配uri,区分大小写匹配后停止匹配
~*location ~* index[0-9]匹配/index1 /Index2 /InDex23根据正则规则匹配uri,不区分大小写匹配后仍继续匹配,取最长规则命中

如果想从uri最开头进行匹配则可以通过控制正则表达式来实现 location ~ ^/index$,只匹配/index

内部定义 @

在使用过程我们一般还会使用@符号,它的作用相当于一个跳转规则的变量

location /index {
	error_page 404 @index_error; // 如果没有匹配到服务 则使用@index_error的跳转规则
}

location @index_error{
	...
}

3.匹配优先级

=为精准匹配、^~为普通匹配 、 ~ ~*为正则匹配

匹配类别优先级
类型之间的优先级精准匹配>普通匹配>正则匹配>/默认根路径匹配。
普通匹配同类型location之间的优先级最长前缀优先。普通匹配的优先级与location在配置文件中所处的先后顺序无关,而与匹配到的前缀长度有关。
正则匹配同类型location之间的优先级顺序优先。只要匹配到第一个正则规则的location,就停止后面的正则规则的测试。正则匹配与location规则定义在配置文件中的先后顺序强相关。

二、常用的一些操作

1.url反向代理

location /index {
	// 这里只能替换ip和端口,即便设置成http://127.0.0.1:80/index2 也只替换ip和端口
	proxy_pass http://127.0.0.1:80; 
	
	rewrite /index /index2 break;
	// 使用正则表达式 $1为匹配到的值,在此为/index,本语句将/index => /index/index2
	rewrite ^\/index $1/index2;
}

  • 1.rewrite

是一个比较常用的指令,它的语法是这样的

rewrite regex|string replacement [flag];
flag描述
brack执行本条匹配后不在执行后面的匹配,一般用在server或if中
last执行本条匹配后继续下次匹配
redirect返回302临时重定向,地址栏会显示跳转后的地址;
permanent返回301永久重定向,地址栏会显示跳转后的地址;

  • 2.控制请求头
location /index {
	add_header key value; # 添加自定义响应头
	// 反向代理
	proxy_set_header key value; # 反向代理,向目标服务器转发的请求添加请求头
	proxy_hide_header key; # 反向代理,隐藏目标服务器响应头字段
	
}

小提示:

  • 有时候明明设置了响应头,但是前端确没有得到,那是因为浏览器约束了前端能够获取到的响应头字段,可以通过色设置Access-Control-Expose-Headers:headerKey,headerKey2响应头进行放开
  • nginx进行代理时会将请求头字段及参数全量传递给下一级服务器

请注意! add_header只会在最底层生效,如果你在server 和 server内部的location中都定义了add_header。那么只有最底层的location中的add_header会生效

server {
	add_header key val; # 如果底层存在add_header语句,则此语句不生效
	location / {
		add_header key2 val;
	}
}

2.负载均衡

一个基本的负载均衡配置

http {
	# 建立模拟服务器
	server {
		listen 3001;
		server_name 127.0.0.1;
		location / {
			return 200 <p>服务器3001</p>;
		}
	}

	server {
		listen 3002;
		server_name 127.0.0.1;
		location / {
			return 200 <p>服务器3002</p>;
		}
	}

	server {
		listen 3003;
		server_name 127.0.0.1;
		location / {
			return 200 <p>服务器3003</p>;
		}
	}
	
	# 定义服务器上游 名为myServerName
	upstream myServerName {
		server 127.0.0.1:3001 weight=1; # weight表权重,这里有 1 / (1+1+1)的几率访问到这个服务器
		server 127.0.0.1:3002 weight=1;
		server 127.0.0.1:3003 weight=1;
	}

	# 访问服务器
	server {
		listen 3000;
		server_name 127.0.0.1;
		location / {
			proxy_pass http://myServerName break; # 这里myServerName 为上游服务器名
		}
		
	}
	
}

上面的配置只包含了最基础的负载均衡处理,一个成熟的负载均衡策略应该还要包含以下几点特性:

  • 热备:当主服务器出现问题时,应该自动将请求转发至备用服务器
  • 分配策略:不同的情况应该有不同的分配策略,详细情况下面会有表格描述
  • 服务器超时处理:当某一个或多个服务器处理请求长时间无响应时,
  • 服务器宕机处理

以上这些特性都可以在upstream项中进行配置

upstream myServerName {
	server 127.0.0.1:3004 backup; # 热备
	server 127.0.0.1:3005 down; #宕机 暂不参与负载均衡
	server 127.0.0.1:3006 max_fails=5 fail_timeout=300; # 失败次数5次之后 停止负载均衡300秒; max_fails默认1 fail_timeout默认10
}

分配策略有多种,这里我们列一个表格预览

策略描述
轮询默认的分配策略,服务器轮流分配请求,适用于所有服务器性能一致的情况
weight由权重分配服务器访问几率,适用与服务器性能出现参差不齐的场景,高性能的服务器高权重访问
ip_hash由ip分配,同一个ip分配到同一个服务器,一般适合带有token性质的场景,当这个ip在一台服务器上登陆后,保证他后续需要验证的请求,能够访问到存有它登录信息的服务器
least_conn根据最少连接分配,分配到最少连接的服务器地址。
url_hash根据url进行分配,同一个url分配到同一个服务器,这个一般配合缓存处理资源请求,当资源第一次请求,被分配到一个服务器上之后,服务器会将资源结果缓存,如果下次进入它请求另外一台服务器,那么之前服务器的缓存就被有起到效果,而且新的服务器还要进行一次缓存,这样缓存的利用率就不好。现在资源一般由浏览器进行缓存,场景使用较少

还有一种第三方的负载均衡策略,可以根据页面大小、加载时间长短智能地进行负载均衡。它的使用需要第三方模块的支持
下载地址

https://github.com/gnosek/nginx-upstream-fair

解压\重命名

unzip nginx-upstream-fair-master.zip
mv nginx-upstream-fair-master fair

编译

./configure --add-module=/root/fair # nginx加入模块
make # 编译

在编译的过程中可能出现

error // nginx_http_upstream_srv_conf_t结构中缺少default_port

// 解决方案

# step1:在Nginx的源码中src/http/nginx_http_upstream.h,找到ngx_http_upstream_srv_conf_s,
# step2:在模块中添加default_port属性:in_port_t default_port

然后再进行make。

更新nginx

#step1:将sbin目录下的nginx进行备份
mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginxold
 
#step2:将安装目录下的objs中的nginx拷贝到sbin目录
cd objs
cp nginx /usr/local/nginx/sbin
 
#step3:更新
cd ../

使用

upstream myServerName {
	fair;
	server 127.0.0.1:3001;
}

三、set、if 语句

if 可以作为判断语句,set可以定义内部变量。它们的放置位置为server、location、if。
定义的变量也是有作用域的,定义在location中的变量不能被它的外层位置server中引用,定义在server中的位置可以被内层中location引用

location /index {
	
	set $key value; # 变量名需要以$开头
	set $key2 $key;# 使用其他变量作值
	set $key3 $host;# 使用内置变量
	
	
	
	if ($key = 1) {
		return 101;
	}
	
	# 正则匹配 正则匹配值必须使用双引号包裹
	if($key ~ "123"){
		return 102;
	}
}

四、语句的放置位置

location>if 表示location块下面的if

语句放置位置值得注意的
proxy_passlocation、location>if-
rewritelocation、location>if-
add_headerserver、location、if最底层块生效
proxy_set_headerserver、location、if最底层生效
setserver、location、if-
if任意位置-

五、常用的location 配置项

location / {
	root html;
	index index.html index.hml;
	
	try_files $uri /filePath...;
}
配置项描述
root指定根目录
index默认显示的文件,文件地址相对root配置
try_files尝试以给定$uri响应请求,如果 $uri没有不存在,则使用下一个配置文件响应。如果所有给定的文件都没有则返回404。注意文件路径需要加/

六、nginx常用命令

window

start nginx  或  nginx.exe # 启动nginx
nginx.exe -s stop # 停止当前启动的nginx
nginx.exe -s reload # 重启nginx
tasklist /fi "imagename eq nginx.exe" # 查看当前nginx进程
tasklist /fi "imagename eq nginx.exe" # 查看所有nginx进程
taskkill /f /t /im nginx.exe # 停止所有nginx进程

七、常用的内置变量

变量说明
$agrs请求中的参数,如www.123.com/1.php?a=1&b=2的$args就是a=1&b=2
$uri $document_uri当前请求中不包含指令的URI,如www.123.com/1.php?a=1&b=2的$uri就是1.php,不包含后面的参数
$http_referer记录此次请求是从哪个连接访问过来的,可以根据该参数进行防盗链设置
$host主机头,也就是域名
$http_cookie客户端cookie信息
$http_x_forwarded_for当前端有代理服务器时,设置web节点记录客户端地址的配置,此参数生效的前提是代理服务器也要进行相关的x_forwarded_for设置
$remote_addr客户端公网ip
$remote_port客户端端口
$remote_user如果nginx有配置认证,该变量代表客户端认证的用户名
$request请求的URI和HTTP协议,如“GET /article-10000.html HTTP/1.1”
$request_body_file做反向代理时发给后端服务器的本地资源的名称
$request_method请求资源的方式,GET/PUT/DELETE等
$request_filename当前请求的资源文件的路径名称,相当于是 d o c u m e n t r o o t / document_root/ documentroot/document_uri的组合
$request_uri请求的链接,包括 d o c u m e n t u r i 和 document_uri和 documenturiargs
$scheme请求的协议,如ftp,http,https
$server_protocol客户端请求资源使用的协议的版本,如HTTP/1.0,HTTP/1.1,HTTP/2.0等
$server_addr服务器IP地址
$server_name服务器的主机名
$server_port服务器的端口号
$statushttp状态码,记录请求返回的状态码,例如:200、301、404等
$uri和$document_uri相同
$http_referer客户端请求时的referer,通俗讲就是该请求是通过哪个链接跳过来的,用curl -e可以指定
$time_local记录访问时间与时区,如18/Jul/2014:17:00:01 +0800
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐