以下总结的都是自己项目中用到的关于 nginx 的配置知识点,了解了以下的关于 nginx 的配置对于一些常见关于 nginx 的配置应该是没有什么问题的,后续项目中如果有遇到新的知识点会来补充:
1. nginx 的匹配规则
关于 nginx 的匹配规则是学习 nginx 必须要了解的,也可以说懂了 nginx 的匹配规则就相当于打通了 nginx 学习的仍督二脉,以下直接给到一些总结:
首先匹配都是写在 location 模块的,分为普通匹配以及正则匹配:
普通 location:^~、 = (精确匹配)、无前缀(类似/static/)
eg :
location ^~ /static {}
location = /static {}
location /static {}
普通匹配,遵循最长匹配规则,假设一个请求匹配到了两个普通规则,则选择匹配长度大的那个,一般情况下普通匹配成功后,还是会继续正则匹配,一旦正则匹配也匹配成功后,以正则匹配为准。但是除^~和=除外,即^~和=匹配成功后,不再继续正则匹配。
正则 location:~ (区分大小写)、~*(不区分大小写)
eg:
location ~ /static {}
location ~* /static {}
普通location和正则location之间,先普通匹配再正则匹配,一般情况下普通匹配成功后,还是会继续正则匹配,一旦正则匹配也匹配成功后,以正则匹配为准。但是除^~和=除外,即^~和=匹配成功后,不再继续正则匹配。
首先检查是否有精确匹配规则,如果有,则处理精确匹配规则,假设发现精确匹配规则,停止搜索其他匹配规则,返回当前匹配的规则
其次普通字符匹配,该项匹配请求,仍然需要检查是否有正则或者更长匹配,如果有,返回正则匹配或者更长匹配
^~匹配被第三步处理,如果请求匹配此规则,停止其他规则匹配,返回此规则
正则匹配被最后执行,正则匹配只要被找到,停止解析其他规则,这个就要注意先后顺序了
另外说以下匹配URL以指定后缀结尾的请求:
// 匹配URL以MP3或者MP4结尾的请求, $符号表示结尾标识,因为是忽略大小写,所以访问后缀为 .MP3 .mp3 都会匹配到该部分:
location ~* \.(mp3|mp4)$ {
proxy_pass http://localhost:8080 //转发到本机8080端口
}
2. nginx 的反向代理与负载均衡
关于负载均衡的配置是通过设置 upstream 来实现的,直接看以下实例:
upstream web_upstream {
server 192.168.1.100:8888;
server 192.168.1.101:8888;
server 192.168.1.102:8888;
}
server{
listen 80;
server_name www.oone.top;
location / {
proxy_pass http://web_upstream;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; // 用于实现定义数据包头,记录用户真实IP
}
}
通过此设置 nginx -s reload 后访问 www.oone.top 会轮询(默认规则)访问配置的三个负载均衡的 server,一般负载均衡请求的服务器是在同一个内网下,所以直接用内网地址即可,关于负载均衡方案掌握常见的以下几种即可:
1)轮询(默认)
默认选项,当weight不指定时,各服务器weight相同, 每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
upstream bakend {
server 192.168.1.10;
server 192.168.1.11;
}
2)weight
指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。如果后端服务器down掉,能自动剔除。 比如下面配置,则1.11服务器的访问量为1.10服务器的两倍(后端节点中配置高的服务器可以适当将weight设置大点)。
upstream bakend {
server 192.168.1.10 weight=1;
server 192.168.1.11 weight=2;
}
3)ip_hash
每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session不能跨服务器的问题,实现session共享。如果后端服务器down掉,要手工处理。
upstream resinserver {
ip_hash;
server 192.168.1.10:8080;
server 192.168.1.11:8080;
}
3. nginx 的 rewrite 规则
对于 nginx 的 rewrite,语法为 rewrite regex replacement [flag]
,其中flag可以被设置为last结束当前指令并重新搜索location匹配、break结束当前rewrite指令、redirect临时重定向302、permanent永久重定向301。
比如对一个二维码扫描根据访问的 ua 设置跳转到不同的 url:
location = /app {
if ($http_user_agent ~* (android)) {
rewrite ^ http://www.oone.com/download.html redirect;
}
if ($http_user_agent ~* (iphone)) {
rewrite ^ https://itunes.apple.com/cn/app/nikki/id1214764672?mt=8 redirect;
}
}
1)Nginx Rewrite 基本标记 (flags)
last 基本上都用这个Flag。相当于Apache里的[L]标记,表示完成rewrite,不再匹配后面的规则
break 中止 Rewirte,不再继续匹配
redirect 返回临时重定向的HTTP状态302
permanent 返回永久重定向的HTTP状态301。原有的url支持正则,重写的url不支持正则
2)正则表达式匹配,其中:
* ~ 为区分大小写匹配
* ~* 为不区分大小写匹配
* !~和!~* 分别为区分大小写不匹配及不区分大小写不匹配
3)文件及目录匹配,其中:
* -f 和!-f 用来判断是否存在文件
* -d 和!-d 用来判断是否存在目录
* -e 和!-e 用来判断是否存在文件或目录
* -x 和!-x 用来判断文件是否可执行
4)Nginx的一些可用的全局变量,可用做条件判断:
$args #这个变量等于请求行中的参数,同$query_string
$arg_NAME #请求中的的参数名,即“?”后面的arg_name=arg_value形式的arg_name
$binary_remote_addr #客户端地址的二进制形式,固定长度为4个字节
$body_bytes_sent #传输给客户端的字节数,响应头不计算在内;这个变量和Apache的mod_log_config模块中的"%B"参数保持兼容
$bytes_sent #传输给客户端的字节数
$connection #TCP连接的序列号
$connection_requests #TCP连接当前的请求数量
$content_length #请求头中的"Content-Length" 字段
$content_type #请求头中的"Content-Type" 字段
$cookie_name #cookie名称
$cookie_NAME #客户端请求Header头中的cookie变量,前缀"$cookie_"加上cookie名称的变量,该变量的值即为cookie名称的值
$document_uri #同 $uri
$document_root #当前请求的文档根目录或别名
$host #优先级:HTTP请求行的主机名>"HOST"请求头字段>符合请求的服务器名.请求中的主机头字段,如果请求中的主机头不可用,则为服务器处理请求的服务器名称
$hostname #主机名
$https #如果开启了SSL安全模式,值为"on",否则为空字符串。
$http_NAME #匹配任意请求头字段;变量名中的后半部分NAME可以替换成任意请求头字段,如在配置文件中需要获取http请求头:"Accept-Language",$http_accept_language即可
$http_cookie #客户端cookie信息
$http_host #请求地址,即浏览器中你输入的地址(IP或域名)
$http_referer #url跳转来源,用来记录从那个页面链接访问过来的
$http_user_agent #用户终端浏览器等信息
$http_x_forwarded_for
$is_args #如果请求中有参数,值为"?",否则为空字符串
$limit_rate #用于响应的速度限制
$msec #当前的Unix时间戳
$nginx_version #nginx版本
$pid #工作进程的PID
$pipe #如果请求来自管道通信,值为"p",否则为"."
$proxy_protocol_addr #获取代理访问服务器的客户端地址,如果是直接访问,该值为空字符串
$query_string #同 $args
$realpath_root #当前请求的文档根目录或别名的真实路径,会将所有符号连接转换为真实路径$remote_addr #客户端的IP地址$remote_port #客户端的端口$remote_user #用于HTTP基础认证服务的用户名
$request #代表客户端的请求地址
$request_body #客户端的请求主体:此变量可在location中使用,将请求主体通过proxy_pass,fastcgi_pass,uwsgi_pass和scgi_pass传递给下一级的代理服务器
$request_body_file #将客户端请求主体保存在临时文件中。文件处理结束后,此文件需删除。如果需要之一开启此功能,需要设置$request_completion #如果请求成功,值为"OK",如果请求未完成或者请求不是一个范围请求的最后一部分,则为空
$request_filename #当前连接请求的文件路径,由root或alias指令与URI请求生成$request_length #请求的长度 (包括请求的地址,http请求头和请求主体)
$request_method #HTTP请求方法,通常为"GET"或"POST"
$request_time #处理客户端请求使用的时间,单位为秒,精度毫秒; 从读入客户端的第一个字节开始,直到把最后一个字符发送给客户端后进行日志写入为止。
$request_uri #这个变量等于包含一些客户端请求参数的原始URI,它无法修改,请查看$uri更改或重写URI,不包含主机名,例如:"/cnphp/test.php?arg=freemouse"
$scheme #请求使用的Web协议,"http" 或 "https"
$server_addr #服务器端地址,需要注意的是:为了避免访问linux系统内核,应将ip地址提前设置在配置文件中
$server_name #服务器名
$server_port #服务器端口
$server_protocol #服务器的HTTP版本,通常为 "HTTP/1.0" 或 "HTTP/1.1"
$status #HTTP响应代码
$time_iso8601 #服务器时间的ISO 8610格式
$time_local #服务器时间(LOG Format 格式)
$sent_http_NAME #可以设置任意http响应头字段;变量名中的后半部分NAME可以替换成任意响应头字段,如需要设置响应头Content-length,$sent_http_content_length即可$sent_http_cache_control #响应字段
$sent_http_connection #响应字段
$sent_http_content_type #响应字段
$sent_http_keep_alive #响应字段
$sent_http_last_modified #响应字段
$sent_http_location #响应字段
$sent_http_transfer_encoding #响应字段
$uri #请求中的当前URI(不带请求参数,参数位于$args),可以不同于浏览器传递的$request_uri的值,它可以通过内部重定向,或者使用index指令进行修改,$uri不包含主机名,如"/foo/bar.html"。
nginx的rewrite指令执行顺序:
1)执行server块的rewrite指令(这里的块指的是server关键字后{}包围的区域,其它xx块类似)
2)执行location匹配
3)执行选定的location中的rewrite指令
如果其中某步URI被重写,则重新循环执行1-3,直到找到真实存在的文件
如果循环超过10次,则返回500 Internal Server Error错误