Tornado全称Tornado Web Server,是一个用Python语言写成的Web服务器兼Web应用框架,由FriendFeed公司在自己的网站FriendFeed中使用,被Facebook收购以后框架在2009年9月以开源软件形式开放给大众。

Tornado与其他Web框架的区别

以Django为代表的python web应用部署时采用wsgi协议与服务器对接(被服务器托管),而这类服务器通常都是基于多线程的,也就是说每一个网络请求服务器都会有一个对应的线程来用web应用(如Django)进行处理。

考虑两类应用场景

  1. 用户量大,高并发

    如秒杀抢购、双十一某宝购物、春节抢火车票

  2. 大量的HTTP持久连接

    使用同一个TCP连接来发送和接收多个HTTP请求/应答,而不是为每一个新的请求/应答打开新的连接的方法。

    对于HTTP 1.0,可以在请求的包头(Header)中添加Connection: Keep-Alive。

    对于HTTP 1.1,所有的连接默认都是持久连接。

对于这两种场景,通常基于多线程的服务器很难应对。

对于前面提出的这种高并发问题,我们通常用C10K这一概念来描述。C10K—— Concurrently handling ten thousandconnections,即并发10000个连接。对于单台服务器而言,根本无法承担,而采用多台服务器分布式又意味着高昂的成本。如何解决C10K问题?

Tornado在设计之初就考虑到了性能因素,旨在解决C10K问题,这样的设计使得其成为一个拥有非常高性能的解决方案(服务器与框架的集合体)。

Hello Word

第一个py

安装Tornado部分略过,我们直接进入正题,PyCharm没有新建Tornado项目的选项,我们直接新建一个py即可。

复制代码

 1 # -*- coding=utf-8 -*-
 2 import tornado.web
 3 import tornado.ioloop
 4 
 5 
 6 class Index(tornado.web.RequestHandler):
 7     # 封装一个类
 8     def get(self):
 9         # get请求进入该方法
10         # 返回字符串
11         self.write('Hello World')
12 
13 
14 class Home(tornado.web.RequestHandler):
15     def get(self):
16         self.write('Home')
17 
18 
19 if __name__ == '__main__':
20     app = tornado.web.Application([
21         # 相当于路由
22         (r'/', Index),
23         (r'/home', Home),
24     ])
25     # 指定端口
26     app.listen(8000)
27     # 开启
28     tornado.ioloop.IOLoop.current().start()

复制代码

我们直接启动即可,然后使用postman或者浏览器访问(我习惯使用postman)

http://localhost:8000

我们测试一下结果

 

当服务器收到请求时会进入Application,进入路由顺序查找匹配。匹配到进入相关class,再根据方法进行处理

如果没有对应class报404,没有相应的方法报405

开启多进程

之前说过Tornado的特点便是多进程,但是上面的代码是单进程的,我们需要修改代码来开启多进程

复制代码

# -*- coding=utf-8 -*-
import tornado.web
import tornado.httpserver
import tornado.ioloop


class Index(tornado.web.RequestHandler):
    # 封装一个类
    def get(self):
        # get请求进入该方法
        # 返回字符串
        self.write('Hello World')


class Home(tornado.web.RequestHandler):
    def get(self):
        self.write('Home')


if __name__ == '__main__':
    app = tornado.web.Application([
        # 相当于路由
        (r'/', Index),
        (r'/home', Home),
    ])
    # 手动生成server
    http_server = tornado.httpserver.HTTPServer(app)
    # 指定端口
    http_server.bind(8000)
    # 开启多进程
    http_server.start(0)
    # 开启
    tornado.ioloop.IOLoop.current().start()

复制代码

注意:指定多进程在linux上可行,在windows会报错,因为fork这个系统命令,只在linux中才有用。所以windows请留空(默认为1)或者填1

http_server.start(num_processes=1)方法指定开启几个进程,参数num_processes默认值为1,即默认仅开启一个进程;如果num_processes为None或者<=0,则自动根据机器硬件的cpu核芯数创建同等数目的子进程;如果num_processes>0,则创建num_processes个子进程。

虽然tornado给我们提供了一次开启多个进程的方法,但是由于:

  • 每个子进程都会从父进程中复制一份IOLoop实例,如过在创建子进程前我们的代码动了IOLoop实例,那么会影响到每一个子进程,势必会干扰到子进程IOLoop的工作;
  • 所有进程是由一个命令一次开启的,也就无法做到在不停服务的情况下更新代码;
  • 所有进程共享同一个端口,想要分别单独监控每一个进程就很困难。

不建议使用这种多进程的方式,而是手动开启多个进程,并且绑定不同的端口。

Tornado options组件(命令行加参数)

像端口这种易改变的配置写在代码里则会有解耦性的问题,这个时候我们就需要Tornado的options组件。他可以帮助我们实现全局参数的定义存储和转换。

tornado.options.define()

参数有

  • name 选项变量名,须保证全局唯一性,否则会报“Option 'xxx' already defined in ...”的错误;
  • default 选项变量的默认值,如不传默认为None;
  • type 选项变量的类型,从命令行或配置文件导入参数的时候tornado会根据这个类型转换输入的值,转换不成功时会报错,可以是str、float、int、datetime、timedelta中的某个,若未设置则根据default的值自动推断,若default也未设置,那么不再进行转换。可以通过利用设置type类型字段来过滤不正确的输入。
  • multiple 选项变量的值是否可以为多个,布尔类型,默认值为False,如果multiple为True,那么设置选项变量时值与值之间用英文逗号分隔,而选项变量则是一个list列表(若默认值和输入均未设置,则为空列表[])。
  • help 选项变量的帮助提示信息,在命令行启动tornado时,通过加入命令行参数 --help 可以查看所有选项变量的信息(注意,代码中需要加入tornado.options.parse_command_line())。
define("port", default=8000, help="run on the given port", type=int)

此处做到可以在启动时输入一个port,来指定端口,不传默认为8000,输入类型为int

python tdo_helloword.py --port=9000

指定端口为9000

那么代码修改为

复制代码

# -*- coding=utf-8 -*-
import tornado.web
import tornado.ioloop
import tornado.httpserver
import tornado.options
# 可以多行
tornado.options.define("port", default=8000, help="run on the given port", type=int)


class Index(tornado.web.RequestHandler):
    # 封装一个类
    def get(self):
        # get请求进入该方法
        # 返回字符串
        self.write('Hello World')


class Home(tornado.web.RequestHandler):
    def get(self):
        self.write('Home')


if __name__ == '__main__':
    # 注意加上这句
    tornado.options.parse_command_line()
    app = tornado.web.Application([
        # 相当于路由
        (r'/', Index),
        (r'/home', Home),
    ])
    # 手动生成server
    http_server = tornado.httpserver.HTTPServer(app)
    # 指定端口
    http_server.bind(tornado.options.options.port)
    # 开启多进程
    http_server.start(1)
    # 开启
    tornado.ioloop.IOLoop.current().start()

复制代码

我们在命令行加入port参数

python tdo_helloword.py --port=9999

查看效果

Tornado options组件(从配置文件导入)

配置文件格式要对

 

 我们要更新一下代码

复制代码

# -*- coding=utf-8 -*-
import tornado.web
import tornado.ioloop
import tornado.httpserver
import tornado.options
# 可以多行
tornado.options.define("port", default=8000, help="run on the given port", type=int)


class Index(tornado.web.RequestHandler):
    # 封装一个类
    def get(self):
        # get请求进入该方法
        # 返回字符串
        self.write('Hello World')


class Home(tornado.web.RequestHandler):
    def get(self):
        self.write('Home')


if __name__ == '__main__':
    # 注意加上这句
    # tornado.options.parse_command_line()
    # 从文件读取配置
    tornado.options.parse_config_file('./config')
    app = tornado.web.Application([
        # 相当于路由
        (r'/', Index),
        (r'/home', Home),
    ])
    # 手动生成server
    http_server = tornado.httpserver.HTTPServer(app)
    # 指定端口
    http_server.bind(tornado.options.options.port)
    # 开启多进程
    http_server.start(1)
    # 开启
    tornado.ioloop.IOLoop.current().start()

复制代码

这样便是读取配置文件来启动tornado

关闭日志

在我们访问网站的时候,我们会发现屏幕打印了访问和返回的记录,我们可以将他关闭

想要关闭,我们可以在开启时加上--logging=none

python td_helloword.py --logging=none

或者修改代码为

复制代码

 1 # -*- coding=utf-8 -*-
 2 import tornado.web
 3 import tornado.ioloop
 4 import tornado.httpserver
 5 import tornado.options
 6 # 可以多行
 7 tornado.options.define("port", default=8000, help="run on the given port", type=int)
 8 
 9 
10 class Index(tornado.web.RequestHandler):
11     # 封装一个类
12     def get(self):
13         # get请求进入该方法
14         # 返回字符串
15         self.write('Hello World')
16 
17 
18 class Home(tornado.web.RequestHandler):
19     def get(self):
20         self.write('Home')
21 
22 
23 if __name__ == '__main__':
24     # 不打印日志
25     tornado.options.options.logging = None
26     tornado.options.parse_command_line()
27     # 从文件读取配置
28     # tornado.options.parse_config_file('./config')
29     app = tornado.web.Application([
30         # 相当于路由
31         (r'/', Index),
32         (r'/home', Home),
33     ])
34     # 手动生成server
35     http_server = tornado.httpserver.HTTPServer(app)
36     # 指定端口
37     http_server.bind(tornado.options.options.port)
38     # 开启多进程
39     http_server.start(1)
40     # 开启
41     tornado.ioloop.IOLoop.current().start()

路由

路由的匹配

Tornado的路由匹配采用的是正则匹配

一般情况下不需要多复杂的正则,正则的基本规则如下(站长之家)

举个例子

(r'/sum/(\d+)', Sum),

该代码指匹配 /sum/  后跟至少一个数字且只有数字的情况

* 需要注意的是网络上传输都是字符串

类 Sum编写

class Sum(tornado.web.RequestHandler):
    # 数字类
    def get(self, sum):
        # 获取数字并返回
        self.write('%s,%s' % (type(sum), sum))

我们访问 http://localhost:8001/sum/12 时

返回正常

我们访问 http://localhost:8001/sum/1a2  http://localhost:8001/sum/a12  http://localhost:8001/sum/12a  http://localhost:8001/sum/a 时,均会报出404错误,证明没有匹配到路由

 

同理,当我们需要匹配两个参数时

(r'/(\w+)/stuggle/(\d+)', Stugggle),

接收时接收两个参数即可

def get(self, st, ins):
  pass

 post参数

与get一样,post请求会寻找到该视图的 post 方法

我们给视图 Hello 增加一个post

复制代码

class Hello(tornado.web.RequestHandler):
    # 封装一个类
    def get(self):
        # get请求进入该方法
        self.write('Hello')
    def post(self):
        # post请求
        txt = self.get_argument('txt')
        self.write(txt)

复制代码

self.get_argument('txt') 指获取post传参中 Key 为 txt 的值,路由无需改动

 get参数

get获取参数与上面的post没有差别

我们修改get方法来进行测试

    def get(self):
        # get请求进入该方法
        arg = self.get_argument('arg')
        arg1 = self.get_argument('arg1')
        self.write('%s+%s' % (arg,arg1))

 

 

但是需要注意的是, get_argument  在获取不到该key时会报错,抛出400错误

 

  get_argument  方法其实可以接收三个参数

get_argument(name,default=_ARG_DEFAULT,strip=True)

第一个参数就是key的值,第二个参数为如果接收不到默认的值,第三个是默认去除前后空格

一般情况下我们第二个参数传 None

复制代码

    def get(self):
        # get请求进入该方法
        arg = self.get_argument('arg', None)
        arg1 = self.get_argument('arg1', None)
        self.write('%s+%s' % (arg,arg1))
    def post(self):
        # post请求
        txt = self.get_argument('txt', None)
        self.write(txt)

复制代码

这样就增加了兼容性

 

本章我们来学习 Tornado 支持的请求方式

请求方式

Tornado支持任何合法的HTTP请求(GET、POST、PUT、DELETE、HEAD、OPTIONS)。你可以非常容易地定义上述任一种方法的行为,只需要在 RequestHandler 类中使用同名的方法。(也就是在视图中定义同名的方法)

关于请求方式对应的操作和返回码可以参考 http://www.runoob.com/w3cnote/restful-architecture.html 不过具体还是要与业务进行匹配。

状态码

使用RequestHandler类的set_status()方法显式地设置HTTP状态码。然而,你需要记住在某些情况下,Tornado会自动地设置HTTP状态码。

比如如果访问一个无法匹配的路由,则会返回404报错,而且状态码是404

但是我们在代码中没有指定返回的状态码,常用的有:

  404 Not Found

  Tornado会在HTTP请求的路径无法匹配任何RequestHandler类相对应的模式时返回404(Not Found)响应码。

  400 Bad Request

  如果你调用了一个没有默认值的get_argument函数,并且没有发现给定名称的参数,Tornado将自动返回一个400(Bad Request)响应码。

  405 Method Not Allowed

  如果传入的请求使用了RequestHandler中没有定义的HTTP方法(比如,一个POST请求,但是处理函数中只有定义了get方法),Tornado将返回一个405(Methos Not Allowed)响应码。

  500 Internal Server Error

  当程序遇到任何不能让其退出的错误时,Tornado将返回500(Internal Server Error)响应码。你代码中任何没有捕获的异常也会导致500响应码。

  200 OK

  如果响应成功,并且没有其他返回码被设置,Tornado将默认返回一个200(OK)响应码。

 我们也可以自定义错误返回,只需在class中定义一个名为 write_error 的方法

比如

def write_error(self, status_code, **kwargs):
        self.write('%s' % status_code)

该段代码会将 错误code以字符串的形式返回回去

需要注意的是该方法是写在类中,也就是说该方法只能作用于一个视图。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐