Swift51.com
麦子学院 头像
麦子学院  2017-02-25 10:35

Flask学习之日志详解

回复:0  查看:2849  
我们在开发基于Flask Web 应用时,往往容易忽略了对日志的使用,而在 Flask 的官方文档中,对日志这块的介绍也仅仅停留在如何与系统集成上。记录日志这个看似很简单的事情,在实际中很多人却不一定能做好,要么不知道何时进行日志记录,要么就是记录的日志然并卵。所以,今天就来说说记录日志这件小事,希望对大家 学习flask有所帮助。
  说它是件小事,因为它的确不会影响你系统的正常流程,有没有它系统都能跑起来,也正因为这样,很多人便忽略了日志的处理,或者干脆都没有配置日志输出,整个系统没有任何日志输出(Nginx 日志不算)。当然,如果是我们自己开发的一些小网站,大家用来练练手或着用户量不大,有没有日志都一样,但是对于一些大型的系统,它的用户是很多的,在任何一个环节都可能出问题,为了能够及时的定位问题和监控系统运行状态,正确合理的记录日志就非常非常重要了。一般情况下,我们需要关注的是三个方面的内容:
  ·  日志信息的集中采集、存储和检索:这个主要是在多节点的情况下如何方便的查看日志信息。
  ·  日志信息的输出策略:要保证日志输出的全面而又不显凌乱,方便开发人员跟踪和分析问题。
  ·  关键业务的日志输出:我们常说的  打点  就属于这个范畴,比如我们的一些浏览记录等,这个就需要根据业务要求来做针对性设计了。
  我们在这里主要是围绕第二个问题来展开,也是我们开发人员最直接接触的情况。
   日志输出级别
  从Flask 0.3  版本开始,系统就已经帮我们预配置了一个 logger ,而这个 logger 的使用也是非常简单:
  app.logger.debug('A value for debugging')app.logger.warning('A warning occurred (%d apples)', 42)app.logger.error('An error occurred')
  其中的app 就是 Flask 的实例,而这个 app.logger 也就是一个标准的 logging Logger ,因此,我们在使用 app.logger 时可选择的输出级别与 python logging 中的定义是一致的。
  · ERROR  :这个级别的日志意味着系统中发生了非常严重的问题,必须有人马上处理,比如数据库不可用了,系统的关键业务流程走不下去了等等。很多人在实际开发的时候,不会去区分问题的重要程度,只要有问题就error 记录下来,其实这样是非常不负责任的,因为对于成熟的系统,都会有一套完整的报错机制,那这个错误信息什么时候需要发出来,很多都是依据单位时间内 error 日志的数量来确定的。因此如果我们不分轻重缓急,一律 error 对待,就会徒增报错的频率,久而久之,我们的救火队员对错误警报就不会那么在意,这个警报也就失去了原始的意义。
  · WARN  :发生这个级别的问题时,处理过程可以继续,但必须要对这个问题给予额外的关注。假设我们现在有一个系统,希望用户每一个月更换一次密码,而到期后,如果用户没有更新密码我们还要让用户可以继续登录,这种情况下,我们在记录日志时就需要使用WARN 级别了,也就是允许这种情况存在,但必须及时做跟踪检查。
  · INFO  :这个级别的日志我们用的也是比较多,它一般的使用场景是重要的业务处理已经结束,我们通过这些INFO 级别的日志信息,可以很快的了解应用正在做什么。我们以在 12306 上买火车票为例,对每一张票对应一个 INFO 信息描述 “[who] booked ticket from [where] to [where]”
  · DEBUG   TRACE  :我们把这两个级别放在一起说,是应为这两个级别的日志是只限于开发人员使用的,用来在开发过程中进行调试,但是其实我们有时候很难将DEBUG TRACE 区分开来,一般情况下,我们使用 DEBUG 足以。
  以上就是我们实际开发中最多接触的几种日志级别,基本能覆盖99% 的情况。最后我们要注意的就是,最好能尽可能输出更多的日志信息,并且不做任何过滤,同时输出的每一条日志的详细信息要切当,让我们可以快速过滤并找到所需的信息。
   日志输出信息
  当我们确定了使用哪个级别来写入日志后,下一步要做的就是确定要记录什么样的信息。针对这一块的内容,其实又可以细分。
   日志应该记录什么
  一般来说,日志的记录要满足几个要求:可读、干净、详细和自描述。我们先来看几个反模式的例子:
  app.logger.debug('message processed')
  app.logger.debug(message.get_message_id())
  app.logger.debug('message with id %s', message.get_message_id())
  if isinstance(message, TextMessage):
  ...else:
  app.logger.warn('unknow message type')
  上面列出的这几个例子,问题在什么地方呢?当看到这些日志信息后,我们首先意识到的肯定是哪里出了问题,但是,这个问题产生的原因是什么我们并不清楚,也就是说,只根据这样的日志我们是没办法对问题进行修复的。所以我们在记录日志的时候,应该要尽量的详细,日志的上下文要交代清楚。
  另外一种反模式的日志信息,我们通常叫做魔法日志。就比如说,有的开发人员为了自己查找信息方便,会输出一些类似&&&###>>>>>>  的日志,这些特殊的符号只有开发者本人清楚到底是做什么的,而对其他人来说,看到这些日志绝对是一脸懵逼。即使是开发者本人,哪怕当时能够清楚这些魔法日志的特殊含义,但时间一长,估计他们也很难回想起当时为啥要输出这些鬼东西了吧。
  其次,还有一种是要关注外部系统,也就是在和任何外部系统通信的时候,建议记录所有进出系统的数据。但是,记录这些信息时,性能是一个比较头痛的问题,有时,需要和外部系统交换的信息量太大,导致无法记录所有信息。但是,在调试或测试期间我们还是愿意记录所有信息,并准备为此付出一些性能的代价,这个可以通过仔细控制log 级别来实现,比如:
  if app.config['debug']:
  app.logger.debug('...')else:
  app.logger.info('...')
  最后要提的一点就是,我们输出的这些日志信息中,绝对不可以透露系统密码和一些个人信息。
   如何打印日志内容
  当我们明确了该用哪个级别去记录哪些信息后,就要把这些信息输出到日志文件中,但是想正确高效的打印日志内容也并非一件简单的事。Flask 已经帮我们预配置了一个 logger ,我们可以使用这个 logger 来完成我们所有的打印操作。
  我们在记录日志的时候绝对不可以使用 print  ,即使我们在开发调试的时候能够在控制台看到打印的信息,但是这样的信息并不会记录到日志文件中,当我们的程序上线后,跟没有记录日志的效果是一样的。因此,哪怕是在开发调试时,也要尽量使用logger
  最简单的日志打印就是输出一个字符串,比如像下面这样
  app.logger.info('this is a string')
  但大部分时候,我们要记录的信息都会包含一些参数,有一种实现方式是提前构造出这个字符串
  message_info = 'the message is %s' % info
  app.logger.info(message_info)
  这种写法也没啥问题,但其实,logger 内部也可以帮助我们完成上面的操作,也就是我们还可以写成下面这样
  app.logger.info('the message if %s', info)
  这样看起来是不是简洁了好多呢?
   记录异常信息
  记录异常信息严格来说也应该算到日志输出的范畴,之所以把它拿出来单独说,是因为除了说明应该怎样去记录异常外,这里还要说下如何去自定义异常。
   正确的记录异常信息
  对于异常,我们更想看到的其实是它的堆栈信息,而不是简单的一句话,堆栈信息可以帮助我们快速的定位问题出处。如果想打印堆栈,我们前面的记录方法就不再实用了,哪怕我们把 Exception  的实例丢到logger 里打印出来的也仅仅是错误信息而不是堆栈信息。比如下面的例子
  a = [1, 2, 3]try:
  print a[3]except Exception, e:
  logging.error(e)
  如果我们查看日志,发现打印出的仅仅是一行错误信息:
  Tue, 24 Jan 2017 16:07:20 demo.py[line:22] ERROR list index out of range
  那如何打印出堆栈信息呢?python 给我们提供了一个 exception  方法,它的使用跟 debug  info   warn   error  几个方法是一样的,我们可以把上面的代码修改一下
  a = [1, 2, 3]try:
  print a[3]
  except Exception, e:
  logging.exception(e)
  之后我们再看日志输出
  Tue, 24 Jan 2017 17:19:37 demo.py[line:22] ERROR list index out of range
  Traceback (most recent call last):
  File "/Users/xiaoz/developments/python/ttest/demo.py", line 20, in test
  print a[3]
  IndexError: list index out of range
  除了我们上面使用 error  方法打印的错误信息外,还打印出了出错的堆栈信息,由此看见, exception  方法打印的日志会包含两项,第一项就是调用exception  方法时传入的message ,还有一项是紧跟在 message 后面的堆栈信息。
  当我们使用 exception  方法时,它记录的日志级别为 ERROR  ,如果我们希望打印出堆栈信息,同时又不希望使用 ERROR  这个级别怎么办呢?如果你查看exception  方法的实现,会发现,它只是多加了一行代码 kwargs['exc_info'] = 1  ,然后调用了 error 方法,以此类推,如果我们希望打印堆栈信息就可以像下面这样写: app.logger.info('message info is %s', message, exc_info=1) 
  Flask 允许我们自定义对异常的处理,一般情况下,我们会做一些统一处理,比如下面这样
  @app.errorhandler(500)def internal_server_error(e):
  app.logger.exception('error 500: %s', e)
  response = json_error('internal server error')
  response.status_code = 500
  return response
  我们在返回结果的同时,对错误信息进行了记录,这样做也是为了避免模板代码,减少开发人员的工作量。但是,在减少我们开发量的同时,这也意味着可能会带来另外一个问题,很多程序员喜欢捕获异常后将错误写入日志,然后再将异常包装后重新抛出,这样会重复打印日志信息:
  ... some thing ...
  try:
  ... do some thing ...except Exception, e:
  app.logger.error(e)
  raise SomeException(e)
  还有一种情况,如果我们在捕获异常的时候,不分情况统一捕获 Exception  也是不对的。直接捕获 Exception  固然方便,但是我们捕获的范围太大的话,有的时候会吃掉关键的信息,而这些被吃掉的异常又没有打印错误信息和堆栈,一旦有问题,是很难排查的,比如我们定义了下面的方法
  def some_method():
  .. do some thing ..
  try:
  .. do dome thing 2 ..
  return True
  except Exception, e:
  return False
  当 do some thing 2  中发生异常时,我们是没法察觉到的,这样不但会使方法返回不正确,也会给排查带来困难。
   自定义异常
  首先,我们看看为什么要自定义异常,在需要抛出异常的地方,我们直接 raise Exception() 不好吗?答案很显然,肯定是不好,具体的原因,我们下面就逐条分析下。
  1.  大多时候我们都是使用 json 来为不同端提供接口支持,不管成功与否,都必须使用统一的数据格式。如果系统充斥着各种异常就很难做到统一。
  2.  要能反映出该异常的重要程度,比如:如果是参数校验异常则被认为不是很重要,可能直接记下 warn 日志就行了,而 orm 异常必须要记录 error 日志。
  3.  最后,对于异常的信息要有区分,比如,对于 orm 异常,我们希望给用户看到的是一条简单的系统出错的提示信息,而我们在查看日志时必须要有详细的异常信息。
  为了解决上面的问题,需要我们来自定义异常,并且使用的时候也尽量要使用已定义的异常类。这里我们来看一种实现方式,大家可以参考
  class BaseError(Exception):
  default_status_code = 200
  LEVEL_DEBUG = 0
  LEVEL_INFO = 1
  LEVEL_WARN = 2
  LEVEL_ERROR = 3
  def __init__(self, message, status_code=None, extras=None, parent_error=None):
  self._message = message
  self._code = status_code
  self.extras = extras
  self.parent_error = parent_error
  self.level = BaseError.LEVEL_DEBUG
  @property
  def status_code(self):
  if not self._code:
  return BaseError.default_status_code
  return self._code
  def to_dict(self):
  rv = {
  'error_message': self._message,
  'status_code': self.status_code,
  'success': False
  }
  return rv
  class ValidationError(BaseError):
  def __init__(self, message, extras=None):
  super(ValidationError, self).__init__(message=message, extras=extras)
  self.level = BaseError.LEVEL_INFO
  class NotFoundError(BaseError):
  def __init__(self, message, extras=None):
  super(NotFoundError, self).__init__(message=message, extras=extras)
  self.level = BaseError.LEVEL_WARN
  class FormError(BaseError):
  def __init__(self, form):
  message = form.get_validate_error()
  super(FormError, self).__init__(message, extras=form.data)
  self.level = BaseError.LEVEL_INFO
  class OrmError(BaseError):
  def __init__(self, message, status_code=None, extras=None, parent_error=None):
  super(OrmError, self).__init__(message, status_code, extras, parent_error)
  self.level = BaseError.LEVEL_ERROR
  定义了上面的异常信息后,我们在统一处理错误信息的时候就可以像下面这样实现:
  @app.errorhandler(BaseError)def custom_error_handler(e):
  if e.level in [BaseError.LEVEL_WARN, BaseError.LEVEL_ERROR]:
  if isinstance(e, OrmError):
  app.logger.exception('%s %s' % (e.parent_error, e))
  else:
  app.logger.exception(' 错误信息 : %s %s' % (e.extras, e))
  response = jsonify(e.to_dict())
  response.status_code = e.status_code
  return response
  如此,就兼顾了日志的错误级别和接口返回的数据格式。
   我们还应该注意什么
  其实,对于日志的记录,我们前面七七八八也讲了个差不多,在开发的时候如果我们能够注意到上面提到的一些问题,已经能够算是比较合格的打日志了。当然,还有一些小的问题,在最后还是要说明一下。
  第一个,就是需要我们关键一下性能问题,也就是避免因为日志拖慢应用系统。如果输出的日志信息太多,必然会增加磁盘的写入负担,通常情况下,每小时输出到磁盘的数据量达到几百M 就已经是上限了。
  第二个,就是不要由于log 语句导致业务过程中断。我们的本意是通过日志来记录系统的一些运行信息,但是, log 语句本身也是有可能发生异常的,如果因为我们的代码,导致日志记录的时候抛出了异常,就真的是得不偿失了。
  OK ,关于在 Flask 系统中如何进行日志记录,就介绍到这了,其实,上面提到的内容不仅在 Flask 系统中可行,基本上所有的 Web 系统都有参考价值。

来源: 简书