python编码声明:是coding:utf-8还是coding=urf-8呢?

时间:2023-01-05 09:46:46

python编码声明:是coding:utf-8还是coding=urf-8呢?

我们知道在Python源码的头文件中要声明编码方式,如果你不只是会用到ascii码,很多人都写得都有点差别:

#coding=utf-8

#coding:utf-8

#-*- coding:utf-8 -*-

那么怎样写才是有效地呢,哪些优势无效的呢?

可以查看下http://www.python.org/dev/peps/pep-0263/的解释

这个PEP的目的是介绍在一个Python源文件中如何声明编码的语法。随后Python解释器会在解释文件的时候用到这些编码信息。最显著的是源文件中对Unicode的解释,使得在一个能识别Unicode的编辑器中使用如FUT-8编码成为可能。

0x01 如何声明?

如果在Python中我们并没有声明别的编码方式,就是以ASCII编码作为标准编码方式的
为了定义源文件的编码方式,一个魔法是的声明应当被放在这个文件的第一行或者是第二行例如:

#coding=<encoding name>

或者(使用流行编辑器中的格式化方式)

#!/usr/bin/python
# -*- coding: <encoding name> -*-

或者

#!/usr/bin/python
# vim: set fileencoding=<encoding name> :

不管怎么样,这些在第一行或者第二行的声明都要符合正则表达式

 "coding[:=]\s*([-\w.]+)"

所以我们就可以知道为什么使用冒号或者等号都可以了,如果声明的编码python不能识别就会报错

0x02 英文解释如下

Examples
These are some examples to clarify the different styles for
defining the source code encoding at the top of a Python source
file:

1. With interpreter binary and using Emacs style file encoding
comment:

#!/usr/bin/python
# -*- coding: latin-1 -*-
import os, sys
...

#!/usr/bin/python
# -*- coding: iso-8859-15 -*-
import os, sys
...

#!/usr/bin/python
# -*- coding: ascii -*-
import os, sys
...

2. Without interpreter line, using plain text:

# This Python file uses the following encoding: utf-8
import os, sys
...

3. Text editors might have different ways of defining the file's
encoding, e.g.

#!/usr/local/bin/python
# coding: latin-1
import os, sys
...

4. Without encoding comment, Python's parser will assume ASCII
text:

#!/usr/local/bin/python
import os, sys
...

5. Encoding comments which don't work:

Missing "coding:" prefix:

#!/usr/local/bin/python
# latin-1
import os, sys
...

Encoding comment not on line 1 or 2:

#!/usr/local/bin/python
#
# -*- coding: latin-1 -*-
import os, sys
...

Unsupported encoding:

#!/usr/local/bin/python
# -*- coding: utf-42 -*-
import os, sys
...

以上几个例子充分说明了哪些是正确的写法,哪些是正确的写法