3. Python 简介

IamZS 100 0

在以下的示例中,输入和输出通过是否存在提示符(>>> 和 ...)来进行区分:为了复现示例,你必须照着例子在提示符后输入内容;不是以提示符开头的行便是解释器的输出结果。注意:例子中某一行单独出现的从提示符(secondary prompt)意味着你要回车输入空行;这用于结束一个多行命令。

本手册中的很多示例,甚至是交互模式下的示例,都带有注释。Python 中的注释以井号 # 开始,延伸到行末。注释可以从行首开始,也可以跟在空白(whitespace)或代码后,但不能包含在字符串内。字符串内的 # 只是一个 # 字符。因为注释只是为了对代码进行解释并且不会被 Python 解释器解释,所以参照示例练习时可以忽略它们。

比如:

# this is the first comment
spam = 1  # and this is the second comment
          # ... and now a third!
text = "# This is not a comment because it's inside quotes."

3.1. 将 Python 用于计算

让我们来尝试一些简单的 Python 命令。启动解释器然后等待主提示符,>>>。(这应该不需要花很长时间。)

3.1.1. 数字

解释器作用就像一个简易计算器:你可以在上面输入一个表达式,然后它会输出一个值。表达式语法非常简单:运算符 +-*/ 用起来和其他大多数语言一致(比如,Pascal 或者 C);括号(())可以用来分组。比如:

>>> 2 + 2
4
>>> 50 - 5*6
20
>>> (50 - 5*6) / 4
5.0
>>> 8 / 5  # division always returns a floating point number
1.6

整数(如:2,4,20)的类型为 int,那些带有小数部分的数(如:5.0,1.6)的类型为 float。我们将在后面的教程中了解更多关于数值类型的内容。

除法(/)的返回结果总是浮点(float)类型。要做“地板除”(floor division)并得到一个整数(只返回商的整数部分),你可以使用 // 运算符;要计算余数,可以使用 % 运算符。

>>> 17 / 3  # classic division returns a float
5.666666666666667
>>>
>>> 17 // 3  # floor division discards the fractional part
5
>>> 17 % 3  # the % operator returns the remainder of the division
2
>>> 5 * 3 + 2  # result * divisor + remainder
17

在 Python 中,你可以使用 ** 运算符进行幂运算[1]

>>> 5 ** 2  # 5 squared
25
>>> 2 ** 7  # 2 to the power of 7
128

等号(=)被用于给变量赋值。赋值之后,如果没有下一步交互的话,将不会输出任何结果:

>>> width = 20
>>> height = 5 * 9
>>> width * height
900

如果一个变量未被“定义”(即未被赋值),直接使用将会报错:

>>> n  # try to access an undefined variable
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'n' is not defined

Python 完全支持浮点数运算;整型和浮点型数混合运算时,整型数将转换成浮点型数:

>>> 4 * 3.75 - 1
14.0

在交互模式下,最后输出的表达式将被赋值给变量 _。这意味着,当你使用 Python 作为桌面计算器时,继续计算(continue calculations)将变得更加简单,比如:

>>> tax = 12.5 / 100
>>> price = 100.50
>>> price * tax
12.5625
>>> price + _
113.0625
>>> round(_, 2)
113.06

用户应该将该变量视为只读的。不要尝试直接赋值给它——否则你将创造一个独立的同名局部变量,而屏蔽了该内建变量。

除了整型浮点型,Python 还支持其他类型的数,比如小数分数。Python 还内置支持复数,并使用 jJ 后缀来指代虚部(比如:3 + 5j)。

3.1.2. 字符串

除了数字,Python 还可以处理字符串,这可以用多种方式表示。无论是用单引号('...')还是双引号("...")引起来,效果都是一样的[2]\ 可以用于转义':

>>> 'spam eggs'  # single quotes
'spam eggs'
>>> 'doesn\'t'  # use \' to escape the single quote...
"doesn't"
>>> "doesn't"  # ...or use double quotes instead
"doesn't"
>>> '"Yes," they said.'
'"Yes," they said.'
>>> "\"Yes,\" they said."
'"Yes," they said.'
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'

在交互式解释器中,输出的字符串被用引号引起来,特殊字符用反斜杠进行转义。虽然有时候看起来可能和输入的不一样(括号有可能会变),但是这两个字符串是相等的。如果字符串中只有单引号而没有双引号,那么就用双引号引用,否则则用单引号引用。print() 函数通过省略引号和打印出转义后的内容和特殊字符,使得输出的结果可读性更好。

>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'
>>> print('"Isn\'t," they said.')
"Isn't," they said.
>>> s = 'First line.\nSecond line.'  # \n means newline
>>> s  # without print(), \n is included in the output
'First line.\nSecond line.'
>>> print(s)  # with print(), \n produces a new line
First line.
Second line.

如果你不想让以 \ 开头的字符被解释器转义,可以在第一个引号前加上一个 r 来使用原始字符串(使其默认不转义):

>>> print('C:\some\name')  # here \n means newline!
C:\some
ame
>>> print(r'C:\some\name')  # note the r before the quote
C:\some\name

字符串可以跨多行。一种方法是使用三引号(triple-quotes):"""...""" 或者 '''...'''。行尾会自动被包括在字符串中,但是可以通过在行末尾添加一个反斜杠 \ 来阻止这种情况。示例如下:

print("""\
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to
""")

输出内容如下(注意:不包括最开始的一行):

Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to

字符串可以用 + 运算符连接在一起(粘合起来),也可以用 * 来进行多次重复操作:

>>> # 3 times 'un', followed by 'ium'
>>> 3 * 'un' + 'ium'
'unununium'

相邻的两个或多个字符串字面量(引号引起来的)会自动连接在一起。

>>> 'Py' 'thon'
'Python'

当你想要将分割长字符串时,这一特性尤其有用:

>>> text = ('Put several strings within parentheses '
...         'to have them joined together.')
>>> text
'Put several strings within parentheses to have them joined together.'

这只适用于两个字面值,不适用于变量和表达式:

>>> prefix = 'Py'
>>> prefix 'thon'  # can't concatenate a variable and a string literal
  ...
SyntaxError: invalid syntax
>>> ('un' * 3) 'ium'
  ...
SyntaxError: invalid syntax

如果你想连接多个变量或是一个变量和一个字面值,可以使用 +

>>> prefix + 'thon'
'Python'

字符串可以被索引(用下标表示),第一个字符的索引为 0。Python 没有单独的字符类型;一个字符就是一个长度为 1 的字符串。

>>> word = 'Python'
>>> word[0]  # character in position 0
'P'
>>> word[5]  # character in position 5
'n'

Python 中的索引也可以是负数,此时从字符串的最右边开始数:

>>> word[-1]  # last character
'n'
>>> word[-2]  # second-last character
'o'
>>> word[-6]
'P'

注意:因为 -0 和 0 是一样的,所以负数索引从 -1 开始。

除了索引,还支持切片。索引用于获得单个字符,切片则让你获得子字符串:

>>> word[0:2]  # characters from position 0 (included) to 2 (excluded)
'Py'
>>> word[2:5]  # characters from position 2 (included) to 5 (excluded)
'tho'

注意:切片包括起始索引位置但不包括结束索引位置(即“左闭右开”)。这使得 s[:i] + s[i:] 永远等于 s

>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'

切片的索引具有非常有用的默认值;第一个索引缺省则默认为 0,第二个索引缺省则截取从第一个索引到字符串末尾。

>>> word[:2]   # character from the beginning to position 2 (excluded)
'Py'
>>> word[4:]   # characters from position 4 (included) to the end
'on'
>>> word[-2:]  # characters from the second-last (included) to the end
'on'

记住切片如何工作的一种方法是把索引当作字符之间的点,第一个字符的左边为 0。那么,含有 n 个字符的字符串最后一个字符的右边是索引 n,比如:

 +---+---+---+---+---+---+
 | P | y | t | h | o | n |
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6
-6  -5  -4  -3  -2  -1

第一行数字给出了字符串中索引 0 ... 6 的位置;第二行数字给出了相应的负数形式的索引。从 i 到 j 的切片包含了标注 i 和 j 之间的所有字符。

对于非负数索引,如果两个索引都在范围内,那么切片长度就是两个索引之差。比如,切片 word[1:3] 的长度为 2。

试图使用一个过大的索引会导致错误:

>>> word[42]  # the word only has 6 characters
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: string index out of range

但是,当切片索引超出范围时,并不会报错:

>>> word[4:42]
'on'
>>> word[42:]
''

Python 的字符串不能被更改——他们是不可变的。因此,赋值给字符串的某一索引位置时会报错:

>>> word[0] = 'J'
  ...
TypeError: 'str' object does not support item assignment
>>> word[2:] = 'py'
  ...
TypeError: 'str' object does not support item assignment

如果你需要新的字符串,你应该创建一个新的:

>>> 'J' + word[1:]
'Jython'
>>> word[:2] + 'py'
'Pypy'

内建函数 len() 的功能是返回字符串的长度:

>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34

参阅:

文本序列类型 —— str

字符串也是序列类型,并且支持该类型的常见操作。

字符串方法

字符串支持大量的用于基本转换和搜索的方法。

格式化了的字符串

那些已经嵌入了表达式的字符串。

字符串格式化语法

通过 str.format() 格式化字符串。

printf-style 字符串格式化

使用 % 进行字符串格式化的旧式操作方法。

3.1.3. 列表

Python 支持许多复合数据类型,用来将其他值组合在一起。最强大的要属列表了,它可以写成方括号中一列用逗号分隔的值(元素)。列表中的元素可以是不同类型的,但通常情况下都是同一种类型。

>>> squares = [1, 4, 9, 16, 25]
>>> squares
[1, 4, 9, 16, 25]

与字符串(和其他所有内建序列类型)类似,列表也支持索引和切片:

>>> squares[0]  # indexing returns the item
1
>>> squares[-1]
25
>>> squares[-3:]  # slicing returns a new list
[9, 16, 25]

所有的切片操作会返回一个包含所请求元素的新列表。这意味着下面这个切片将返回该列表的一个浅拷贝(不影响原列表):

>>> squares[:]
[1, 4, 9, 16, 25]

列表还支持像连接这种操作:

>>> squares + [36, 49, 64, 81, 100]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

和字符串的不可变特性不同,列表是一种可变类型,比如可以更改列表内容:

>>> cubes = [1, 8, 27, 65, 125]  # something's wrong here
>>> 4 ** 3  # the cube of 4 is 64, not 65!
64
>>> cubes[3] = 64  # replace the wrong value
>>> cubes
[1, 8, 27, 64, 125]

还可以通过 append() 方法在列表末尾添加新的元素(我们稍后将了解更多的相关方法):

>>> cubes.append(216)  # add the cube of 6
>>> cubes.append(7 ** 3)  # and the cube of 7
>>> cubes
[1, 8, 27, 64, 125, 216, 343]

赋值给切片也是可以的,这一操作会改变列表长度甚至完全清除列表:

>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> letters
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> # replace some values
>>> letters[2:5] = ['C', 'D', 'E']
>>> letters
['a', 'b', 'C', 'D', 'E', 'f', 'g']
>>> # now remove them
>>> letters[2:5] = []
>>> letters
['a', 'b', 'f', 'g']
>>> # clear the list by replacing all the elements with an empty list
>>> letters[:] = []
>>> letters
[]

内建函数 len() 也可以应用于列表:

>>> letters = ['a', 'b', 'c', 'd']
>>> len(letters)
4

列表还可以进行嵌套(创建包含其他列表的列表),比如:

>>> a = ['a', 'b', 'c']
>>> n = [1, 2, 3]
>>> x = [a, n]
>>> x
[['a', 'b', 'c'], [1, 2, 3]]
>>> x[0]
['a', 'b', 'c']
>>> x[0][1]
'b'

3.2. 编程第一步

当然,我们可以用 Python 来完成更加复杂的任务而不仅仅是 2 + 2 这么简单。比如,我们可以这样写出斐波那契数列的初始子序列:

>>> # Fibonacci series:
... # the sum of two elements defines the next
... a, b = 0, 1
>>> while a < 10:
...     print(a)
...     a, b = b, a+b
...
0
1
1
2
3
5
8

本示例介绍了一些新特性。

  • 第一行为多重赋值:变量 a 和 b 被同时分别赋值 0 和 1。最后一行也是多重赋值,先对等号右边的表达式进行计算后再分别赋值给左边。
  • while 循环在条件为真时会一直执行(这里的条件为:b < 10)。在 Python 中,像 C 语言一样,任何非零整数值为 True;零为 False。条件也可能是一个字符串或列表值,事实上可以是任何序列;任何长度非零的序列为 True,空序列是 False。示例中的条件是一个简单的比较。标准的比较运算符的写法和 C 语言中的一样:<(小于),>(大于),==(等于),<=(小于等于),>=(大于等于)和 !=(不等于)。
  • 循环体是缩进的:缩进是 Python 对语句进行分组的方式。在交互式输入时,必须为每一个缩进行输入一个 tab 或多个空格(最好四个)。在实践中将使用文本编辑器来编写复杂的 Python 程序;所有较优秀的编辑器都有自动缩进功能。在交互输入复合语句时,必须以空行来表示输入完成(因为解析器不知道你什么时候已经输入最后一行)。注意:同一个语句块内的每一行的缩进量必须相同。
  • print() 函数打印出传入参数的值。这与仅仅输出你想输出的表达式(就像之前计算器的例子)不同,它可以处理多个参数、浮点数和字符串。打印出来的字符串没有引号,元素之间也会插入一个空格,因而可以设置漂亮的格式,就像这样:
    >>> i = 256*256
    >>> print('The value of i is', i)
    The value of i is 65536
  • 关键字参数(keyword argument)end 可以用来避免输出后的空行,或者可以以一个不同的字符串作为输出的结尾:
    >>> a, b = 0, 1
    >>> while a < 1000:
    ...     print(a, end=',')
    ...     a, b = b, a+b
    ...
    0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,

脚注:

[1] 因为 ** 的优先级高于 --3**2 将被解析成 -(3**2) 因此结果为 -9。要避免这种情况以期得到 9 的话,可以使用 (-3)**2

[2] 和其他语言不同,诸如 \n 这样的特殊字符,在单引号('...')和双引号("...")中的含义是一样的。唯一的区别就是,在单引号中你不需要转义双引号 "(但你必须要转义单引号 \'),反之亦然。

发表评论
表情 图片 链接 代码