sorted 用于对集合进行排序(这里说的集合是对可迭代对象的一个统称,他们可以是列表、字典、set、甚至是字符串),它的功能非常强大,本文将深入浅出地介绍 sorted 的各种使用场景。
默认排序
默认情况,sorted 函数将按列表升序进行排序,并返回一个新列表对象,原列表保持不变,最简单的排序
1 | 3,4,5,2,1] nums = [ |
降序排序
降序排序,如果要按照降序排列,只需指定参数 reverse=True 即可
1 | sorted(nums, reverse=True) |
自定义规则排序
如果要按照某个特定的规则排序,则需指定参数 key, key 是一个函数(或其它可调用对象),例如:一个字符串构成的列表,我想按照字符串的长度来排序
1 | 'Andrew', 'This', 'a', 'from', 'is', 'string', 'test'] chars = [ |
len 是内建函数,sorted 函数在排序的时候会用len去获取每个字符串的长度来排序。 有些人可能使用匿名函数 key=lambda x: len(x) ,其实是多此一举。
1 | 'Andrew', 'This', 'a', 'from', 'is', 'string', 'test'] chars = [ |
复合排序
如果是一个复合列表结构,例如:由元组构成的列表,要按照元组中的第二个元素排序,那么可以用 lambda 定义一个匿名函数,这里就是按照第二个元素的字母升序来排列的
1 | 'zhang', 'A'), ('li', 'D'), ('wang', 'C')] students = [( |
这里将按照字母 A-C-D 的顺序排列。
类的实例对象排序
如果要排序的元素是自定义类,例如Student类按照年龄来排序,则可以写成
1 | class Student: |
多个值排序
和数据库的排序一样,sorted 也可以根据多个字段来排序,例如我有先要根据age排序,如果age相同的则根据grade排序,则可以使用元组:
1 | sorted(student_objects, key=lambda t:(t.age, t.grade)) |
不可直接比较的值排序
前面碰到的排序场景都是建立在两个元素是可以互相比较的前提下,例如数值按大小比较, 字母按ASCII顺序比较,如果遇到本身是不可比较的,需要我们自己来定义比较规则的情况如何处理呢?
举个简单的例子:
1 | 2, 1.5, 2.5, '2', '2.5'] nums = [ |
一个整数列表中,可能有数字,字符串,在Python3中,字符串与数值是不能比较的,而Python2中任何类型都可以比较,这是两个版本中一个很大的区别:
1 | # python2.7 |
我们需要使用 functools 模块中的 cmp_to_key 来指定比较函数是什么。
1 | import functools |
定义com_to_key
关于 sorted 函数,Python2和Python3之间的区别是Python2中的sorted 可以指定cmp关键字参数,就是当遇到需要自定义比较操作的数据可以通过 cmp=compare 来实现,不需要像Python3中还需要导入functools.cmp_to_key实现。
1 | nums = [2, 1.5, 2.5, '2', '2.5'] |
其实,在Python2中,上面这种情况你不指定cmp,默认也会按照这种方式排序,记住,Python2中,任何东西(不同类型之间)都可以比较,而Python3只有同类型数据可以比较。
优化排序
对于集合构成的列表,有一种更高效的方法指定这个key
1 | from operator import itemgetter |
高级排序
同样的,对于自定义类,也有一种更高效的方法指定key
1 | from operator import attrgetter |
如果参与排序的字段有两个怎么办,你可以这样:
1 | sorted(student_objects, key=attrgetter('grade', 'age')) |
以上是关于 sorted 函数的全部。