NumPy 排序、条件筛选函数

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

numpy.lexsort()

numpy.lexsort() 用于对多个序列进行排序。把它想象成对电子表格进行排序，每一列代表一个序列，排序时优先照顾靠后的列。

这里举一个应用场景：小升初考试，重点班录取学生按照总成绩录取。在总成绩相同时，数学成绩高的优先录取，在总成绩和数学成绩都相同时，按照英语成绩录取…… 这里，总成绩排在电子表格的最后一列，数学成绩在倒数第二列，英语成绩在倒数第三列。 nm = ( ' raju ' , ' anil ' , ' ravi ' , ' amar ' ) dv = ( ' f.y. ' , ' s.y. ' , ' s.y. ' , ' f.y. ' ) ind = np . lexsort ( ( dv , nm ) ) print ( ' 调用 lexsort() 函数： ' ) print ( ind ) print ( ' \n ' ) print ( ' 使用这个索引来获取排序后的数据： ' ) print ( [ nm [ i ] + " , " + dv [ i ] for i in ind ] )

输出结果为：

调用 lexsort() 函数：
[3 1 0 2]
使用这个索引来获取排序后的数据：
['amar, f.y.', 'anil, s.y.', 'raju, f.y.', 'ravi, s.y.']

上面传入 np.lexsort 的是一个tuple，排序时首先排 nm，顺序为：amar、anil、raju、ravi 。综上排序结果为 [3 1 0 2]。

msort、sort_complex、partition、argpartition

函数	描述
msort(a)	数组按第一个轴排序，返回排序后的数组副本。np.msort(a) 相等于 np.sort(a, axis=0)。
sort_complex(a)	对复数按照先实部后虚部的顺序进行排序。
partition(a, kth[, axis, kind, order])	指定一个数，对数组进行分区
argpartition(a, kth[, axis, kind, order])	可以通过关键字 kind 指定算法沿着指定轴对数组进行分区

复数排序：

>>> import numpy as np
>>> np.sort_complex([5, 3, 6, 2, 1])
array([ 1.+0.j,  2.+0.j,  3.+0.j,  5.+0.j,  6.+0.j])
>>> np.sort_complex([1 + 2j, 2 - 1j, 3 - 2j, 3 - 3j, 3 + 5j])
array([ 1.+2.j,  2.-1.j,  3.-3.j,  3.-2.j,  3.+5.j])

partition() 分区排序：

>>> a = np.array([3, 4, 2, 1])
>>> np.partition(a, 3)  # 将数组 a 中所有元素（包括重复元素）从小到大排列，3 表示的是排序数组索引为 3 的数字，比该数字小的排在该数字前面，比该数字大的排在该数字的后面
array([2, 1, 3, 4])
>>> np.partition(a, (1, 3)) # 小于 1 的在前面，大于 3 的在后面，1和3之间的在中间
array([1, 2, 3, 4])

找到数组的第 3 小（index=2）的值和第 2 大（index=-2）的值

>>> arr = np.array([46, 57, 23, 39, 1, 10, 0, 120])
>>> arr[np.argpartition(arr, 2)[2]]
>>> arr[np.argpartition(arr, -2)[-2]]
同时找到第 3 和第 4 小的值。注意这里，用 [2,3] 同时将第 3 和第 4 小的排序好，然后可以分别通过下标 [2] 和 [3] 取得。
>>> arr[np.argpartition(arr, [2,3])[2]]
>>> arr[np.argpartition(arr, [2,3])[3]]
numpy.argmax() 和 numpy.argmin()
numpy.argmax() 和 numpy.argmin()函数分别沿给定轴返回最大和最小元素的索引。
import numpy as np 
a = np.array([[30,40,70],[80,20,10],[50,90,60]])  
print  ('我们的数组是：') 
print (a) 
print ('\n') 
print ('调用 argmax() 函数：') 
print (np.argmax(a)) 
print ('\n') 
print ('展开数组：') 
print (a.flatten()) 
print ('\n') 
print ('沿轴 0 的最大值索引：') 
maxindex = np.argmax(a, axis =  0)  
print (maxindex) 
print ('\n') 
print ('沿轴 1 的最大值索引：') 
maxindex = np.argmax(a, axis =  1)  
print (maxindex) 
print ('\n') 
print ('调用 argmin() 函数：') 
minindex = np.argmin(a)  
print (minindex) 
print ('\n') 
print ('展开数组中的最小值：') 
print (a.flatten()[minindex]) 
print ('\n') 
print ('沿轴 0 的最小值索引：') 
minindex = np.argmin(a, axis =  0)  
print (minindex) 
print ('\n') 
print ('沿轴 1 的最小值索引：') 
minindex = np.argmin(a, axis =  1)  
print (minindex)
输出结果为：
我们的数组是：
[[30 40 70]
 [80 20 10]
 [50 90 60]]
调用 argmax() 函数：
展开数组：
[30 40 70 80 20 10 50 90 60]
沿轴 0 的最大值索引：
[1 2 0]
沿轴 1 的最大值索引：
[2 0 1]
调用 argmin() 函数：
展开数组中的最小值：
沿轴 0 的最小值索引：
[0 1 1]
沿轴 1 的最小值索引：
[0 2 0]
numpy.nonzero()
numpy.nonzero() 函数返回输入数组中非零元素的索引。
import numpy as np 
a = np.array([[30,40,0],[0,20,10],[50,0,60]])  
print ('我们的数组是：')
print (a)
print ('\n')
print ('调用 nonzero() 函数：')
print (np.nonzero (a))
输出结果为：
我们的数组是：
[[30 40  0]
 [ 0 20 10]
 [50  0 60]]
调用 nonzero() 函数：
(array([0, 0, 1, 1, 2, 2]), array([0, 1, 1, 2, 0, 2]))
numpy.where()
numpy.where() 函数返回输入数组中满足给定条件的元素的索引。
import numpy as np 
x = np.arange(9.).reshape(3,  3)  
print ('我们的数组是：')
print (x)
print ( '大于 3 的元素的索引：')
y = np.where(x >  3)  
print (y)
print ('使用这些索引来获取满足条件的元素：')
print (x[y])
输出结果为：
我们的数组是：
[[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
大于 3 的元素的索引：
(array([1, 1, 2, 2, 2]), array([1, 2, 0, 1, 2]))
使用这些索引来获取满足条件的元素：
[4. 5. 6. 7. 8.]
numpy.extract()
numpy.extract() 函数根据某个条件从数组中抽取元素，返回满条件的元素。
import numpy as np 
x = np.arange(9.).reshape(3,  3)  
print ('我们的数组是：')
print




    
 (x)
# 定义条件, 选择偶数元素
condition = np.mod(x,2)  ==  0  
print ('按元素的条件值：')
print (condition)
print ('使用条件提取元素：')
print (np.extract(condition, x))
输出结果为：
我们的数组是：
[[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
按元素的条件值：
[[ True False  True]
 [False  True False]
 [ True False  True]]
使用条件提取元素：
[0. 2. 4. 6. 8.]
			
70 60 10
90 40 50
sunk   sunk
  sun***vesme@163.com4年前 (2019-10-12)

#0   foubaby
  fou***y1216@cug.edu.cn
   参考地址
 9
关于axis的理解这里有点混乱
引用知乎的解答 
在numpy.amin()函数中，axis=0，就代表沿着行坐标变化的方向进行计算，也就是对每一列进行amin操作，得到的结果数组的shape是（1，m），axis=0，就消除了行这一层次
foubaby   foubaby
  fou***y1216@cug.edu.cn
   参考地址
3年前 (2020-04-19)

#0   数学小白
  964***694@qq.com
 8
关于 axis 的理解

axis 是代表轴方向，在这里我们不要单纯的记为行和列，记住他代表的轴方向更容易理解：
axis=0 代表纵轴方向，从上而下计算。

axis=1 代表横轴方向，从左到右计算。

如果是二维数据（就是线性代数中的普通矩阵）那么 axis=0 表现为行的变化，axis=1 变现为列的变化。
比如数组:
a=np.array([[1,2,3],[1,1,1],[1,8,9]])
那么 我们计算每一列数据的方差时，就可以表示为 np.var(a, axis=0)。
每一行数据的方差可以表示为 np.var(a,axis=1)。
#!/usr/bin/python3
import numpy as np 
a=np.array([[1,2,3],[1,1,1],[1,8,9]])
print(a)
print(np.var(a, axis=0))
print(np.var(a,axis=1))
输出结果为：
[[1 2 3]
 [1 1 1]
 [1 8 9]]
[ 0.          9.55555556 11.55555556]
[ 0.66666667  0.         12.66666667]数学小白   数学小白
  964***694@qq.com
3年前 (2020-07-27)

#0   mickey jiang
  mic***jiang@hotmail.com
 9
关于 axis 的理解
其实有个简单的方法，就是跟维度一起考虑，第一维度是0，也就是最外层，最内层可以到多少取决于有多少维度，也即 np.ndim - 1。
比如shape是（2，3）的二维，axis=0表示第一维度，就是两行这个维度，理解起来就是按列处理运算，每列两个元素，共有3列，输出就是3个元素；axis=1，表示第二维度，就是3列这个维度，也是最后一个维度，理解起来就是按行处理运算，每行3个元素，共2行，输出就是2个元素。
对于三维，axis=2就是我们看到的最里面的方括号的元素列表进行处理，axis=0就是通常我们理解的3D中的Z轴方向，即最外层。 
牢记0表示最外层的方向，最大的表示最里面括号里的列表那个方向就OK。
mickey jiang   mickey jiang
  mic***jiang@hotmail.com
2年前 (2021-02-09)

#0   arli
  arl***jtu.edu.cn
 3
关于排序时 axis 的理解：

正确的理解应该是，从索引数组元组值时得下标来看，axis=0 指的是最右边下标的变化方向。
例如二维数组:
a = np.array([[30,40,70],[80,20,10],[50,90,60]])
你索引数组元素时用的是 a[i][j]，那么 axis=0 v 就 是按照 j 变化方向排序。
arli   arli
  arl***jtu.edu.cn
1年前 (2022-04-28)

             HTML / CSSHTML 教程
HTML5 教程
CSS 教程
CSS3 教程
Bootstrap3 教程
Bootstrap4 教程
Bootstrap5 教程
Font Awesome 教程
Foundation 教程
 JavaScriptJavaScript 教程
HTML DOM 教程
jQuery 教程
AngularJS 教程
AngularJS2 教程
Vue.js 教程
Vue3 教程
React 教程
TypeScript 教程
jQuery UI 教程
jQuery EasyUI 教程
Node.js 教程
AJAX 教程
JSON 教程
Echarts 教程
Chart.js 教程
Highcharts 教程
Google 地图 教程
 服务端Python 教程
Python2.x 教程
Linux 教程
Docker 教程
Ruby 教程
Java 教程
C 教程
C++ 教程
Perl 教程
Servlet 教程
JSP 教程
Lua 教程
Rust 教程
Scala 教程
Go 教程
PHP 教程
数据结构与算法
Django 教程
Zookeeper 教程
设计模式
正则表达式
Maven 教程
Verilog 教程
ASP 教程
AppML 教程
VBScript 教程
 数据库SQL 教程
MySQL 教程
PostgreSQL 教程
SQLite 教程
MongoDB 教程
Redis 教程
Memcached 教程
 数据分析Python 教程
NumPy 教程
Pandas 教程
Matplotlib 教程
Scipy 教程
R 教程
Julia 教程
 移动端Android 教程
Swift 教程
jQuery Mobile 教程
ionic 教程
Kotlin 教程
 XML 教程XML 教程
DTD 教程
XML DOM 教程
XSLT 教程
XPath 教程
XQuery 教程
XLink 教程
XPointer 教程
XML Schema 教程
XSL-FO 教程
SVG 教程
 ASP.NETASP.NET 教程
C# 教程
Web Pages 教程
Razor 教程
MVC 教程
Web Forms 教程
 Web ServiceWeb Service 教程
WSDL 教程
SOAP 教程
RSS 教程
RDF 教程
 开发工具Eclipse 教程
Git 教程
Svn 教程
Markdown 教程
 网站建设HTTP 教程
网站建设指南
浏览器信息
网站主机教程
TCP/IP 教程
W3C 教程
网站品质