由subset限制的子区域,是判断是否
删除
该
行
/列的条件判断区域。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻
删除
。dropna()方法,能够找到
DataFrame
类型数据的空
值
(缺失
值
),将空
值
所在的
行
/列
删除
后,将新的
DataFrame
作为返回
值
返回。‘any’,表示该
行
/列只要有一个以上的空
值
,就
删除
该
行
/列;‘all’,表示该
行
/列全部都为空
值
,就
删除
该
行
/列。如果该
行
/列中,非空元素数量
小于
这个
值
,就
删除
该
行
/列。1或’columns’,表示按列
删除
。
不知道为啥,用pandas将文件读入
DataFrame
时,将前面的0自动给我删了,比如000003就直接给我转为3了,这样再做后续操作的时候肯定就会出错的嘛。比如我是打算把000003转换为00:00:03的,结果就搞不成了。不让我转,删了总
行
了吧,反正这个也是无效信息。就考虑根据列中
值
的字符串
长度
,进
行
行
的
删除
。
首先想到的就是布尔索引,下面先介绍下布尔索引
df=df[逻辑表达式取反]
在进
行
数据分析和处理时,常常需要对
DataFrame
中的数据进
行
修改和更新。增加某个
值
是其中一种操作。
DataFrame
是一种二维表格数据的结构,其中每个列可以有不同的数据类型。在
DataFrame
中,可以通过
行
和列的索引来访问特定的数据,从而进
行
修改操作。
要增加某个
值
,需要首先确定需要修改的位置。在
DataFrame
中,可以使用以下方式来访问特定位置的数据:
1. 按
行
索引和列索引访问数据:
df.loc[row_index, col_index] = new_value
2. 按
行
和列的整数位置访问数据:
df.iloc[row_pos, col_pos] = new_value
在确定了需要修改的位置后,可以使用以上两种方式中的任意一种来增加某个
值
。例如,如果需要将第一
行
第二列的
值
增加10,可以使用以下代码:
import pandas as pd
# 创建一个
DataFrame
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.
DataFrame
(data)
# 增加第一
行
第二列的
值
df.iloc[0, 1] += 10
print(df)
输出结果为:
col1 col2 col3
0 1 14 7
1 2 5 8
2 3 6 9
可以看到,第一
行
第二列的
值
已经增加了10。
除了直接给某一个
值
增加特定数字之外,也可以将某一个列或某几列全部增加某个
值
。例如,如果需要将第二列所有的
值
增加20,可以使用以下代码:
df['col2'] += 20
同样的,如果需要将第二列和第三列所有的
值
都增加20,可以使用以下代码:
df[['col2', 'col3']] += 20
在进
行
DataFrame
中的修改操作时,需要注意数据类型的匹配问题。例如,如果试图将一个字符串类型的
值
增加到一个整数类型的列中,就会出现类型不匹配的错误。因此,在进
行
修改操作之前,需要先了解数据类型,避免出现错误。
OSError: [WinError 126] 找不到指定的模块。 Error loading “D:\Python\Anaconda3\lib\site-packages\torch\lib\asm