今天做机器学习实验,我们查看数据类型把类别换成我们需要的合适的类别,为后边的处理做准备。把类别category类型转换成dummy/indicator变量。
首先介绍get_dummies():
pandas.
get_dummies
(
data
,
prefix=None
,
prefix_sep='_'
,
dummy_na=False
,
columns=None
,
sparse=False
,
drop_first=False
):把类别category类型转换成dummy/indicator变量。
columns
: list-like, default None
Column names in the DataFrame to be encoded. If columns is None then all the columns with object or category dtype will be converted.
参数列将会被编码。如果没有给出,那么所有为object或category类型的列将会被转换。
然后介绍astype():
DataFrame.
astype
(
dtype
,
copy=True
,
errors='raise'
,
**kwargs
):转换为一个明确的类型
df.dtypes
Serial No. int64
GRE Score int64
TOEFL Score int64
University Rating object
SOP float64
LOR float64
CGPA float64
Research int64
Admit object
dtype: object
df['University Rating'] = df['University Rating'].astype('object')
df.dtypes
Serial No. int64
GRE Score int64
TOEFL Score int64
University Rating object
SOP float64
LOR float64
CGPA float64
Research int64
Admit object
dtype: object
今天做机器学习实验,我们查看数据类型把类别换成我们需要的合适的类别,为后边的处理做准备。把类别category类型转换成dummy/indicator变量。首先介绍get_dummies():pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, dro...
在处理
数据时,可能会遇到
数据类型不一致的问题。例如,通过爬虫采集到的
数据都是整型的
数据,在使用
数据时希望保留两位小数点,这时就需要将
数据的
类型转换成浮点型。针对这种问题,既可以创建
Pandas对象时明确指定
数据的类型,也可以使用astype()方法和to_numeric()函数进行
转换,具体如下。
一、通过astype()方法强制
转换数据的类型
当我们做数据分析时,确保自己使用的是正确的数据类型,这一点很重要。而在pandas中,一般情况下会根据我们导入的数据,自动分配最合适的数据类型。
但是有时候pandas也会犯错,这时候我们就需要diy自定义数据类型。本文主要将pandas的dtype,如何进行数据类型的操作。
pands数据类型
数据类型是编程语言的基础性概念,ta会告诉电脑如何存储数据、如何操作数据。
例如,当我们给程序两个数字,进行5+10操作时, 程序要能理解这是两个整数,且知道整数是可以进行加法操作。
而当有两个字符...
先看一个非常简单的例子:
a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']]
df = pd.DataFrame(a)
有什么方法可以将列转换为适当的类型?例如,上面的例子,如何将列2和3转为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每列的类型?
在使用
pandas库进行
数据分析时,有时候会需要将object
类型转换成数值类型(float,int),那么如何做呢?
主要有以下三种方法:创建时指定类型,df.astype强制
类型转换,以及使用pd.to_numeric()
转换成适当数值类型。
一,创建时指定类型
您可以使用 pandas 中的 astype() 方法来转换 DataFrame 中的部分数据类型。例如,如果您想将某一列的数据类型从字符串转换为整数,可以使用以下代码:
df['column_name'] = df['column_name'].astype(int)
如果您想将某一列的数据类型从整数转换为浮点数,可以使用以下代码:
df['column_name'] = df['column_name'].astype(float)
当然,您也可以一次性转换多列的数据类型,只需要在 astype() 方法中传入一个字典,指定每一列需要转换的数据类型即可。例如:
df = df.astype({'column1': int, 'column2': float, 'column3': str})
希望这个回答能够帮助您!
python 读取数据出现UnicodeDecodeError:: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid contin
312787
python 读取数据出现UnicodeDecodeError:: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid contin
gigiforever:
神经网络优化:病态矩阵与条件数
神经网络优化:病态矩阵与条件数
qq_34681645: