import
pandas
as
pd
df
=
pd
.
DataFrame
(
[
[
'张三'
,
23
,
'男'
]
,
[
'李四'
,
27
,
'女'
]
,
[
'王二'
,
26
,
'不男不女'
]
]
,
columns
=
[
'姓名'
,
'年龄'
,
'性别'
]
)
print
(
df
)
def
mapFun
(
x
)
:
y
=
''
if
x
==
'男'
:
y
=
0
elif
x
==
'女'
:
y
=
1
elif
x
==
'不男不女'
:
y
=
2
else
:
y
=
''
return
y
df
[
'性别编码1'
]
=
df
[
'性别'
]
.
apply
(
lambda
x
:
mapFun
(
x
)
)
df
[
'性别编码2'
]
=
list
(
map
(
mapFun
,
df
[
'性别'
]
)
)
df
[
'性别编码3'
]
=
df
[
'性别'
]
.
replace
(
to_replace
=
[
'男'
,
'女'
,
'不男不女'
]
,
value
=
[
'0'
,
'1'
,
'2'
]
,
inplace
=
False
)
df
[
'性别编码4'
]
=
df
[
'性别'
]
.
apply
(
lambda
x
:
0
if
x
==
'男'
else
(
1
if
x
==
'女'
else
(
2
if
x
==
'不男不女'
else
''
)
)
)
print
(
df
)
df.set_index([Column], inplace=True)
以上这篇
Python
将
DataFrame
的某
一列
作为index的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。
您可能感兴趣的文章:
python
给
DataFrame
增加index行名和columns列名的实现方法用
pandas
中
的
DataFrame
时选取行或列的方法
python
中
pandas
.
DataFrame
对行与列求和及添加新行与列示例
pandas
数据处理基础之筛选
我试图在一个以列表格式组织的
dataframe
列
中
重新
编码
值。我知道如何替换
dataframe
列
中
的字符串值,但在列表
中
却很难做到这一点。在以下是我的数据片段:{0: '[Crime, Drama]',1: '[Crime, Drama]',2: '[Crime, Drama]',3: '[Action, Crime, Drama, Thriller]',4: '[Crime, Drama]',5...
用法:
DataFrame
.drop(labels=None,axis=0, index=None, columns=None, inplace=False)
在这里默认:axis=0,指删除index,因此删除columns时要指定axis=1;
inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新
dataframe
;
inplace=True,则会直接在原数据上进行删除操作,删除后就回不来了。
>>>df = pd.
DataFrame
(np.arange(12).reshape(3,4), columns=['A', 'B', 'C', 'D'])
第7天:
pandas
.
DataFrame
python
数据分析
学习
第8天
记录
系列文章目录前言一、今天所学的内容二、知识点详解2.1 删除行2.1.1 按==标签==来删除列2.1.2 按==序号==来删除列2.2
该列
中
包含了标签
中
的所有类别:
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(sparse = False)
result = enc.fit_transform(data[[41]]) #41指的是列标为41的那
一列
数据
该列
中
包含了标签
中
的所有类别的一部分:
from sklearn.prepro...
1. 从字典创建
DataFrame
>>> import
pandas
>>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07',...
在数据进行建模分析,无法直接把类别变量放入模型
中
去分析,因此,需要对类别变量进行处理。最常见的方法是对类别变量做哑变量
编码
或one-hot
编码
,所以运用最近的业务数据进行了尝试。哑变量
编码
和one-hot
编码
的具体介绍和区别在ML小菜鸟的博客
中
有比较详细的介绍博客链接。
做哑变量
编码
的库:
pandas
one-hot
编码
的库:sklearn、keras
注意:
pandas
默认只处理字符串类别变...
import
pandas
as pd
data = pd.read_csv('文件路径')
data['sex'] = data['LICENSE_ID'].apply(lambda r : (int(r[:17]))%10%2)
运行报错:TypeError: 'flo...
在进行数据分析操作时,经常需要对数据按照某行某列排序,或者按照多行多列排序,以及按照索引值排序等等,本文将对
DataFrame
排序作个总结。
1.创建
DataFrame
数组
这里直接使用numpy的random方法产生随机数组
2.按照索引名排序。注意sort_index()方法的axis参数默认为0。
首先按照索引index排序:排序后索引结果顺序为a、b、c、d。
然后按照列名排序,...
要用
Pandas
将某列进行唯一
编码
并修改原
DataFrame
,可以使用
Pandas
中
的。函数和
DataFrame
的列操作方法。假设要将
DataFrame
中
的。这样,就可以对原
DataFrame
进行修改了。
I have a
Pandas
DataFrame
that has a column that is basically a foreign key, as below:Index | f_key | values0 | 1 | red1 | 2 | blue2 | 1 | green3 |...