添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
import pandas as pd df = pd . DataFrame ( [ [ '张三' , 23 , '男' ] , [ '李四' , 27 , '女' ] , [ '王二' , 26 , '不男不女' ] ] , columns = [ '姓名' , '年龄' , '性别' ] ) # 现在的需求是将男映射为0,女映射为1,不男不女映射为3,其他编码为‘’ print ( df ) def mapFun ( x ) : y = '' if x == '男' : y = 0 elif x == '女' : y = 1 elif x == '不男不女' : y = 2 else : y = '' return y # 方式1 df [ '性别编码1' ] = df [ '性别' ] . apply ( lambda x : mapFun ( x ) ) # 方式2 # python3中返回的是迭代器,必须加上list转换 df [ '性别编码2' ] = list ( map ( mapFun , df [ '性别' ] ) ) # 方式3 这种方式不够灵活,因为可能存在除开['男','女','不男不女']的类别,而这个类别应该编码为‘’,后期要删除 df [ '性别编码3' ] = df [ '性别' ] . replace ( to_replace = [ '男' , '女' , '不男不女' ] , value = [ '0' , '1' , '2' ] , inplace = False ) # 还有中方式是直接使用lambda,在其中使用判断,而不自定义函数,但是这种方式对于类别过多会很复杂 df [ '性别编码4' ] = df [ '性别' ] . apply ( lambda x : 0 if x == '男' else ( 1 if x == '女' else ( 2 if x == '不男不女' else '' ) ) ) print ( df ) df.set_index([Column], inplace=True) 以上这篇 Python DataFrame 的某 一列 作为index的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。 您可能感兴趣的文章: python DataFrame 增加index行名和columns列名的实现方法用 pandas DataFrame 时选取行或列的方法 python pandas . DataFrame 对行与列求和及添加新行与列示例 pandas 数据处理基础之筛选 我试图在一个以列表格式组织的 dataframe 重新 编码 值。我知道如何替换 dataframe 的字符串值,但在列表 却很难做到这一点。在以下是我的数据片段:{0: '[Crime, Drama]',1: '[Crime, Drama]',2: '[Crime, Drama]',3: '[Action, Crime, Drama, Thriller]',4: '[Crime, Drama]',5... 用法: DataFrame .drop(labels=None,axis=0, index=None, columns=None, inplace=False) 在这里默认:axis=0,指删除index,因此删除columns时要指定axis=1; inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新 dataframe ; inplace=True,则会直接在原数据上进行删除操作,删除后就回不来了。 >>>df = pd. DataFrame (np.arange(12).reshape(3,4), columns=['A', 'B', 'C', 'D']) 第7天: pandas . DataFrame python 数据分析 学习 第8天 记录 系列文章目录前言一、今天所学的内容二、知识点详解2.1 删除行2.1.1 按==标签==来删除列2.1.2 按==序号==来删除列2.2 该列 包含了标签 的所有类别: from sklearn.preprocessing import OneHotEncoder enc = OneHotEncoder(sparse = False) result = enc.fit_transform(data[[41]]) #41指的是列标为41的那 一列 数据 该列 包含了标签 的所有类别的一部分: from sklearn.prepro... 1. 从字典创建 DataFrame >>> import pandas >>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07',... 在数据进行建模分析,无法直接把类别变量放入模型 去分析,因此,需要对类别变量进行处理。最常见的方法是对类别变量做哑变量 编码 或one-hot 编码 ,所以运用最近的业务数据进行了尝试。哑变量 编码 和one-hot 编码 的具体介绍和区别在ML小菜鸟的博客 有比较详细的介绍博客链接。 做哑变量 编码 的库: pandas one-hot 编码 的库:sklearn、keras 注意: pandas 默认只处理字符串类别变... import pandas as pd data = pd.read_csv('文件路径') data['sex'] = data['LICENSE_ID'].apply(lambda r : (int(r[:17]))%10%2) 运行报错:TypeError: 'flo... 在进行数据分析操作时,经常需要对数据按照某行某列排序,或者按照多行多列排序,以及按照索引值排序等等,本文将对 DataFrame 排序作个总结。 1.创建 DataFrame 数组 这里直接使用numpy的random方法产生随机数组 2.按照索引名排序。注意sort_index()方法的axis参数默认为0。 首先按照索引index排序:排序后索引结果顺序为a、b、c、d。 然后按照列名排序,... 要用 Pandas 将某列进行唯一 编码 并修改原 DataFrame ,可以使用 Pandas 的。函数和 DataFrame 的列操作方法。假设要将 DataFrame 的。这样,就可以对原 DataFrame 进行修改了。 I have a Pandas DataFrame that has a column that is basically a foreign key, as below:Index | f_key | values0 | 1 | red1 | 2 | blue2 | 1 | green3 |...