在对海量数据进行分析的过程中,可能需要增加行和列,也可能会删除一些行和列。今天教大家如何在python中对数据框进行一些更新操作。
文章目录
-
-
- 1 在数据框最后追加一行
- 2 在数据框中插入一列
- 3 删除数据框中的行
- 4 删除数据框中的列
- 5 删除满足某种条件的行
-
注意:本文采用的数据框
date_frame
:
1 在数据框最后追加一行
假设要在原数据框中增加一行,可先定义该行对应的字典,具体语句如下:
new_row = {'ID':['1000009'],
'name':['唐诗诗'],
'gender':['女'],
'age':[21],
'height':[1.68]
}
- 1
- 2
- 3
- 4
- 5
- 6
注意:格式要和原数据框一致。把新增行用append函数追加到原数据框中去,具体语句如下:
new_row1 = pd.DataFrame(new_row)
date_frame.append(new_row1)
- 1
- 2
得到结果如下:
2 在数据框中插入一列
既然可以在数据框中加入行,那么也可以在数据框中加入列。可以用insert函数在数据框中任意位置加入一列。比如我想在数据框的第一列插入新的列,可以在python中运行如下语句:
date_frame.insert(0, 'calss', ['class1','class1','class1','class1','class2','class2','class2','class2','class2'])
- 1
得到结果如下:
其中,.insert
中的0表示新插入列所在的位置,'calss'
表示新加列名称,['class1',...,'class2']
表示新加列的内容,注意新加列要和原数据框的长度一致。既然可以在数据框中加入行和列,那么也可以在数据框中删除行和列。首先来看下在数据框中删除行。
3 删除数据框中的行
可以用drop函数删除某一行,也可以删除多行。首先来看下删除第一行的具体代码:
date_frame.drop([0])
- 1
得到结果如下:
.drop([0])
表示删除索引号为0(第一行)的行。要删除其它行可以把0改成对应行的索引号。接着来看下删除第一行和第五行的具体代码:
date_frame.drop([0,4])
- 1
得到结果如下:
.drop([0,4])
表示删除索引号为0和4的行,实际代表第一行和第五行。需删除更多的行,可以参照删除两行的代码。
4 删除数据框中的列
同样可以用drop函数来删除列。首先来看下删除name列的具体代码:
date_frame.drop(columns = 'name')
date_frame.drop('name', axis = 1) #axis = 1表示对列进行操作
- 1
- 2
得到结果如下:
如果想删除name列和gender列,可以输入如下代码:
date_frame.drop(columns = ['name','gender'])
date_frame.drop(['name','gender'], axis = 1)
- 1
- 2
得到结果如下:
删除多列的代码,同样可以参照删除两列的代码。
5 删除满足某种条件的行
假设要删除所有年龄大于18岁的记录,可以在python中输入如下语句:
date_frame.drop(index = (date_frame.loc[(date_frame.age>18)].index))
- 1
得到结果如下:
其中,.loc[(date_frame.age>18)].index
表示取年龄大于18的索引。至此,在python中对数据框进行更改操作已介绍完毕,大家可以动手练习一下,思考一下还可不可以对数据框进行别的操作。
你可能感兴趣:
用Python绘制皮卡丘
用Python绘制词云图
Python人脸识别—我的眼里只有你
Python画好看的星空图(唯美的背景)
用Python中的py2neo库操作neo4j,搭建关联图谱
Python浪漫表白源码合集(爱心、玫瑰花、照片墙、星空下的告白)

长按(扫一扫)识别上方二维码学习更多Python和建模知识,让你的学习和工作更出彩。