订阅本栏目 RSS您所在的位置: 深山工作室 > python > 正文

Python pandas删除指定行/列数据的方法实例

2022/10/28 16:42:29 字体: 浏览 1807

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

删除重复值 drop_duplicates()
df=pd.DataFrame({'state':[1,1,2,2,1,2,2],'pop':['a','b','c','d','b','c','d']})
语法:drop_duplicates(subset,keep,inplace),其中参数 keep:{‘first’,‘last’,False},默认’first’
first:保留第一次出现的重复项,删除第二次及之后出现的重复项。
last:保留最后一次出现的重复项,删除之前出现的重复项。
"false":删除所有重复项。


查看有nan的行,和不含有nan的行
#1 查看含有nan的行     df[df.isna().any(axis=1)]
#2 查看不含有nan的行   df[~df.isna().any(axis=1)]   #有一个符号 ~ 一定要注意这一点

示例:提取pandas dataframe中’商品名称‘列包含’手机’字符的所有数据:
#提取含有指定字符的行
df2=df[df['商品名称'].str.contains(pat='手机',regex=False)]  #regex=True则pat是一个正则表达式,regex=False表示pat是一个字符串

删除pandas dataframe中’商品名称’列包含’手机’字符的所有数据:
#删除含有指定字符的行
df2=df.drop(df[df['商品名称'].str.contains(pat='手机',regex=False)].index,inplace=True)  #regex=True则pat是一个正则表达式,regex=False表示pat是一个字符串


去掉某些具体值
数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。
df[(True-df['appPlatform'].isin([2]))]

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。
df[(True-df['appID'].isin([278,382]))]


另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。
df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

很详细的介绍链接:https://www.jb51.net/article/236118.htm#_lab2_0_4
官网详细解释链接:https://pandas.pydata.org/docs/reference/api/pandas.Series.str.contains.html?highlight=contains#pandas.Series.str.contains


小的示例
import pandas as pd
df = {'地址':['北京','上海','长沙','北京省会','广州市区'],'table':['user','student','course','sc','book']}
df = pd.DataFrame(df)
print(df)
print('================')
citys = ['北京', '天津', '上海']
address = '|'.join(citys)
df_new = df[df['地址'].str.contains(address)] #包含对应关键字
print(df_new)

相关阅读
asp与数据库sql的种种操作
用uni-app开发微信小程序用uni.makePhoneCall拨打电话
新敦煌国际旅行社
新乡市神州国际旅行社
非常酷的javascript实现万年历功能
IE6.0, IE7.0和FireFox浏览器css样式兼容
性感的CSS菜单(Menus)
在Android、iOS、Windows、MacOS中微信小程序的文件存放路径
共有0条关于《Python pandas删除指定行/列数据的方法实例》的评论
发表评论
正在加载评论......
返回顶部发表评论
呢 称:
表 情:
内 容:
评论内容:不能超过 1000 字,需审核,请自觉遵守互联网相关政策法规。
验证码: 验证码 
网友评论声明,请自觉遵守互联网相关政策法规。

您发布的评论即表示同意遵守以下条款:
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家、社会、集体和公民的合法权益;
二、不得发布国家法律、法规明令禁止的内容;互相尊重,对自己在本站的言论和行为负责;
三、本站对您所发布内容拥有处置权。

更多信息>>栏目类别选择
百度小程序开发
微信小程序开发
微信公众号开发
uni-app
asp函数库
ASP
DIV+CSS
HTML
python
更多>>同类信息
python通过代码修改pip下载源让下载库飞起
python里面requests.post返回的res.text还有其它的吗
windows7环境下安装配置jdk
python对微信操作要用到这两个库wxpy与itchat
8种Python字符串拼接的方法,你知道几种
Python拼接字符串的几种方式
更多>>最新添加文章
在Android、iOS、Windows、MacOS中微信小程序的文件存放路径
python通过代码修改pip下载源让下载库飞起
python里面requests.post返回的res.text还有其它的吗
aliyun阿里云续费域名优惠口令(注册、续费都可以使用)
windows7环境下安装配置jdk
python对微信操作要用到这两个库wxpy与itchat
ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明
DW设置之后更好用 DreamweaverCS编辑GB2312与UTF-8文件在代码视图中点击鼠标错位问题的解决办法
更多>>随机抽取信息
深山旅行社管理系统开源吗?
静态网站利用微信URL Scheme生成的ticket从浏览器h5跳到微信小程序完整代码
利用javascript让PNG透明图片支持支持(IE6、IE7、firefox下测试通过)
商业版增加线路日期报价功能样式选择(增加了3个日期报价效果)
秀色摄影
asp日历代码