python pandas 过滤数据代码示例
import pandas as pd
df = pd.read_excel(r"C:\Users\ZT\Desktop\无标题.xlsx",sheet_name='Sheet1')
# 过滤掉 非文章和演出聚合的数据,也可用 > < 等删选数据
# product = df[(df['类型'] != '文章') & (df['类型'] != '演出聚合')]
# isin()条件函数为提供的列表中的每一行返回一个True值。要根据此类函数过滤行,请使用选择括号内的条件函数[]。在这种情况下,选择括号内的条件检查该列的哪些行是 2 或 3
# 以上等价于按类别为 景区 或 景区聚合.... 的行进行过滤,并将两个语句与|(or) 运算符组合:
# product = df[df['类型'].isin(['景区','景区聚合','演出','场馆',])]
# 等价于 下面的语句
# 不能使用 or 或者 and ,但是 or = | ,and = &
# 组合多个条件语句时,每个条件必须用括号括起来()
# 1.拆分出表格里的编辑数据
product = df[(df['类型'] == '景区') | (df['类型'] == '景区聚合') | (df['类型'] == '演出') | (df['类型'] == '场馆')]
product.to_excel(r"C:\Users\ZT\Desktop\周产品数据.xlsx",sheet_name='周产品数据',index=False)
# 2. 拆分出 推广的文章量
article = df[df['类型'] == '文章']
# article['作者'].value_counts() 等同于 article.groupby('作者')['作者'].count()
print(article['作者'].value_counts())