Pandas是Python数据分析的核心库,提供高性能易用的数据结构DataFrame和Series,以及数据清洗、变换、聚合等全套工具。它是Python替代Excel进行数据处理的关键——数据科学项目80%的时间花在数据准备上,Pandas就是做这件事的首选工具。
下面几段代码覆盖了Pandas最核心的功能。每段代码都可以直接复制到Jupyter Notebook或编辑器里运行。
# 读取CSV文件——最常见的数据导入方式
import pandas as pd
df = pd.read_csv("data.csv")
df.head() # 查看前5行
# 筛选行——按条件过滤数据
df[df["age"] > 30] # 筛选年龄大于30的行
df[(df["age"] > 30) & (df["city"] == "北京")] # 多条件筛选
# 分组聚合——按类别统计
df.groupby("city")["salary"].mean() # 按城市分组,计算平均工资
df.groupby(["city","gender"]).size() # 按多列分组计数
# 处理缺失值——让数据变干净
df.dropna() # 删除含空值的行
df.fillna(0) # 用0填充空值
df["age"].fillna(df["age"].mean()) # 用平均值填充
# 合并数据——像SQL的JOIN
pd.merge(df1, df2, on="id") # 按id列合并两个表
df1.merge(df2, left_on="user_id", right_on="id", how="left") # 左连接
Pandas的灵魂是DataFrame(二维表格)和Series(一维序列)。所有操作——筛选、分组、合并、透视——本质上都是对DataFrame的行列变换。Pandas底层依赖NumPy,所以继承了其向量化优势,大多数操作不需要写循环。
按使用频率排列,覆盖日常开发90%的需求。
这个库好在哪:Python数据分析的绝对核心——没有Pandas就没有Python数据科学生态。DataFrame设计优雅,操作直观,是Python替代Excel进行数据处理的关键。API覆盖了数据清洗的几乎所有需求。性能经过了多年优化——百万行数据也能流畅处理。和NumPy、Matplotlib无缝配合。
坑在哪:API太多——几百个函数和参数,新手容易迷失。链式操作虽然简洁但调试困难。内存管理对大数据的支持有限——几十GB的数据需要换用Dask或Polars。版本更新有时引入破坏性变化。
适合谁:所有用Python做数据分析、数据挖掘、机器学习的人。想用代码替代Excel重复操作的数据工作者。数据科学入门必学的第一个库。
替代品:Polars(Rust写的DataFrame库,性能更强但生态弱)、Dask(分布式Pandas,适合大数据)、PySpark(大数据分布式处理)。日常数据分析Pandas是最成熟的选择。
学习建议:先学会读取文件和选取行列——这是最基础的操作。再学筛选和分组——这是最常用的功能。不要试图背所有函数,用到什么查什么。把常见的清洗流程整理成自己的代码片段库。
在写代码时卡住了?把下面这段话完整复制到任何AI对话框,把【】里的内容换成你的具体问题。
我正在学习 Pandas,请你以一位耐心、专业的Python数据科学老师身份,用大白话帮我拆解以下问题。 我的问题是:【在这里写你的具体问题,比如:怎么用Pandas完成某个数据处理任务?】 要求: 1. 用大白话解释,给出可以直接运行的代码 2. 每一行代码加上注释,说明它在做什么 3. 如果涉及广播或shape相关的概念,请通俗解释 4. 如果有常见的坑,请提前告诉我怎么避开 我的水平:有Python基础,刚接触Pandas
如果你想系统深入地学习,把下面这段话复制到AI对话框,把【】里的内容换成你的具体情况:
我正在深入学习 Pandas,请你以一位精通Python数据科学的认知导航专家身份,遵循“为知识建立秩序”的理念,帮我构建一个高阶学习地图。 我的当前水平:【描述你的水平,如:已经能熟练创建和索引NumPy数组,想系统学习广播机制、线性代数运算和性能优化】 请按以下框架回答: 1. 🧭 认知导航:Pandas在Python数据科学生态中的位置和上下游关系 2. 🗺️ 知识地图:用“结构化学习路径”列出3-4个阶段 3. 🪜 学习路线图:按“新手→进阶→专业”的顺序给出练习项目 4. ⚠️ 高阶避坑指南:列出广播、copy/view、数据类型方面的深层坑 5. ✅ 学习效果自查清单 请用大白话回答,代码示例用Pandas。
💡 使用技巧:新手版适合“这个函数怎么用”类问题;高阶版适合“我应该怎么系统学Pandas”类问题。