利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
来源:互联网 发布:网络电影数据分析 编辑:程序博客网 时间:2024/06/11 22:38
利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一、pandas 是什么
pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。
pandas 有两个主要的数据结构:Series和 DataFrame。
二、Series
Series 是一个一维数组对象 ,类似于 NumPy 的一维 array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。
将 Python 数组转换成 Series 对象:
将 Python 字典转换成 Series 对象:
当没有显示指定索引的时候,Series 自动以 0 开始,步长为 1 为数据创建索引。
你也可以通过 index 参数显示指定索引:
对于 Series 对象里的单个数据来说,和普通数组一样,根据索引获取对应的数据或重新赋值;
不过你还可以传入一个索引的数组来获取数据或未数据重新赋值:
想要单独获取 Series 对象的索引或者数组内容的时候,可以使用 index 和values 属性,例如:
对 Series 对象的运算(索引不变):
三、DataFrame
DataFrame 是一个表格型的数据结构。它提供有序的列和不同类型的列值。
例如将一个由 NumPy 数组组成的字典转换成 DataFrame 对象:
DataFrame 默认根据列名首字母顺序进行排序,想要指定列的顺序?传入一个列名的字典即可:
如果传入的列名找不到,它不会报错,而是产生一列 NA 值:
DataFrame 不仅可以以字典索引的方式获取数据,还可以以属性的方法获取,例如:
修改列的值:
删除某一列:
安装步骤已经在首篇随笔里写过了,这里不在赘述。利用Python进行数据分析(1) 简单介绍
接下来一篇随笔内容是:利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作,有兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。
作者:backslash112
出处:http://sirkevin.cnblogs.com/
GitHub:https://github.com/backslash112/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
出处:http://sirkevin.cnblogs.com/
GitHub:https://github.com/backslash112/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
阅读全文
0 0
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
- 利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
- Python pandas基础: Series和DataFrame的简单介绍
- 利用Python 的 Pandas进行数据分析
- python数据分析包pandas的使用方法
- Python.pandas -- Python的一个数据分析包
- 基于python的数据分析库Pandas
- 《利用Python进行数据分析》第五章 pandas的基本功能
- 利用python进行数据分析-pandas入门
- 《利用Python 进行数据分析》pandas 总结
- 利用Python进行数据分析 pandas基础: 处理缺失数据
- 利用Python进行数据分析(12) pandas基础: 数据合并
- 利用Python进行数据分析(14) pandas基础: 数据转换
- python-pandas-Series和DataFrame的基本功能
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- AI的伦理挑战
- Part-Time Jobs
- 线性判别分析(Linear Discriminant Analysis, LDA) 学习笔记 + matlab实现
- oracle本机能连外部访问不了
- LeetCode:Remove Nth Node From End of List
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- Java中输入输出文件流操作
- 织梦后台在谷歌内核浏览器(如360)下的窜位问题
- React Native参考
- 2017年乌镇互联网大会,互联网大佬们齐聚首
- UE主叫与被叫的基本流程(WCDMA)
- LVS集群部署及故障排查
- Read Time
- day 1 常见的dos命令