约定第一行代码
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
Series
Series属性及方法
- Series一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率.
一个简单的列子
ser1=Series([4,12,-12,-4])
ser1
代码结果
0 4
1 12
2 -12
3 -4
dtype: int64
- 通常,我们自己就可以创建索引:
ser2=Series([4,12,-12,-4],index=['b','c','a','d'])
ser2
代码结果
b 4
c 12
a -12
d -4
dtype: int64
values和index
- Series有两个很最要的属性values和index,分别获取内容和索引
values
ser1.values
代码结果
array([ 4, 12, -12, -4], dtype=int64)
index
ser1.index
代码结果
RangeIndex(start=0, stop=4, step=1)
可将字典转换为Series
dict={"red":100,"black":400,"green":300,"pink":900}
ser3 = Series(dict)
ser
代码结果
black 400
green 300
pink 900
red 100
dtype: int64
pandas的isnull和nonull可检测缺失数据
isnull
pd.isnull(ser3)
代码结果
purple False
brown False
glod False
blue False
Name: values, dtype: bool
### notnull ###
pd.notnull(ser3)
代码结果
purple True
brown True
glod True
blue True
Name: values, dtype: bool