1、总结DataFrame的去重方法,多种
C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})
C.duplicated(subset='b',keep='last') 判断是否有重复项
C.drop_duplicates(subset='b',keep='first')
C.a.unique() 对Series去重
2、总结Series转化为列表的方式
list(C.a)
3、总结Series与列表的区别
(1) list是python基本数据类型,它的元素类型可以不同,如:
[1, 2, 'a', 3,4] 元素操作比较方便
(2) array是numpy的一种数据类型,它所包含的元素必须相同,如:
[1, 2, 3, 4]
(3)Series:有index,竖着展示数据
4、总结append\extend等列表追加元素的区别及适用范围
extend是在列表后增加n个元素(只能是列表形式)
a.extend([1,2]):[1, 2, '3', '1', 1, 2]
append是在列表后增加一个元素(任何形式)
a.append([1,2]):[1, 2, '3', '1', 1, 2, [1, 2]]
网友评论