pd.cut怎么用?

  统计/机器学习 Python    浏览次数:3400        分享
0

pandas里pd.cut怎么用?

 

jacksun   2019-07-02 07:13



   2个回答 
5

官网上介绍的比较清楚了,并且在下面还有例子。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.cut.html?highlight=cut#pandas.cut

简单的一句话pandas的cut可以把一组数据分割成离散的区间。

import numpy as np
import pandas as pd
pd.cut(np.array([1, 7, 5, 4, 6, 3]), 3)
#output:
#[(0.994, 3.0], (5.0, 7.0], (3.0, 5.0], (3.0, 5.0], (5.0, 7.0], (0.994, 3.0]]
#返回的是每个元素所在的区间
SofaSofa数据科学社区DS面试题库 DS面经

NullErr   2019-07-08 15:54

3

pd.cut可以方便将连续数值离散化。

下面的例子就是利用pd.cut将成绩分数转成等第。

def score2grade(score):
    grade = pd.cut(score, [0, 60, 70, 80, 90, np.inf], right=False, labels=['F', 'D', 'C', 'B', 'A'])
    return grade

比如

score2grade([45, 65, 70, 92])

就会得到['F', 'D', 'C', 'A']

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-07-10 15:10



  相关讨论

pandas数据合并 merge 相同的列能不能合并

怎么删除pandas dataframe中index重复的行?

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容

pandas同时返回一个dataframe的前几行(head)和后几行(tail)

将pandas.DataFrame中的-1全部换成0

怎么利用pandas新建一个只有列名的空的dataframe?

如何复制一个pandas DataFrame

去掉pandas DataFrame的index的名字

把pandas.DataFrame中所有行全部随机排列

怎么对pandas dataframe做转置?

  随便看看

dropout rate一般设置多大?

两个独立的正态随机变量的乘积服从什么分布?

查看sklearn的线性回归系数的p value

怎么对2维的numpy array取整?

向量梯度下降优化的最佳步长?