python- pandas 数据帧重排堆栈为两个值列(用于factorplots)

我一直在尝试重新排列我的 dataframe 以将其用作因子图的输入.原始数据如下所示:

  A B C  D
1 0 1 2 "T"
2 1 2 3 "F"
3 2 1 0 "F"
4 1 0 2 "T"
...

我的问题是如何将其重新排列为以下形式:

  col val val2
1  A   0  "T"
1  B   1  "T"
1  C   2  "T"
2  A   1  "F"
...

我正在尝试:

df = DF.cumsum(axis=0).stack().reset_index(name="val")

但是,这只产生一个值列,而不是两个..感谢您的支持

最佳答案

我会用融化的,你可以随心所欲地排序

pd.melt(df.reset_index(),id_vars=['index','D'], value_vars=['A','B','C']).sort_values(by='index')
Out[40]: 
    index  D variable  value
0       1  T        A      0
4       1  T        B      1
8       1  T        C      2
1       2  F        A      1
5       2  F        B      2
9       2  F        C      3
2       3  F        A      2
6       3  F        B      1
10      3  F        C      0
3       4  T        A      1
7       4  T        B      0
11      4  T        C      2

那么显然您可以根据需要命名列

df.set_index('index').rename(columns={'D': 'col', 'variable': 'val2', 'value': 'val'})