python- pandas :如何将一个热编码的数据帧转换为邻接矩阵?

我有一个 dataframe df,格式为:

   Col1  Col2  Col3  
0   0    1    0
1   1    1    0
2   0    1    1
3   1    1    0

我需要一个新的df格式:

    Col1  Col2  Col3
Col1   0    2    0  
Col2   2    0    1
Col3   0    1    0

基本上,这些值表示所有行的两个给定列的同时出现.

我该怎么办?

最佳答案

在那里简单地利用matrix-multiplication

In [21]: df_out = df.T.dot(df)

In [22]: np.fill_diagonal(df_out.values, 0)

In [23]: df_out
Out[23]: 
   Col1 Col2 Col3
Col1   0   2   0
Col2   2   0   1
Col3   0   1   0