我有2列的pandas数据框:
- 嵌入为数组列,嵌入大小= size_of_embedding
- 语言
像这样:
embedding language
[0.1 0.2 0.3] fr
[0.1 0.4 0.4] en
[0.8 0.1 0.1] fr
给定一个起始整数n = 10,对于嵌入列的每个值,我想像这样在上述数据框中添加一列:
embedding language feature1 feature2 feature3
[0.1 0.2 0.3] fr 10:0.1 11:0.2 12:0.3
[0.1 0.4 0.4] en 13:0.1 14:0.4 15:0.4
[0.8 0.1 0.1] fr 10:0.8 11:0.1 12:0.1
因此,feature1 =第一个嵌入值,feature2 =第2个嵌入值...。对于下一种语言,起始特征值= n + size_of_embedding:。 因此,对于每种语言,添加的列数完全等于size_of_embedding数组。对于遇到的每种下一种语言,我们从n + size_of_embedding:开始。有一个简单的方法吗?谢谢。