我的数据框如下所示:
title type country release_year
a movie USA 2018
b movie USA,UK 2018
c movie USA 2018
d movie UK 2018
e movie USA 2019
f movie UK 2019
我想计算每个国家/地区每年发行的电影数量。因此,我正在应用以下内容:
result = df.groupby(['release_year', 'country'])['country'].count().reset_index(name='counts')
这就是我得到的:
release_year country counts
2018 USA 2
2018 USA,UK 1
2018 UK 1
2019 USA 1
2019 UK 1
但是我想得到一些东西,美国,英国在美国和英国之下一次计算,并且不分开,例如:
release_year country counts
2018 USA 3
2018 UK 2
2019 USA 1
2019 UK 1
在分组之前,我也尝试过:
pd.Series(df.country.str.split(', ').sum()).value_counts()
这给出了每个国家/地区的结果,但未按release_year分组。我无法满足这两个条件。
我已经搜索了很多,但是找不到解决我问题的方法。