数据框中只有一小部分在熊猫中合并-python

我的问题很简单。我有一个熊猫数据框,其中包含124957条不同的推文(与中心主题相关)。问题在于每个日期有1条以上的推文(每天约300条)。

我的目标是对每天的推文进行情感分析。为了解决这个问题,我试图将同一天的所有tweet合并为一个字符串(对应于每个日期)。

为此,我尝试了以下方法:

indx=0
get_tweet=""
for i in range(0,len(cdata)-1):
    get_date=cdata.date.iloc[i]
    next_date=cdata.date.iloc[i+1]
    if(str(get_date)==str(next_date)):
        get_tweet=get_tweet+cdata.text.iloc[i]+" "
    if(str(get_date)!=str(next_date)):
        cdata.loc[indx,'date'] = get_date
        cdata.loc[indx,'text'] = get_tweet
        indx=indx+1
        get_tweet=" "

df.to_csv("/home/development-pc/Documents/BTC_Tweets_1Y.csv")

我的问题是实际上只有一小部分数据转换为我选择的格式。

Image of the dataframe

我不知道它是否重要,但是数据框由三个独立的数据集组成,我使用“ pd.concat”将它们组合为一个。之后,我按日期(升序)对新创建的数据框进行了排序,并在索引反转后对其进行了重置(最后输入(2020-01-03)= 0和第一个输入(2019-01-01)= 124958)。

提前致谢, 菲利普斯

评论