提迪尔

我试图创建两个词干的二元组。但是我的代码只是阻止第二个单词,而第一个单词则不会被阻塞。因此,例如,分别列出“担心”和“担心”。

任何援助将不胜感激。

 bigram_text <- text_df %>% 
   mutate_all(as.character) %>%
   unnest_tokens(bigram, text, token = "ngrams", n = 2)%>% 
   mutate(bigram = wordStem(bigram))

 bigramcount<- bigram_text %>%
   count(bigram, sort = TRUE)