我试图创建两个词干的二元组。但是我的代码只是阻止第二个单词,而第一个单词则不会被阻塞。因此,例如,分别列出“担心”和“担心”。
任何援助将不胜感激。
bigram_text <- text_df %>%
mutate_all(as.character) %>%
unnest_tokens(bigram, text, token = "ngrams", n = 2)%>%
mutate(bigram = wordStem(bigram))
bigramcount<- bigram_text %>%
count(bigram, sort = TRUE)