for p in articles2:
url = p.find('a')['href']
title = p.find('h3').get_text().strip().encode("utf-8")
print(title)
输出:
c3 \ xa9gie de d \ xc3 \ xa9fense active et pr \ xc3 \ xa9ventive \ xc2 \ xbb'
b'将路线放大到vacr \ xc3 \ xa9n \ xc3 \ xa9e
b'On vous le dit'
b'\ xc3 \ x89dition du jour(PDF)'
b'Son port est d \ xc3 \ xa9sormais obligatoire:Le prix du masque plafonn \ xc3 \ xa9'
b'Baisse de 20%des proxits agricoles'.....
尝试不同的编码,看来这个字符是Latin-1。
You can find more encodings here