• 需要进入多个文件夹-循环

    我正在与Codeshare共享我的python代码。 https://codeshare.io/aJVV0r 我添加了大写的“ DOUBT FROM HERE”。在这之后,我遇到了麻烦。您可以运行代码,您将看到此问题开始于一个页面,该页面包含文件夹中的多个文件夹以及其中的文件。我需要下载文件夹中的所有这些文件,但是在编写for循环时遇到了麻烦。
  • 在创建x路径时面临困难

    我正在使用JAVA Selenium-3面临的问题来创建x路径, DOM结构如下 在这个DOM中 <span class="ant-table-column-title" xpath="1">Inspection_Status</span> 是列名。 和 <svg fill="currentColor" preserveAspectRatio="xMidYMid meet" height="1em" width="1em" viewBox="0 0 40 40" type="filter" class=...
  • PYTHON:如何以不同的功能开始每个测试?

    我正在为移动应用程序编写测试,其中第一个屏幕是“登录”屏幕。我确实有涉及,但是在其他测试中,我想跳过test_Login并直接转到test_DoStuffOnHomeScreen 最好的方法是什么?我在用 def get_desired_caps(application): return dict(platformName='Android', deviceName="$DEVICE", application=PATH('../apps/' + app), appP...
  • 如何使用硒验证表格元素并单击其他元素

    我正在尝试创建一个剪贴簿,该剪贴簿可以进入一个网站并从房地产基金下载一个包含资产负债表的XML文件。 使用下面的代码,我进入一个特定基金的网站,文档号为07000400000146(位于URL的末尾),使用网站上的搜索栏过滤文档,然后单击以使用XPath下载表中的第一个文档。 driver.get('https://fnet.bmfbovespa.com.br/fnet/publico/abrirGerenciadorDocumentosCVM?cnpjFundo=07000400000146') driv...
  • 如何在Linux上关闭浏览器的流量压缩?

    我正在使用硒在没有运行Debian 9 OS(Google Compute Engine)的无显示(Xvfb)的Linux服务器上抓取网站。但是,该网站返回以下内容: <html><head> <title>name of website</title> <link rel="shortcut icon" href="/favicon.ico" type="image/x-icon"> <...
  • 硒发送错误的特殊键

    I want to send key ENTER in my code, but Selenium is sending BACKSPACE instead. from selenium.webdriver.common.keys import Keys from selenium import webdriver import time driver = webdriver.Remote(command_executor='http://127.0.0.1:9999', desired_capabili...
  • 除了包含硒中特定单词的链接以外,是否可以获取页面上的所有链接?

    我一直在努力寻找解决方法,到目前为止,我什么都没发现。我试过使用not函数通过css,xpath和部分文本使用find元素。我正在尝试扫描网页上所有不包含单词“ google”的链接,并将它们附加到数组中。 请记住,speak和get_audio是我未包含的独立功能。 driver = webdriver.Chrome(executable_path='mypath') url = "https://www.google.com/search?q=" driver.get(url + text.lower(...
  • 用硒获取请求,然后传递给scrapy

    我是网络抓取的初学者,遇到了一些问题 基本上,我正在尝试实现一个蜘蛛,它读取验证码以继续。 因此,我使用了硒,并使用chrome webdriver和OCR实现了代码以获取验证码文本。 现在,我想遍历webdriver的验证码阅读,直到成功为止。 但是为了做到这一点,有必要传递Webdriver的请求作为对Spider的响应。 关于此主题或类似内容的文章很多,这让我感到困惑。所以我想直接在这里问。 就我而言,您能推荐我做什么? 谢谢!
  • 使用if循环排除包含子字符串的条目

    I'm trying to scrape the results & statistics from the last 4 seasons of snooker from https://cuetracker.net. 我成功(某种程度上)抓取了大部分数据,但是却忽略了其中包含的走动。这些淘汰赛仅包含国籍,球员姓名和得分数据,没有统计数据,因此,当我将数据抓取到列表中时,将它们转换为DataFrame时,它们无法正确对齐。 我试图在循环中使用if in语句,以尝试跳过作为过渡项的这些匹配项,因此将正确的统计...
  • 如何在Python中使用Selenium从H1标签获取字符串

    <h1 align='center'>MD5 encrypt this string</h1><h3 align='center'>pc08BLh9x7fCaZTHux9n</h3><center><form action="" method="post"> 请问如何在h3标签中使用字符串! 我尝试了这个,但没有: from selenium import webdriver driver = webdriver.Chrome('C://Program Files//webdrivers//chr...
  • python硒代码中xpath的语法错误

    我正在尝试在Python中使用Selenium选择日期。 HTML代码如下所示: 为了选择日期,我使用以下代码: import selenium from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium import WebElement driver = webdriver.Chrome(executable_path=r"C:\Users\cssaxena\Cardboar...
  • Selenium WebDriverException

    我有一个使用硒中的webdriver的WebDriverException []# python3.4 file.py Traceback (most recent call last): File "/var/www/html/admin/scripts/soscuisine_nadia2.py", line 195, in <module> browser = webdriver.Firefox() File "/usr/lib/python3.4/site-packages/selen...
  • Selenium单击instagram Python上的所有跟随按钮

    我已经在这个问题上停留了两天了,非常感谢您提供解决方案。 当您在instagram网站上单击用户的用户名时,我试图使instagram跟随按钮的点击自动化。 单击用户名后,然后单击关注者,然后会打开一个窗口,其中包含关注此人的人员,并且有关注按钮 这是新窗口的屏幕截图 我正在尝试通过python硒一个接一个地单击按钮,但是我尝试的任何方法似乎都没有效果。我得到的最好的结果是一个for循环,该循环仅使用xpath单击了第一个跟随按钮,但未单击其他按钮。任何帮助将不胜感激 #click the followe...
  • 如何将HTML中的日期时间(作为str)与python中的日期时间进行比较

    我正在使用硒提取视频,并且正在尝试编写一些东西来检查视频发布的日期时间是否在昨天开始之前。比较我从视频中提取的日期时间和昨天时遇到麻烦。 timeOfPost = browser.find_element_by_css_selector("").get_attribute("datetime") if(timeOfPost > yesterday): videoLinks.append(browser.find_element_by_css_selector("").get_...
公告

欢迎访问 码农俱乐部  点击这里设置您的邮箱  可以接收站内跟帖、回复邮件提醒,不错过任何一条消息。

关注公众号订阅更多技术干货! 码农俱乐部