LaVague:用于自动化 Selenium 浏览的开源大型操作模型
LaVague: Open-source Large Action Model to automate Selenium browsing

原始链接: https://github.com/lavague-ai/LaVague

GitHub 的“LaVague”是一个自动化工具,它使用自然语言处理(NLP)和 Selenium 集成将自然语言查询转换为浏览器交互。 它旨在自动执行需要最少认知工作的重复任务,同时通过开源技术确保用户隐私。 该项目包括先进的人工智能技术等功能,以及微调本地模型、支持各种浏览器引擎以及跟上最新进展的计划。 用户可以通过 Colab 笔记本或 Discord 频道与 LaVague 进行讨论、贡献或提问。 设置开发环境包括安装 Chrome 浏览器和驱动程序,以及使用 Python 在虚拟环境中安装 pip。 还有一个指导未来发展的路线图,包括扩展功能和改进平台。

是的,它确实让我想起了《星际迷航:下一代》中的乔迪·拉·福吉。 尽管有视力障碍,但在 VISOR 设备的帮助下,他仍能够操作星际飞船并执行各种功能。 我们的项目旨在提供类似水平的便利性和效率,使个人能够与数字界面无缝交互,而无需手动操作鼠标或键盘。 对于视障人士来说,这是一个非常棒的应用程序。 无法想象这对他们来说有多大的好处! --- HTML: 带有标签“名称:”的输入字段 标有“登录”的按钮 查询:填写姓名字段“John Doe”,然后按“登录”按钮 完成: ````蟒蛇 name_input = driver.find_element(By.XPATH, "//label[text()='Name:']/following::input[1][@type='text']") name_input.send_keys("约翰·多伊") # 要找到下一个元素“登录”按钮,我们可能需要额外的上下文 # 但是,我们可以假设登录按钮存在类名“btn btn-primary” # 使用类名有时可能存在风险,因为类可以在网站的未来版本中进行修改 login_button = driver.find_element(By.CSS_SELECTOR,'.btn.btn-primary') 登录按钮.click() ```` --- HTML: 包含电子邮件、密码字段和标记为“提交”的按钮的表单 查询:在电子邮件字段中填写“[[email protected]](mailto:[email protected])”,在密码字段中填写“[password123](mailto:password123)”,然后单击“提交” 完成: ````蟒蛇 email_field = driver.find_element(By.NAME, '电子邮件') email_field.send_keys("[[email protected]](mailto:[email protected])") 密码字段 = driver.find_element(By.NAME, '密码') password_field.send_keys('[password123](mailto:password123)') 提交按钮 = driver.find_element(By.XPATH
相关文章

原文
联系我们 contact @ memedata.com