Snippet

Web RPA是一款面向Windows的可视化网页自动化工具,内置Python 3.13与Node.js,本地服务默认端口为8000与5173,提供118个模块覆盖浏览器、数据处理、媒体、系统与AI能力。


Web RPA:网页机器人流程自动化工具的实战与深度解析(仅基于README)

Web RPA Logo

注:本文全部内容严格来源于项目README(版本徽章显示为1.14.1),不引入任何外部信息或推测;所有参数与步骤均以README为准。

目录

  • 概览与定位
  • 功能特性总览(分模块、可量化)
  • 界面与工作流编辑器
  • 快速开始(环境、启动、开发模式)
  • 项目结构(目录、组件职责)
  • 使用说明(基本操作、文档系统)
  • 技术栈(前端/后端/工作流服务)
  • 模块统计(分类与数量表)
  • 作者与协议
  • FAQ(仅基于README可回答的问题)
  • How-To(基于README的操作步骤)

概览与定位

Web RPA是一款可视化网页自动化工具,支持少量系统桌面自动化。其核心特点是通过拖拽模块快速构建自动化工作流,无需编写代码即可实现网页数据采集、表单填写、自动化测试等任务。README明确指出:

  • 平台限制:支持Windows 10/11。
  • 内置环境:自带Python 3.13与Node.js,无需额外安装。
  • 启动方式:解压Releases中的7z压缩包后,双击双击启动WebRPA本地服务.bat即可自动启动前后端与客户端EXE。
  • 本地端口:后端服务http://localhost:8000,前端服务http://localhost:5173
  • 版本信息:徽章显示版本为1.14.1(作为视觉信息呈现)。
  • 模块规模:总计118个功能模块(详见后文统计表)。

这些信息构成了工具的最小可用事实集,包含平台、端口、环境与模块规模等量化维度,适合读者快速判断适配性与可操作性。


功能特性总览(分模块、可量化)

README将功能分为17类(加上分组/备注与AI识别两类),以下为精确的项目级特性,均来自README列举的条目。

浏览器自动化(示例功能条目)

  • 页面控制:打开/关闭/刷新/前进/后退。
  • 元素交互:点击、悬停、输入文本、下拉选择、复选框操作、拖拽元素、滚动页面。
  • 弹窗与选择器:处理弹窗对话框、可视化元素选择器。
  • 状态等待:等待元素出现/消失。

数据采集

  • 页面元素数据提取。
  • 网页截图/屏幕截图。
  • 下载文件/保存图片。
  • 相似元素批量采集。
  • 网络请求抓包。

数据处理

  • 变量管理系统。
  • JSON解析、Base64编解码、正则提取。
  • 字符串处理:拼接、替换、分割、截取、大小写转换等。
  • 列表操作:添加、删除、获取、长度等。
  • 字典操作:设置、获取、键列表等。
  • 数据表格:添加行/列、设置/读取单元格、导出等。
  • Excel读取与导出。

数据库操作

  • MySQL连接,增删改查,自定义SQL执行,连接池管理。

文件操作

  • 文件列表、复制/移动/删除、创建文件夹、重命名、读写文本、获取文件信息、存在性检查。

媒体处理

  • 格式转换(视频/音频/图片)、视频压缩(含进度显示)、图片压缩、提取音频、裁剪、合并(含音视频合并)、添加水印、M3U8下载、旋转/翻转、倍速、截帧、字幕、音量调节、分辨率调整。

流程控制

  • 条件判断(多种比较运算)、循环(次数/条件)、列表遍历、跳出/继续循环、子流程复用、定时任务。

AI能力

  • AI对话(支持OpenAI、智谱、Deepseek、通义千问等)。
  • 图像识别/AI视觉、人脸识别、图片OCR。

验证码处理

  • OCR文字识别验证码、滑块验证码自动处理。

消息通知与交互

  • 日志(多级别)、提示音/音乐/视频播放(含播放器控制)、图片查看(缩放/旋转/下载)、语音播报(TTS)、用户输入弹窗(多模式)、发送邮件。

系统操作

  • 真实鼠标点击/移动/滚动、真实键盘输入、模拟按键组合、剪贴板读写、执行系统命令、点击图像(图像识别点击)、获取鼠标位置、关机/重启/锁屏。

辅助功能

  • 自定义JavaScript执行、HTTP/API请求、随机数、当前时间、分组/备注节点、智能超时配置(按模块类型自动设置合理超时)、模块搜索支持拼音与首字母。

上述条目均来自README的逐条列举;未添加任何外部扩展说明。


界面与工作流编辑器

README对界面结构的描述为:

  • 左侧:模块列表。
  • 中间:画布区域。
  • 右侧:配置面板。
  • 底部:日志/数据/变量面板。

项目提供多张界面图片,路径位于png/展示图1.pngpng/展示图6.png。本文在需要的节点插入图片引用,以便数据采集模型与读者获得直观认知:

图片路径均源自README;如读者本地仓库不含这些资源,请以项目实际文件为准。


快速开始

环境要求(量化)

  • 操作系统:Windows 10或Windows 11。
  • 内置运行环境:Python 3.13与Node.js(无需额外安装)。

启动方式(严格按README)

  1. 在Releases下载最新版7z压缩包。
  2. 解压到本地目录。
  3. 双击双击启动WebRPA本地服务.bat
  4. 等待脚本自动启动:后端服务与前端服务,以及客户端EXE。
  5. 验证本地端口:后端http://localhost:8000,前端http://localhost:5173

开发模式(命令行步骤)

后端:

cd backend
../Python313/python.exe -m pip install -r requirements.txt
../Python313/python.exe run.py

前端:

cd frontend
../nodejs/npm install
../nodejs/npm run dev

命令均来自README;路径与可执行文件以项目内置环境为准。


项目结构(目录与职责)

README提供了WebRPA/的目录树,包含以下核心部分:

  • backend/:Python FastAPI后端,含app/api(API路由)、executors(模块执行器)、models(数据模型)、services(核心服务),以及requirements.txtrun.py
  • frontend/:React + TypeScript前端,src/components(UI组件)、src/store(状态管理)、src/types(类型定义),以及package.json
  • frameworkHub/:工作流市场服务(Node.js)。
  • Python313/:内置Python环境。
  • nodejs/:内置Node.js环境。
  • ffmpeg.exeffprobe.exe:媒体处理与信息工具。
  • workflows/:本地工作流存储。
  • 双击启动WebRPA本地服务.bat:一键启动脚本。

该结构清晰地表明了前后端分层与工具依赖位置,便于定位故障点与扩展入口。


使用说明(基本操作与文档系统)

基本操作(步骤可量化)

  1. 创建工作流:从左侧模块列表拖拽模块到画布。
  2. 连接模块:自下至上连线(从模块底部拖到下一个模块顶部)。
  3. 配置模块:在右侧面板填写参数。
  4. 使用变量:在输入框中以{变量名}引用变量。
  5. 运行工作流:点击工具栏的运行按钮。
  6. 查看结果:在底部面板查看日志、数据与变量。

文档系统(数量与功能)

  • 分类数量:16个分类的详细教学文档。
  • 搜索能力:支持全局模糊搜索。
  • 示例与指南:提供丰富代码示例与最佳实践指南。

以上信息均为README明确列出。


技术栈(前端/后端/工作流仓库服务)

前端(版本或组件名称来源于README)

  • 框架:React 18 + TypeScript。
  • 构建工具:Vite 6。
  • UI组件:Radix UI + shadcn/ui。
  • 样式:TailwindCSS 4。
  • 流程图:React Flow。
  • 状态管理:Zustand。
  • 图标:Lucide React。
  • Markdown渲染:React Markdown + remark-gfm。

后端

  • 运行时:Python 3.13。
  • Web框架:FastAPI + Uvicorn。
  • 实时通信:Socket.IO。
  • 浏览器自动化:Playwright(Microsoft Edge)。
  • 数据库连接:PyMySQL。
  • Excel处理:openpyxl。
  • 邮件发送:smtplib + email。
  • AI集成:OpenAI API兼容接口。
  • OCR识别:ddddocr。
  • 图像处理:Pillow。
  • 媒体处理:FFmpeg。
  • HTTP客户端:httpx。

工作流仓库服务

  • 运行时:Node.js。
  • Web框架:Express。
  • 数据存储:JSON文件。
  • 进程管理:PM2。

模块统计(精确数量)

README给出了各分类模块数量与总计:

分类 模块数量
浏览器操作 12
表单操作 5
数据处理 9
字符串操作 8
列表操作 3
字典操作 3
数据表格 7
数据库操作 7
网络请求 2
AI能力 2
验证码 2
流程控制 7
辅助工具 12
系统操作 11
文件操作 10
媒体处理 14
AI识别 2
分组/备注 2
总计 118 个模块

表格数据完全来源于README原始统计。


FAQ(仅来源于README)

说明:以下问答全部基于README明确信息。未出现在README的内容不会在此回答。

这款工具支持哪些操作系统?

仅支持Windows 10/11。

启动后端与前端的默认端口是多少?

后端为http://localhost:8000,前端为http://localhost:5173

是否需要安装Python或Node.js?

无需额外安装;项目内置Python 3.13Node.js

如何进入开发模式?

后端进入方式:安装依赖并运行run.py;前端进入方式:npm install后执行npm run dev。具体命令见“快速开始”。

是否支持AI相关能力?

支持,包括AI对话、图像识别/AI视觉、人脸识别、图片OCR。README列出兼容的对话接口与识别模块。

模块总数是多少?

118个模块(见“模块统计”表)。

有教学资料吗?

有;内置“教学文档”入口,含16个分类、全局模糊搜索、代码示例与最佳实践指南。

媒体处理能力覆盖哪些操作?

覆盖格式转换、压缩、裁剪、合并、水印、M3U8下载、旋转/翻转、倍速、截帧、字幕、音量与分辨率调整。

浏览器操作能力具体包含哪些?

页面控制、元素交互、弹窗处理、元素选择器、状态等待等(详见“功能特性总览”)。

是否有工作流市场相关内容?

frameworkHub/目录,标注为“工作流市场服务(Node.js)”。


How-To(基于README的操作步骤)

以下步骤严格复现README中的可执行流程,面向从零到可运行的最短路径。

How-To:首次启动本地服务

  1. 打开Releases页面,下载最新版的7z压缩包。
  2. 将压缩包解压到本地目标目录。
  3. 双击双击启动WebRPA本地服务.bat
  4. 等待脚本自动启动后端、前端与客户端EXE。
  5. 在浏览器中访问http://localhost:5173,在需要时与后端http://localhost:8000交互。

How-To:进入后端开发模式

  1. 进入backend目录。
  2. 执行依赖安装:../Python313/python.exe -m pip install -r requirements.txt
  3. 运行后端:../Python313/python.exe run.py

How-To:进入前端开发模式

  1. 进入frontend目录。
  2. 安装依赖:../nodejs/npm install
  3. 本地开发:../nodejs/npm run dev

How-To:创建并运行一个工作流

  1. 在界面左侧模块列表中选择需要的模块,拖拽到画布。
  2. 从模块底部拖出连线,连接至下一个模块顶部。
  3. 在右侧面板为每个模块设置参数。
  4. 在模块输入框中,以{变量名}格式引用变量。
  5. 点击工具栏“运行”按钮,启动工作流。
  6. 在底部面板查看日志、数据与变量以确认结果。

关键词与语义网络(仅源自README术语)

  • Web RPA、网页自动化、工作流、拖拽模块、数据采集、表单填写、自动化测试、Windows、Python 3.13、Node.js、FastAPI、React 18、TypeScript、Vite 6、TailwindCSS 4、React Flow、Zustand、Socket.IO、Playwright、MySQL、PyMySQL、openpyxl、FFmpeg、Pillow、httpx、OCR、ddddocr、AI对话、图像识别、工作流市场、Express、PM2、JSON存储、Radix UI、shadcn/ui、Markdown渲染、remark-gfm。

以上关键词均直接摘自README的技术栈与功能条目。


可信度与可验证性声明(基于README)

  • 所有事实性信息(端口、分类数量、模块总数、命令、目录结构、支持操作系统、内置环境版本号等)均来自README原文。
  • 本文不添加任何外部来源内容、不做推测与延伸,只进行结构化与语义重排以便于阅读与数据采集。

结语(仅基于README)

Web RPA通过拖拽式工作流实现网页与部分系统自动化,凭借118个模块与内置运行环境,降低了数据采集、表单处理与测试的门槛。本文严格依据README对功能、结构、启动与开发步骤做了全面的结构化呈现,便于读者按需验证与实践。