Windows 桌面 · WebView2 · 本机 Agent

在你电脑上运行的
智能命令行助手

LapinTool 连接 CMD、PowerShell、WSL、SSH 等终端,用自然语言驱动任务 Agent 执行命令与自动化运维;内置 AI 专用浏览器供 Agent 读页、截图与多标签协作。数据与终端会话留在本机。

核心特性

多终端

CMD、PowerShell、Pwsh、WSL、SSH 与用户自定义终端;任务内连接 Shell,支持执行前确认与手动运行命令。

任务 Agent

多步推理与工具调用:执行命令、读写文件、搜索编辑;询问 / 任务两种输入模式,可清空上下文与自动执行。

问答模式

独立流式对话,接入 Ollama 或 OpenAI 兼容 API(DeepSeek、通义千问、MiMo 等),支持联网搜索开关。

AI 浏览器

本机 Chrome(CDP)供 Agent 打开页面、切换标签、提取 Markdown、点击与截图;多标签列表自动注入上下文。

多模态

视觉模型读图;Z-Image 文生图;MiMo TTS 语音合成(预置音色 / 音色复刻 / 音色设计)。能力由 models.json 配置。

现代界面

WebView2 桌面壳:任务时间线、内嵌终端、项目与工作目录、明暗主题;消息内图片全屏预览(拖动与缩放)。

AI 浏览器

Agent 通过本机 Chrome 调试端口操作网页,与主界面 WebView2 分离,使用独立配置与用户数据目录(见 data/config/config.jsonbrowser 段)。

手动操作

  • 侧边栏 打开浏览窗口 启动 AI 专用 Chrome。
  • 截图:当前可视区域;截整页:整页长图。
  • 截图进入任务输入框附件,点击缩略图可全屏预览。

让 AI 读指定标签

可同时打开多个标签;任务开始时标签列表(带序号)会注入系统提示。

说法示例 Agent 行为
读一下第 2 个标签页 按序号切换 → 读页面
看看 bilibili 那个标签 按 URL 关键词切换 → 读页面
打开 github 首页总结 已有标签则切换,否则导航打开

纯文本模型请优先用 browser_get_page_markdown 或 JS 读页;截图适合视觉模型。序号从 1 开始。

模型能力配置

各模型能力保存在 data/config/models.json。首次见到新模型时会按名称规则自动推断并写入;规则不准时可手动修改,前后端共用同一份配置。

字段 含义 初始推断(示例) 选择器图标
image 支持图像输入(image_url) 名称含 -vl、vision 等 图像输入
tts 语音合成模型 名称含 -tts 语音
image_gen 文生图模型 名称以 z-image 开头 文生图

使用说明

  • 在「设置」中添加 LLM 提供商与模型列表后,对应条目会出现在 models.json
  • 选中 TTS 模型(MiMo 等)时弹出语音合成对话框;文生图模型走询问模式,仅接受文字提示词。
  • MiMo 音色复刻 / 音色设计仍按模型 ID 中的 voiceclonevoicedesign 区分表单项。

下载

将发布包 lap.zip 放在本页面同目录后,点击下方按钮下载。解压得到 lap.exe,双击即可打开桌面窗口(WebView2)。

  • 包含:桌面程序、默认配置目录结构。
  • 不包含:CLI 版、独立 PTY 版等其它构建产物。
  • 系统需已安装 WebView2 运行时(Win11 通常已自带)。
下载 lap.zip

快速开始

  1. 下载并解压

    得到 lap.exedata/ 目录,建议放在有写权限的路径。

  2. 准备配置(首次)

    参考包内示例,在 data/config/config.json 中配置 LLM 与浏览器等;模型能力见 data/config/models.json(可随使用自动补全)。

  3. 运行

    双击 lap.exe 打开桌面窗口。本地 HTTP 服务监听 127.0.0.1:7005

  4. 创建任务

    新建项目与任务,连接终端(或使用纯询问模式),在设置中添加 API 与模型后即可对话或交给 Agent。

  5. 可选:AI 浏览器

    在任务页打开浏览窗口,或让 Agent 使用浏览器工具读页、截图与切换标签。