Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。
项目内置了三种驱动方案,通过代码逻辑动态适配不同的使用场景:
| 驱动方案 | 逻辑入口 | 支持模型 | 核心优势 | 使用前提 |
|---|---|---|---|---|
| Web Client | web.js |
Gemini 3 系列 | 完全免费,支持联网插件 | 需保持 Google 账号登录 |
| Official API | official.js |
Pro/Flash 预览版 | 极速响应,原生支持 Thinking 模式 | 需 Google AI Studio Key |
| OpenAI Compatible | openai_compatible.js |
GPT/Claude 等 | 高扩展性,支持中转接口 | 需第三方服务密钥 |
基于 background/control/ 模块实现,AI 可以执行复杂的 Agent 任务:
| 分类 | 核心指令 | 代码实现逻辑 |
|---|---|---|
| 导航控制 | navigate_page, new_page |
调用 chrome.tabs 进行页面生命周期管理 |
| 页面交互 | click, fill, drag |
基于 Accessibility Tree 生成 UID 进行精准操控 |
| 数据观测 | take_snapshot, get_logs |
实时提取 DOM 结构、控制台日志及网络请求 |
| 脚本执行 | evaluate_script |
在网页 Context 中运行自定义 JavaScript |
- 💬 智能侧边栏:基于
sidePanelAPI,提供毫秒级唤起的对话空间,支持全文搜索历史记录。 - 🪄 划词工具栏:注入 Content Script,选中文字即刻进行翻译、总结、重写,支持一键回填表单。
- 🖼️ 图像 AI 处理:
- OCR & 截图翻译:集成 Canvas 裁剪技术,框选图片区域即刻提取文字并翻译。
- 浮窗探测:自动识别网页图片并生成悬浮 AI 分析按钮。
- 水印消除:内置
watermark_remover.js算法,显著提升生成图像的可视化质量。
- 🛡️ 安全渲染:所有 Markdown、LaTeX 公式及代码块均在
sandbox隔离环境中渲染,确保主页面安全。
如果您觉得 Gemini Nexus 提升了您的工作效率,欢迎请开发者喝杯咖啡,支持项目的持续维护!☕
赞赏通道(爱发电): https://afdian.com/a/gemini-nexus
扫描上方二维码或 点击此处 前往爱发电支持我
- 从 Releases 下载最新 ZIP 包并解压。
- Chrome 访问
chrome://extensions/,右上角开启 “开发者模式”。 - 点击 “加载已解压的扩展程序”,选择解压后的文件夹即可。
- 构建工具:Vite + TypeScript
- 架构协议:Chrome MV3 + Browser Control Protocol
- 核心库:Marked.js, KaTeX, Highlight.js
本项目基于 MIT License 开源。