Skip to content

ArXiv Radar 是一款全天候自动化的科研情报哨兵。它每日定时巡检 ArXiv 最新论文,并驱动本地大模型进行自定义深度筛选,过滤无关噪音,将TLDR和评分的硬核研究主动推送到您的邮箱。

License

Notifications You must be signed in to change notification settings

su-Insight/arxiv-radar

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

120 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

image

ArXiv Radar

Status Stars Issues Pull Requests License

English | 简体中文

🚀 每日根据您的科研兴趣,利用本地 LLM 智能检索、语义重排并推送 ArXiv 最新论文。

Important

项目处于活跃开发阶段。请关注本仓库,并在上游更新时及时同步(Sync)您的 Fork 仓库,以享受最新的语义判别逻辑和功能修复。

🧐 关于项目

想要紧跟科研前沿?只需 Fork (并 Star⭐) 本仓库即可开启您的专属论文雷达!😊

ArXiv Radar 是一款能够精准捕捉您科研兴趣的自动化工具。它不同于简单的关键词检索,而是利用本地轻量级大语言模型(Llama3.2-3B)对每日论文进行深度语义判别。系统会分析论文的核心贡献,区分“硬核技术创新”与“普通应用落地”,确保推送到您邮箱的内容都是真正有价值的研究。

依托 Github Action,它可以实现 零成本免安装全自动 的每日学术快报服务。

✨ 特性

  • 完全免费: 所有计算任务均在 Github Action 赠送的配额内完成,无需自有服务器。
  • 语义重排: 利用 LLM 的少样本、思维链(CoT)能力对论文进行相关性评分,有效过滤信息噪音。
  • AI 生成 TLDR: 为每篇论文生成精简的总结(支持中文),助您秒级筛选核心信息。
  • 富文本邮件: 集成 PDF 直达链接、代码仓库地址、作者所属机构、高分主题样式,支持邮件内交互过滤。
  • 本地推理能力: 默认下载并运行本地模型,保护您的科研兴趣隐私,无需支付 API 费用。
  • 可选 API 支持: 如果您追求更快的生成速度或更高的质量,也支持云端 API 接入。

📷 效果展示

image

🚀 使用指南

快速开始

  1. Fork 本仓库 (别忘点个 Star 哦 😉)
image
  1. 设置 GitHub Secrets: 进入仓库 Settings -> Secrets and variables -> Actions,添加以下 Repository secrets
image
变量名 必填 类型 描述 示例
ARXIV_QUERY str 检索的 ArXiv 分类,检索多个领域用 + 连接,明细详见 cs.AI+cs.CV+cs.LG
SMTP_SERVER str 发送端邮箱的 SMTP 服务器 smtp.qq.com
SMTP_PORT int SMTP 端口(SSL 推荐 465) 465
SENDER str 发送端邮箱账号。 researcher@qq.com
SENDER_PASSWORD str 邮箱授权码(非登录密码) abcdefghijklmnop
RECEIVER str 接收论文列表的邮箱 target@outlook.com
USE_LLM_API bool 是否使用云端 API (默认为 False) False
OPENAI_API_KEY str API Key (若使用 API 则必填) sk-xxxxxxxx
OPENAI_API_BASE str 使用 API 访问 LLM 时的 API URL。如果不填写,默认为 OpenAI URL https://api.siliconflow.cn/v1
MODEL_NAME str 使用 API 访问 LLM 时的模型名称。如果不填写,默认为 gpt-4o。使用 SiliconFlow 时推荐 Qwen/Qwen2.5-7B-Instruct Qwen/Qwen2.5-7B-Instruct

SMTP的申请直接在网页搜索对应邮箱+SMTP即可

  1. 设置 Repository Variables (公开变量,方便随时修改):
image
变量名 必填 类型 描述 示例
RETRIEVER_TARGET str 核心兴趣定义,每行一个,可以是关键字或短句,建议使用英文 见下文示例
MAX_PAPER_NUM int 邮件展示的最大论文数量(默认 100) 20
LANGUAGE str TLDR 生成的语言(默认为English) Chinese
SEND_EMPTY bool 若当日无匹配论文是否发送空邮件 False

🧠 兴趣定义 (RETRIEVER_TARGET) 最佳实践

RETRIEVER_TARGET 变量中详细定义您的研究兴趣(短句或关键词),这直接影响 LLM 的判别效果:

Reinforcement learning and preference alignment (RLHF) for LLMs
Architecture and parameter efficiency optimization for Transformers
Autonomous agents, planning, and multi-step reasoning systems
Advanced Retrieval-Augmented Generation (RAG) and knowledge integration
LLM
Edge Detection

如果大模型使用关键词来进行相似度检索效果会约等于直接用关键字检索,建议使用中等颗粒度英文描述(检索模型为英文语料模型)

🔄 自动同步与更新 (Auto-Sync)

Tip

无需手动同步! 通过配置以下变量,工作流在每次运行前都会自动拉取指定仓库的最新代码,确保您始终享受最新的算法优化。

如果您希望您的 Fork 仓库始终与上游保持一致,请在 Repository Variables 中设置:

Key Required 描述 示例
REPOSITORY 提供工作流源码的仓库。设置后将自动拉取最新代码 su-Insight/arxiv-radar
REF 指定运行的代码分支(main 为稳定版,dev 为先行版) main

🧪 测试与验证 (Testing)

在正式开始每日自动推送之前,您可以通过手动触发测试工作流来验证配置是否成功:

  1. 进入您 Fork 仓库的 Actions 选项卡。
  2. 在左侧列表中选择 Test-Daily Paper Sender
  3. 点击右侧的 Run workflow 下拉菜单,点击绿色的 Run workflow 按钮。
image

Note

测试版 vs 正式版

  • Test-Workflow: 专门用于调试。它会忽略日期限制,固定检索 5 篇 ArXiv 论文,方便您立即查看邮件排版和 LLM 评分结果。
  • 正式工作流 (Main): 每天 UTC 20:00 自动触发,仅检索过去 24 小时发布的新论文。

💻 本地运行

本项目支持 uv 驱动,可以轻松在本地环境运行:

# 设置必要的环境变量
# export ARXIV_QUERY=cs.AI+cs.CV
# ... 

# 运行项目
uv run main.py

Important

运行本地模型将自动下载 Qwen2.5-3B-Instruct/Llama3.2-3B-Instruct (约 3GB)。请确保您的网络环境稳定且内存不少于 8GB。

📖 工作原理

  1. 获取数据: 每日定时通过 ArXiv API 抓取指定分类下的最新论文摘要。
  2. 属性判别: 本地 LLM 利用 少样本 + 思维链(CoT) 逻辑分析摘要,识别论文细节。
  3. 语义评分: 计算论文贡献与 RETRIEVER_TARGET 的语义契合度,给出 0-100 的相关度评分。
  4. 生成总结: 提取论文核心点,生成精简的 TLDR。
  5. 富文本推送: 渲染 HTML 模板并通过 SMTP 发送。

🛠️ 技术栈

  • Python 3.10+
  • llama-cpp-python: 本地推理后端支持
  • sentence-transformers: 语义向量计算
  • arxiv: ArXiv API 客户端
  • GitHub Actions: 自动化工作流调度

👯‍♂️ 参与贡献

欢迎提交Issue和Pull Request!我们鼓励:

  • 改进推荐算法
  • 添加新功能
  • 修复bug
  • 优化文档

所有功能性更新请务必先合并至 dev 分支。

📝 许可证

本项目基于 Apache-2.0 license 协议。

🙏 致谢

开始使用ArXiv Radar,让最新的研究成果自动找到您! 🚀

About

ArXiv Radar 是一款全天候自动化的科研情报哨兵。它每日定时巡检 ArXiv 最新论文,并驱动本地大模型进行自定义深度筛选,过滤无关噪音,将TLDR和评分的硬核研究主动推送到您的邮箱。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages