DeepSeek OCR 是一个基于Deepseek AI模型的智能文字识别系统,旨在通过图像识别技术提取图像中的文本信息。该项目使用了 DeepSeek API 进行 OCR 处理,支持多种上传方式,包括文件上传和 URL 上传。
- 📤 图像上传: 支持通过拖拽、点击或粘贴方式上传图像文件。
- 🔍 OCR 识别: 通过 DeepSeek API 进行图像中的文字识别。
- 📄 结果展示: 显示识别结果,并提供复制功能。
- 🔑 认证设置: 用户可以设置认证信息(Auth Token 和 Chat Session ID)以启用 OCR 功能。
- 📚 帮助文档: 提供对认证参数的获取说明,帮助用户更好地使用该系统。
以下是项目的界面展示,帮助您更好地了解项目的功能和运行效果。
在项目使用过程中,作者发现 DeepSeek 可能存在 IP 限制 的问题。具体表现为:
-
新加坡服务器无法成功识图:当尝试在新加坡服务器上运行时,DeepSeek 的识图功能未能正常工作。
-
本地/国内服务器正常运行:相同的代码和配置在国内服务器上可以正常运行,未出现识图问题。
基于以上现象,推测 DeepSeek 可能对某些地区的 IP 地址进行了限制,或者其服务在不同地区的可用性存在差异。建议用户在使用时注意以下几点:
- 服务器选择:如果遇到识图失败的问题,可以尝试将服务部署在国内服务器上。
- 已推送到 Docker 仓库
已经将镜像推送到 Docker 仓库,可以直接使用以下命令进行一键部署:
docker run -p 8088:8088 sexgirls/ocr-based-deepseek:latest
访问 http://localhost:8088
来使用应用。
-
克隆项目
git clone https://github.com/yourusername/ocr-based-deepseek.git cd ocr-based-deepseek
-
构建项目
使用 Maven 构建项目:
mvn clean package
-
运行应用
运行 Spring Boot 应用:
java -jar target/ocr-based-deepseek-0.0.1-SNAPSHOT.jar
默认情况下,应用将在
http://localhost:8088
上运行。
在使用 OCR 功能之前,用户需要设置以下认证参数:
- Auth Token: 这是与 DeepSeek API 交互所需的认证令牌。如下图获取:

- Chat Session ID: 这是用于标识会话的 ID,通常在进行多次请求时需要保持一致。如下图获取:

在应用的设置侧边栏中,用户可以输入上述参数并点击“保存认证信息”按钮。成功保存后,上传功能将被启用。
- 打开应用后,用户可以选择上传图像文件或输入图像 URL。
- 上传后,系统将自动进行 OCR 识别,并在结果区域展示识别结果。
- 用户可以通过点击“复制内容”按钮将识别结果复制到剪贴板。
欢迎任何形式的贡献!如果您有建议或发现问题,请提交 issue 或 pull request。
本项目仅适用于学习和研究目的。 作者和贡献者不对项目的任何其他用途负责,包括但不限于商业用途、生产环境使用或其他可能导致的后果。
-
禁止用于商业用途:本项目仅供个人学习和研究,禁止将其用于任何商业目的。
-
无任何担保:作者和贡献者不对项目的准确性、可靠性或适用性提供任何形式的担保。
-
使用者自行承担风险:任何使用本项目的行为均由使用者自行承担风险,作者和贡献者不承担任何责任。
如果您使用本项目,即表示您已阅读并同意以上声明。