과학 PDF 문서 번역 및 이중 언어 비교 도구
- 📊 수식, 차트, 목차, 주석 유지 (미리보기)
- 🌐 다양한 언어와 다양한 번역 서비스 지원
- 🤖 커맨드라인 도구, 대화형 사용자 인터페이스, 및 Docker 제공
피드백은 GitHub Issues 또는 Telegram 그룹에서 해주세요.
- [2024년 12월 24일] Xinference 실행 로컬 LLM 지원 추가 (by @imClumsyPanda)
- [2024년 11월 26일] CLI가 온라인 파일을 지원하게 되었습니다 (by @reycn)
- [2024년 11월 24일] 의존성 크기를 줄이기 위해 ONNX 지원 추가 (by @Wybxc)
- [2024년 11월 23일] 🌟 무료 공공 서비스 온라인! (by @Byaidu)
- [2024년 11월 23일] 웹 봇을 방지하기 위한 방화벽 추가 (by @Byaidu)
- [2024년 11월 22일] GUI가 이탈리아어를 지원하고 개선되었습니다 (by @Byaidu, @reycn)
- [2024년 11월 22일] 배포된 서비스를 다른 사람과 공유할 수 있게 되었습니다 (by @Zxis233)
- [2024년 11월 22일] Tencent 번역 지원 (by @hellofinch)
- [2024년 11월 21일] GUI가 이중 언어 문서 다운로드를 지원하게 되었습니다 (by @reycn)
- [2024년 11월 20일] 🌟 데모가 온라인이 되었습니다! (by @reycn)
무료 서비스 (https://pdf2zh.com/)
설치 없이 무료 공공 서비스를 온라인으로 사용해 볼 수 있습니다.
설치 없이 HuggingFace의 데모와 ModelScope의 데모를 사용해 볼 수 있습니다. 데모의 컴퓨팅 리소스가 제한되어 있으므로 남용하지 말아주세요.
이 프로젝트를 사용하는 4가지 방법을 제공합니다: 커맨드라인 도구, 포터블, GUI, 및 Docker.
pdf2zh 실행에는 추가 모델(wybxc/DocLayout-YOLO-DocStructBench-onnx
)이 필요합니다. 이 모델은 ModelScope에서도 찾을 수 있습니다. 시작할 때 이 모델 다운로드에 문제가 있다면 다음 환경 변수를 사용하세요:
set HF_ENDPOINT=https://hf-mirror.com
PowerShell 사용자의 경우:
$env:HF_ENDPOINT = https://hf-mirror.com
-
Python이 설치되어 있어야 합니다 (버전 3.10 <= 버전 <= 3.12)
-
패키지를 설치합니다:
pip install pdf2zh
-
번역을 실행하고 현재 작업 디렉토리에 파일을 생성합니다:
pdf2zh document.pdf
Python 환경을 미리 설치할 필요가 없습니다.
setup.bat을 다운로드하고 더블클릭하여 실행합니다.
-
Python이 설치되어 있어야 합니다 (버전 3.10 <= 버전 <= 3.12)
-
패키지를 설치합니다:
pip install pdf2zh
-
브라우저에서 사용을 시작합니다:
pdf2zh -i
-
브라우저가 자동으로 시작되지 않으면 다음 URL을 엽니다:
http://localhost:7860/
자세한 내용은 GUI 문서를 참조하세요.
-
풀하고 실행합니다:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
-
브라우저에서 엽니다:
http://localhost:7860/
클라우드 서비스에서 Docker 배포용:
커맨드라인에서 번역 명령을 실행하여 현재 작업 디렉토리에 번역된 문서 example-mono.pdf
와 이중 언어 문서 example-dual.pdf
를 생성합니다. 기본적으로 Google 번역 서비스를 사용합니다. 더 많은 지원 번역 서비스는 여기에서 찾을 수 있습니다.
다음 표에 참고용으로 모든 고급 옵션을 나열했습니다:
옵션 | 기능 | 예시 |
---|---|---|
files | 로컬 파일 | pdf2zh ~/local.pdf |
links | 온라인 파일 | pdf2zh http://arxiv.org/paper.pdf |
-i |
GUI 진입 | pdf2zh -i |
-p |
부분 문서 번역 | pdf2zh example.pdf -p 1 |
-li |
소스 언어 | pdf2zh example.pdf -li en |
-lo |
대상 언어 | pdf2zh example.pdf -lo zh |
-s |
번역 서비스 | pdf2zh example.pdf -s deepl |
-t |
멀티스레드 | pdf2zh example.pdf -t 1 |
-o |
출력 디렉토리 | pdf2zh example.pdf -o output |
-f , -c |
예외 | pdf2zh example.pdf -f "(MS.*)" |
--share |
[gradio 공개 링크 얻기] | pdf2zh -i --share |
--authorized |
[웹 인증 및 사용자 정의 인증 페이지 추가] | pdf2zh -i --authorized users.txt [auth.html] |
--prompt |
[사용자 정의 대형 모델 프롬프트 사용] | pdf2zh --prompt [prompt.txt] |
--onnx |
[사용자 정의 DocLayout-YOLO ONNX 모델 사용] | pdf2zh --onnx [onnx/model/path] |
--serverport |
[사용자 정의 WebUI 포트 사용] | pdf2zh --serverport 7860 |
--dir |
[배치 번역] | pdf2zh --dir /path/to/translate/ |
--config |
구성 파일 | pdf2zh --config /path/to/config/config.json |
- 전체 번역
pdf2zh example.pdf
- 부분 번역
pdf2zh example.pdf -p 1-3,5
Google Languages Codes, DeepL Languages Codes 참조
pdf2zh example.pdf -li en -lo ko
다음 표는 각 번역 서비스에 필요한 환경 변수를 보여줍니다. 각 서비스를 사용하기 전에 이러한 변수를 설정하세요.
번역기 | 서비스 | 환경 변수 | 기본값 | 참고 |
---|---|---|---|---|
Google (기본) | google |
없음 | N/A | 없음 |
Bing | bing |
없음 | N/A | 없음 |
DeepL | deepl |
DEEPL_AUTH_KEY |
[Your Key] |
DeepL 참조 |
DeepLX | deeplx |
DEEPLX_ENDPOINT |
https://api.deepl.com/translate |
DeepLX 참조 |
Ollama | ollama |
OLLAMA_HOST , OLLAMA_MODEL |
http://127.0.0.1:11434 , gemma2 |
Ollama 참조 |
OpenAI | openai |
OPENAI_BASE_URL , OPENAI_API_KEY , OPENAI_MODEL |
https://api.openai.com/v1 , [Your Key] , gpt-4o-mini |
OpenAI 참조 |
AzureOpenAI | azure-openai |
AZURE_OPENAI_BASE_URL , AZURE_OPENAI_API_KEY , AZURE_OPENAI_MODEL |
[Your Endpoint] , [Your Key] , gpt-4o-mini |
Azure OpenAI 참조 |
Zhipu | zhipu |
ZHIPU_API_KEY , ZHIPU_MODEL |
[Your Key] , glm-4-flash |
Zhipu 참조 |
ModelScope | modelscope |
MODELSCOPE_API_KEY , MODELSCOPE_MODEL |
[Your Key] , Qwen/Qwen2.5-Coder-32B-Instruct |
ModelScope 참조 |
Silicon | silicon |
SILICON_API_KEY , SILICON_MODEL |
[Your Key] , Qwen/Qwen2.5-7B-Instruct |
SiliconCloud 참조 |
Gemini | gemini |
GEMINI_API_KEY , GEMINI_MODEL |
[Your Key] , gemini-1.5-flash |
Gemini 참조 |
Azure | azure |
AZURE_ENDPOINT , AZURE_API_KEY |
https://api.translator.azure.cn , [Your Key] |
Azure 참조 |
Tencent | tencent |
TENCENTCLOUD_SECRET_ID , TENCENTCLOUD_SECRET_KEY |
[Your ID] , [Your Key] |
Tencent 참조 |
Dify | dify |
DIFY_API_URL , DIFY_API_KEY |
[Your DIFY URL] , [Your Key] |
Dify 참조, Dify의 워크플로우 입력에서 lang_out, lang_in, text 세 변수를 정의해야 합니다. |
AnythingLLM | anythingllm |
AnythingLLM_URL , AnythingLLM_APIKEY |
[Your AnythingLLM URL] , [Your Key] |
anything-llm 참조 |
Argos Translate | argos |
argos-translate 참조 | ||
Grok | grok |
GORK_API_KEY , GORK_MODEL |
[Your GORK_API_KEY] , grok-2-1212 |
Grok 참조 |
DeepSeek | deepseek |
DEEPSEEK_API_KEY , DEEPSEEK_MODEL |
[Your DEEPSEEK_API_KEY] , deepseek-chat |
DeepSeek 참조 |
OpenAI-Liked | openailiked |
OPENAILIKED_BASE_URL , OPENAILIKED_API_KEY , OPENAILIKED_MODEL |
url , [Your Key] , model name |
없음 |
위 표에 없는 OpenAI API와 호환되는 대형 언어 모델의 경우, 표의 OpenAI와 동일한 방식으로 환경 변수를 설정할 수 있습니다.
-s service
또는 -s service:model
을 사용하여 번역 서비스를 지정합니다:
pdf2zh example.pdf -s openai:gpt-4o-mini
또는 환경 변수로 모델을 지정합니다:
set OPENAI_MODEL=gpt-4o-mini
pdf2zh example.pdf -s openai
PowerShell 사용자의 경우:
$env:OPENAI_MODEL = gpt-4o-mini
pdf2zh example.pdf -s openai
정규식을 사용하여 보존해야 할 수식 폰트와 문자를 지정합니다:
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
기본적으로 Latex
, Mono
, Code
, Italic
, Symbol
및 Math
폰트를 보존합니다:
pdf2zh example.pdf -f "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"
-t
를 사용하여 번역에 사용할 스레드 수를 지정합니다:
pdf2zh example.pdf -t 1
--prompt
를 사용하여 LLM에서 사용할 프롬프트를 지정합니다:
pdf2zh example.pdf -pr prompt.txt
prompt.txt
예시:
[
{
"role": "system",
"content": "You are a professional,authentic machine translation engine.",
},
{
"role": "user",
"content": "Translate the following markdown source text to ${lang_out}. Keep the formula notation {{v*}} unchanged. Output translation directly without any additional text.\nSource Text: ${text}\nTranslated Text:",
},
]
사용자 정의 프롬프트 파일에서는 다음 세 가지 변수를 사용할 수 있습니다:
변수 | 내용 |
---|---|
lang_in |
소스 언어 |
lang_out |
대상 언어 |
text |
번역할 텍스트 |
from pdf2zh import translate, translate_stream
params = {"lang_in": "en", "lang_out": "ko", "service": "google", "thread": 4}
file_mono, file_dual = translate(files=["example.pdf"], **params)[0]
with open("example.pdf", "rb") as f:
stream_mono, stream_dual = translate_stream(stream=f.read(), **params)
pip install pdf2zh[backend]
pdf2zh --flask
pdf2zh --celery worker
curl http://localhost:11008/v1/translate -F "file=@example.pdf" -F "data={\"lang_in\":\"en\",\"lang_out\":\"ko\",\"service\":\"google\",\"thread\":4}"
{"id":"d9894125-2f4e-45ea-9d93-1a9068d2045a"}
curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a
{"info":{"n":13,"total":506},"state":"PROGRESS"}
curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a
{"state":"SUCCESS"}
curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a/mono --output example-mono.pdf
curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a/dual --output example-dual.pdf
curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a -X DELETE
- 문서 병합: PyMuPDF
- 문서 파싱: Pdfminer.six
- 문서 추출: MinerU
- 문서 미리보기: Gradio PDF
- 멀티스레드 번역: MathTranslate
- 레이아웃 파싱: DocLayout-YOLO
- 문서 표준: PDF Explained, PDF Cheat Sheets
- 다국어 폰트: Go Noto Universal