Skip to content

Knighthood2001/wechat_OCR

Repository files navigation

最新更新

  • 20251105

更新了相关代码,然后发布了微信OCR2.0.0版本,文件大小为10mb,见发行版本

  • 20250922

此次微信更新到了4.1.0.34,可以发现,文件的相关路径,变化了。从以前的

G:\applicationsoftware\WeChat\[3.9.11.17]

变成了

G:\applicationsoftware\Weixin\4.1.0.34

然后,在我的电脑中,mmmojo.dll已经没有了,转而变成了mmmojo_64.dll

因此,如果你运行起来,出现找不到mmmojo.dll的错误,你需要更新代码。

具体可以看看 https://github.com/Knighthood2001/wechat_ocr_pkg

我将wechat-ocr0.0.4版本放到dist中了,需要安装一下。

pip install dist/wechat_ocr0.0.4.tar.gz

总之,如果你的问题是找不到mmmojo.dll这个问题,你可以试试,使用wechat-ocr0.0.4版本。

  • 20240712

本次更新增加了识别path.txt中第二行目录是否存在,如果不存在,说明微信更新了,则去寻找目前存在的目录,并进行更新。这样好处就是,你只需要配置一次,后续微信更新,代码会自动更新。

  • 20240626

如果你的微信更新过,你需要在path.txt中将微信版本进行更改,否则软件运行会闪退。例如: G:\applicationsoftware\WeChat[3.9.10.19] 更改为G:\applicationsoftware\WeChat[3.9.11.17]

前言

项目功能

  • 通过截图软件进行截图后,通过按下Ctrl+C后,实现了图片提取文字,并将文字复制到剪切板中,大家通过Ctrl+V即可粘贴。

项目优势

  • 实现了图片提取文字,并且依托微信OCR,其识别精度还是挺高的;
  • 无需登录微信,即可实现微信OCR;
  • 操作简单,项目集成了使用微信OCR进行提取文字进行粘贴的一些步骤,使得你只需要通过Ctrl+CV键,即可快捷实现复制图片中的文字。
  • 可以通过更改项目中的mode参数,实现文字分行复制还是同行复制

项目展示

微信OCR视频演示

初始项目架构

下载项目打开后,项目架构如下:

img.png

其中

mian.py是项目代码。

path.txt是配置微信OCR所需要的路径存放处。

README.md是项目说明文档。

requirements.txt是项目所需的包及版本。

README_picture存放的是README.md项目说明文档所需要的图片。

运行后的项目架构

项目成功运行后,会生成img文件夹,里面存放的是剪切板中存放的图片,json文件夹中存放的是剪切板图片经过微信OCR识别后保存的json文件。 并且会生成一个text_save.txt文件,里面的内容就是图片提取的文字。如下图所示:

img.png


配置环境

要想运行本项目,首先你得先配置项目环境。

创建虚拟环境

首先打开终端,输入以下命令,创建虚拟环境

python -m venv venv

然后进入到这个虚拟环境,并将其激活

venv\scripts\activate

注意这里是反斜杠。

此时可以看到,命令前面有个(venv),说明已经进入了这个虚拟环境了。 img_1.png

安装项目包

如果你的pip版本不够,可以升级一下。命令如下

python -m pip install --upgrade pip

然后使用下面的命令,安装requirements.txt中的包

pip install -r requirements.txt

配置python解释器

这时候需要配置一下python解释器。当然这一步你可以选择在创建完虚拟环境后就进行这一步操作。 img_2.png 点击现有环境,一般来说,它会自动帮你选择你刚刚配置好的venv中的python.exe解释器,如果没有的话,自己选择一下。 img_3.png 点击确定 img_4.png 可以看到,虚拟环境中已经安装了你需要的包了。

以上操作完成后,你项目基础配置就完成了。

配置微信OCR和mmmojo.dll路径

找到项目中的path.txt文件,里面存放的是你WeChatOCR.exe和mmmojo.dll的路径 img_7.png

C:\Users\Lenovo\AppData\Roaming\Tencent\WeChat\XPlugin\Plugins\WeChatOCR\7079\extracted\WeChatOCR.exe img_5.png 你可以使用everything软件进行查找,并复制完整路径及文件名。

G:\applicationsoftware\WeChat[3.9.10.19] img_6.png 同理,你可以复制mmmojo.dll所在的路径。

这里需要注意的是:WeChatOCR.exe的路径需要到最终文件名,mmmojo.dll的路径只需要到上一级目录即可。

然后将这两个路径,依次分行复制到path.txt中,保存。

以上这一步操作需要好好配置,否则后续就无法运行。

运行代码

接下来就可以运行代码了

实现同行的复制

在main.py中的第135行中,你可以将mode改成2,这样就能将识别结果的文字放在同一行,适用与同一段落的图片的截图并提取文字。

# TODO 你可以将mode改成2,实现文字放在同一行。
save_text(json_file, save_file, mode=2)

最后

经过以上的讲解,我觉得大家对于这个项目的配置已经运行应该是没有问题了。

以下是我的微信以及微信公众号

微信二维码 公众号二维码

参考

感谢以下开源项目:

About

通过Ctrl+C实现对图片文字识别,并复制到剪切板

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages