PDF解析神器MinerU本地部署

2025-06-22

字数统计: 989字 | 阅读时长≈ 3分

前言

为解决LLM知识库的局限性、幻觉问题和数据安全性的问题，RAG检索增强生成（Retrieval Augmented Generation）应运而生，已经成为这些年最火热的LLM应用方案。而本人在使用RagFlow构建本地知识库时，发现其自带的DeepDoc解析PDF的效果不是很理想，为了解决这个问题找了MinerU这款PDF神器来替代DeepDoc解析PDF。本文主要整理了本地部署MinerU2.0的步骤，包含cpu和gpu两种模式（文章当前最新MinerU版本为mineru-2.0.6-released）。

一、MinerU介绍

MinerU是一款由上海人工智能实验室的大模型数据基础团队（OpenDataLab）开发的开源数据提取工具，专门用于高效地从复杂的 PDF 文档、网页和电子书中提取内容。想了解MinerU提取数据的原理可参考官方PPT文档

官方在线体验地址：

1. 拉取代码安装依赖

# 拉取项目源码
git clone https://github.com/opendatalab/MinerU.git
# 进入项目目录
cd MinerU
# uv创建python虚拟环境
uv venv --python3.11
# 激活虚拟环境
.venv\Scripts\activate
# uv下载项目依赖
uv pip install -e .[core]

2. mineru命令下载模型

# 命令下载模型
mineru-models-download
# 根据提示选择使用hugingface或modelscope下载模型，国内网络原因推荐使用modelscop
modelscope
# 根据提示选择需要下载的模型，这里直接选择all
all

下载的模型大概4.22G，默认下载到了C:\Users\username.cache\modelscope目录，后续使用命令解析PDF就不需要重复下载模型了

3. gpu模型安装coda和替换coda相关包（cpu模式可跳过该步骤）

解析后端	pipeline	vlm-transformers	vlm-sgslang
操作系统	windows/linux/mac	windows/linux	windows(wsl2)/linux
内存要求	最低16G以上，推荐32G以上
磁盘空间要求	20G以上，推荐使用SSD
python版本	3.10-3.13
CPU推理支持	✅	❌	❌
GPU要求	Turing及以后架构，6G显存以上或Apple Silicon	Ampere及以后架构，8G显存以上	Ampere及以后架构，24G显存及以上

参考上面官方推荐系统配置，本人电脑满足最低配置要求，coda安装过程

system-info

3.1 安装nvidia coda

CUDA官网下载地址我这里选择 Windows 11 64-bit，推荐 exe (network)或 exe (local)版本。
根据自己的window系统版本下载对应的安装包，双击安装包选择默认安装选项即可，安装后最后重启下系统。

3.2 替换torch相关依赖为coda版本

# 激活虚拟环境
.venv\Scripts\activate
# 下载cuda版本torch依赖
uv pip install torch==2.7.1+cu128 torchaudio==2.7.1+cu128 torchvision==0.22.1+cu128 --index-url https://download.pytorch.org/whl/cu128
# 检查torch、torchaudio、torchvision版本是否替换为cuda版本
uv pip list