图片放大后模糊、噪点多、压缩伪影明显——这是许多人处理老照片、截图、动漫图时都会遇到的痛点。传统插值算法放大后边缘毛刺严重,付费商业软件价格又不菲。今天推荐一个完全免费开源的解决方案:Real-ESRGAN,来自腾讯 ARC Lab,GitHub 超过 34,900 颗星,是目前最流行的 AI 图像/视频超分辨率工具之一。

相关链接
- GitHub 仓库:github.com/xinntao/Real-ESRGAN(34.9k ⭐ | 4.3k Fork)
Real-ESRGAN 是什么
Real-ESRGAN 的全称是 Real-World Enhanced Super-Resolution GAN,由腾讯 ARC Lab(先进技术实验室)开发并在 GitHub 开源。项目基于经典的 ESRGAN 进行扩展,目标是训练一个能够处理真实世界退化图像的超分辨率模型。
与传统超分辨率方法不同,Real-ESRGAN 使用纯合成数据进行训练——通过模拟真实世界中图像常见的退化过程(模糊、噪声、JPEG 压缩伪影、缩放等)生成大量训练对,让模型学会在不需要事先知道退化类型的情况下”盲修复”各种低质量图像。
项目作者为 Xintao Wang(王欣涛)、Liangbin Xie、Chao Dong、Ying Shan,其中 Xintao Wang 同时也是开源工具箱 BasicSR 和人脸修复工具 GFPGAN 的作者,在图像修复领域有较高影响力。Real-ESRGAN 论文发表于 ICCV 2021。
核心功能
1. 多场景图像超分辨率
Real-ESRGAN 提供多个预训练模型,适用于不同场景:
| 模型名称 | 适用场景 | 放大倍数 | 说明 |
|---|---|---|---|
| RealESRGAN_x4plus | 通用图片 | 2/3/4/任意 | 默认主力模型,通用场景首选 |
| RealESRNet_x4plus | 通用图片 | 4 | Real-ESRGAN 的 RealESRNet 版本 |
| RealESRGAN_x4plus_anime_6B | 动漫插图 | 4 | 专为动漫优化,模型体积小(6B),效果优于 waifu2x |
| realesrgan-x4plus-anime | 动漫图片 | 4 | 动漫场景轻量版 |
| realesr-animevideov3 | 动漫视频 | 4 | 专门针对动漫视频的放大模型 |
| realesr-general-x4v3 | 通用场景(轻量) | 2/3/4 | 小模型,支持 -dn 参数调节降噪强度 |
2. 人脸增强(GFPGAN 集成)
在图像中存在人脸时,可以配合 GFPGAN 进行人脸细节增强。使用 --face_enhance 参数即可自动调用 GFPGAN 对修复后的人脸进一步美化,适合处理老照片、监控截图等包含人脸的低分辨率图像。
3. 视频超分辨率
除静态图片外,Real-ESRGAN 还支持视频放大。通过 inference_realesrgan_video.py 脚本,可对整个视频文件进行超分辨率处理,专用的 realesr-animevideov3 模型对动漫视频效果尤为突出。
4. 多种退化类型处理
Real-ESRGAN 训练数据涵盖了真实世界图像中常见的多种退化:
- 模糊:高斯模糊、运动模糊
- 噪声:高斯噪声、相机噪声
- JPEG 压缩伪影:低质量压缩产生的块效应和振铃效应
- 下采样:多种缩放比例
- Alpha 通道:支持透明通道图片
- 灰度图:支持单通道图像
- 16-bit 图像:支持 HDR 图像格式
5. 分块并行处理(Tile 模式)
对于超大分辨率图像,Real-ESRGAN 支持分块处理(Tile),避免显存不足的问题。图像被自动切割成多个小块分别处理,最后拼接成完整的高分辨率图像。
快速部署
方式一:Python 脚本(推荐有 PyTorch 环境的用户)
环境要求:Python >= 3.7,PyTorch >= 1.7
# 1. 克隆仓库
git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN
# 2. 安装依赖
pip install basicsr
pip install facexlib
pip install gfpgan
pip install -r requirements.txt
python setup.py develop
# 3. 下载预训练模型(通用图片)
wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P weights
# 4. 运行推理
python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs --face_enhance
输出结果默认保存在 results 目录。常用参数说明:
-n:选择模型(RealESRGAN_x4plus、RealESRGAN_x4plus_anime_6B 等)-i:输入图片路径或文件夹-o:输出路径--outscale:最终放大倍数,支持任意值(如 3.5),不只是 2/3/4--face_enhance:启用 GFPGAN 人脸增强--fp32:使用 FP32 精度(默认 FP16,半精度加速)
方式二:便携可执行文件(无需 Python/CUDA 环境)
如果你没有 Python 环境,或不想安装 PyTorch,可以使用官方提供的跨平台便携版(基于 NCNN + Vulkan),支持 Windows、Linux、macOS,Intel/AMD/Nvidia GPU 均可运行。
# Windows 示例
./realesrgan-ncnn-vulkan.exe -i input.jpg -o output.png -n realesrgan-x4plus
# 动漫图片专用
./realesrgan-ncnn-vulkan.exe -i anime.png -o anime_out.png -n realesrgan-x4plus-anime
# 指定放大倍数
./realesrgan-ncnn-vulkan.exe -i input.jpg -o output.png -s 2
注意:NCNN 便携版不支持 --outscale 等部分高级参数,且分块处理方式可能导致边缘略有接缝,这是技术限制,非 bug。
方式三:Huggingface Spaces 在线体验
零安装,浏览器直接使用:Real-ESRGAN on Huggingface Spaces
适用人群
- 摄影师和设计师:提升图片分辨率用于印刷或二次编辑
- 二次元爱好者:动漫插图、截图的 4 倍无损放大,AnimeVideo 模型对动漫视频效果出色
- 老照片修复:配合 GFPGAN 人脸增强,修复模糊的家庭老照片
- 视频内容创作者:提升素材分辨率,配合剪映/PR 使用
- 开发者和研究人员:基于 BasicSR 框架训练自己的超分辨率模型
- 监控/遥感图像处理:从低分辨率图像中提取更多细节
生态周边
Real-ESRGAN 影响力很大,围绕它已形成丰富的开源生态:
- Waifu2x-Extension-GUI:整合 Real-ESRGAN 的 Windows GUI 工具
- Upscayl:跨平台 AI 放大工具,内置 Real-ESRGAN
- Squirrel-RIFE:视频放大补帧工具
- RealSR-NCNN-Android:安卓手机端 AI 放大
- vs-realesrgan:VapourSynth 视频处理插件
总结
Real-ESRGAN 是一款从学术论文走向工程实践非常成功的开源项目。它解决了”真实世界图像退化”这一超分辨率领域的核心难题,通过纯合成数据训练的方式让模型具备真正的盲修复能力。项目配套完整——多种预训练模型满足不同场景、Python 和便携可执行文件两种部署方式、丰富的生态周边,34.9k 星的数据也证明了其社区认可度。
无论你是想放大一张模糊的旧照片,还是批量处理一批动漫视频素材,Real-ESRGAN 都是一个值得收藏进工具箱的免费开源方案。AnimeVideo-v3 模型的推出更是填补了动漫视频 AI 放大这一细分场景的空白,值得实测体验。
© 版权声明
本站部分内容源于网络收集,文章等版权归原作者所有,若需删稿请联系管理员邮箱:[email protected]
相关文章
暂无评论...