[Github发现] Real-ESRGAN – 腾讯开源的通用图像/视频超分辨率工具

Github发现2026-03-31发布 WarpEdit
10 0 0

图片放大后模糊、噪点多、压缩伪影明显——这是许多人处理老照片、截图、动漫图时都会遇到的痛点。传统插值算法放大后边缘毛刺严重,付费商业软件价格又不菲。今天推荐一个完全免费开源的解决方案:Real-ESRGAN,来自腾讯 ARC Lab,GitHub 超过 34,900 颗星,是目前最流行的 AI 图像/视频超分辨率工具之一。

Real-ESRGAN 项目截图

相关链接

  • GitHub 仓库:github.com/xinntao/Real-ESRGAN(34.9k ⭐ | 4.3k Fork)

Real-ESRGAN 是什么

Real-ESRGAN 的全称是 Real-World Enhanced Super-Resolution GAN,由腾讯 ARC Lab(先进技术实验室)开发并在 GitHub 开源。项目基于经典的 ESRGAN 进行扩展,目标是训练一个能够处理真实世界退化图像的超分辨率模型。

与传统超分辨率方法不同,Real-ESRGAN 使用纯合成数据进行训练——通过模拟真实世界中图像常见的退化过程(模糊、噪声、JPEG 压缩伪影、缩放等)生成大量训练对,让模型学会在不需要事先知道退化类型的情况下”盲修复”各种低质量图像。

项目作者为 Xintao Wang(王欣涛)、Liangbin Xie、Chao Dong、Ying Shan,其中 Xintao Wang 同时也是开源工具箱 BasicSR 和人脸修复工具 GFPGAN 的作者,在图像修复领域有较高影响力。Real-ESRGAN 论文发表于 ICCV 2021。

核心功能

1. 多场景图像超分辨率

Real-ESRGAN 提供多个预训练模型,适用于不同场景:

模型名称 适用场景 放大倍数 说明
RealESRGAN_x4plus 通用图片 2/3/4/任意 默认主力模型,通用场景首选
RealESRNet_x4plus 通用图片 4 Real-ESRGAN 的 RealESRNet 版本
RealESRGAN_x4plus_anime_6B 动漫插图 4 专为动漫优化,模型体积小(6B),效果优于 waifu2x
realesrgan-x4plus-anime 动漫图片 4 动漫场景轻量版
realesr-animevideov3 动漫视频 4 专门针对动漫视频的放大模型
realesr-general-x4v3 通用场景(轻量) 2/3/4 小模型,支持 -dn 参数调节降噪强度

2. 人脸增强(GFPGAN 集成)

在图像中存在人脸时,可以配合 GFPGAN 进行人脸细节增强。使用 --face_enhance 参数即可自动调用 GFPGAN 对修复后的人脸进一步美化,适合处理老照片、监控截图等包含人脸的低分辨率图像。

3. 视频超分辨率

除静态图片外,Real-ESRGAN 还支持视频放大。通过 inference_realesrgan_video.py 脚本,可对整个视频文件进行超分辨率处理,专用的 realesr-animevideov3 模型对动漫视频效果尤为突出。

4. 多种退化类型处理

Real-ESRGAN 训练数据涵盖了真实世界图像中常见的多种退化:

  • 模糊:高斯模糊、运动模糊
  • 噪声:高斯噪声、相机噪声
  • JPEG 压缩伪影:低质量压缩产生的块效应和振铃效应
  • 下采样:多种缩放比例
  • Alpha 通道:支持透明通道图片
  • 灰度图:支持单通道图像
  • 16-bit 图像:支持 HDR 图像格式

5. 分块并行处理(Tile 模式)

对于超大分辨率图像,Real-ESRGAN 支持分块处理(Tile),避免显存不足的问题。图像被自动切割成多个小块分别处理,最后拼接成完整的高分辨率图像。

快速部署

方式一:Python 脚本(推荐有 PyTorch 环境的用户)

环境要求:Python >= 3.7,PyTorch >= 1.7

# 1. 克隆仓库
git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN

# 2. 安装依赖
pip install basicsr
pip install facexlib
pip install gfpgan
pip install -r requirements.txt
python setup.py develop

# 3. 下载预训练模型(通用图片)
wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P weights

# 4. 运行推理
python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs --face_enhance

输出结果默认保存在 results 目录。常用参数说明:

  • -n:选择模型(RealESRGAN_x4plus、RealESRGAN_x4plus_anime_6B 等)
  • -i:输入图片路径或文件夹
  • -o:输出路径
  • --outscale:最终放大倍数,支持任意值(如 3.5),不只是 2/3/4
  • --face_enhance:启用 GFPGAN 人脸增强
  • --fp32:使用 FP32 精度(默认 FP16,半精度加速)

方式二:便携可执行文件(无需 Python/CUDA 环境)

如果你没有 Python 环境,或不想安装 PyTorch,可以使用官方提供的跨平台便携版(基于 NCNN + Vulkan),支持 Windows、Linux、macOS,Intel/AMD/Nvidia GPU 均可运行。

# Windows 示例
./realesrgan-ncnn-vulkan.exe -i input.jpg -o output.png -n realesrgan-x4plus

# 动漫图片专用
./realesrgan-ncnn-vulkan.exe -i anime.png -o anime_out.png -n realesrgan-x4plus-anime

# 指定放大倍数
./realesrgan-ncnn-vulkan.exe -i input.jpg -o output.png -s 2

注意:NCNN 便携版不支持 --outscale 等部分高级参数,且分块处理方式可能导致边缘略有接缝,这是技术限制,非 bug。

方式三:Huggingface Spaces 在线体验

零安装,浏览器直接使用:Real-ESRGAN on Huggingface Spaces

适用人群

  • 摄影师和设计师:提升图片分辨率用于印刷或二次编辑
  • 二次元爱好者:动漫插图、截图的 4 倍无损放大,AnimeVideo 模型对动漫视频效果出色
  • 老照片修复:配合 GFPGAN 人脸增强,修复模糊的家庭老照片
  • 视频内容创作者:提升素材分辨率,配合剪映/PR 使用
  • 开发者和研究人员:基于 BasicSR 框架训练自己的超分辨率模型
  • 监控/遥感图像处理:从低分辨率图像中提取更多细节

生态周边

Real-ESRGAN 影响力很大,围绕它已形成丰富的开源生态:

  • Waifu2x-Extension-GUI:整合 Real-ESRGAN 的 Windows GUI 工具
  • Upscayl:跨平台 AI 放大工具,内置 Real-ESRGAN
  • Squirrel-RIFE:视频放大补帧工具
  • RealSR-NCNN-Android:安卓手机端 AI 放大
  • vs-realesrgan:VapourSynth 视频处理插件

总结

Real-ESRGAN 是一款从学术论文走向工程实践非常成功的开源项目。它解决了”真实世界图像退化”这一超分辨率领域的核心难题,通过纯合成数据训练的方式让模型具备真正的盲修复能力。项目配套完整——多种预训练模型满足不同场景、Python 和便携可执行文件两种部署方式、丰富的生态周边,34.9k 星的数据也证明了其社区认可度。

无论你是想放大一张模糊的旧照片,还是批量处理一批动漫视频素材,Real-ESRGAN 都是一个值得收藏进工具箱的免费开源方案。AnimeVideo-v3 模型的推出更是填补了动漫视频 AI 放大这一细分场景的空白,值得实测体验。

© 版权声明

相关文章

暂无评论

none
暂无评论...