图像美学 / 画质评估 (多模型一站式)
4 个 Tab:📷 单图美学(TANet)|🎬 视频逐帧美学|📐 多模型对比(TANet+NIMA+LAION+MUSIQ+HyperIQA+CLIP-IQA)|📍 主体检测(U²-Net)
📌 模型分类:
- 美学(artistic):TANet、NIMA、LAION-Aes — 评艺术性 / 构图。LAION-Aes 是 SD 训练数据筛选用的那个。
- 画质(technical):MUSIQ、HyperIQA — 训练在 KonIQ-10k 失真图,评清晰度 / 没失真。
- 综合:CLIP-IQA — 基于 CLIP 的零样本评估。
- 主体显著性:U²-Net — 检测主体位置 / 大小 / 构图,剪辑刚需。
说明:受免费 CPU 算力限制,最多处理前 60 秒,按设定的采样 FPS 抽帧打分。建议先试 < 30 秒的短视频。
一张图 → 多个模型同时打分:横向比较「美学」(TANet, NIMA) 和「画质」(MUSIQ, HyperIQA, CLIP-IQA)。
⚠️ 第一次点击某个 pyiqa 模型时需要从远端下载权重 (100200MB),可能要等 1~3 分钟,之后就快了。 ⚠️ License 提醒:pyiqa 使用 PolyForm Noncommercial 协议,仅供非商业用途。
剪辑场景必备:检测画面里的主体(人/物/动物等任何前景显著物体),输出主体掩膜 + 主体面积占比、中心位置、三分法吻合度等量化指标。
用途举例:①素材库批量打标,做"主体大/居中"等筛选;②挑封面/转场关键帧;③区分空镜与人物特写。
模型:U²-Net 轻量版 u2netp (4.7MB) via rembg — Apache-2.0 / MIT,可商用。
核心模型:
- TANet (IJCAI 2022) — He, Zhang, Xie, Jiang, Ming. Beijing Univ. of Posts and Telecommunications. Apache-2.0.
- 多模型 IQA Tab 由 pyiqa (Chaofeng Chen) 提供 — PolyForm Noncommercial 1.0 + NTU S-Lab,仅供非商业用途。 其中:NIMA (Google 2017)、MUSIQ (Google 2021)、HyperIQA (CVPR 2020)、CLIP-IQA (AAAI 2023)、LAION-Aesthetic Predictor (MIT)。
TANet 原仓库: https://github.com/woshidandan/TANet-image-aesthetics-and-quality-assessment