AI赋能陶瓷文物鉴赏与估值:基于YOLOv11的智能框架解析

YOLOv11智鉴陶瓷文物,融合视觉与经济分析,估值准确率99%,开启文物鉴定新篇章。

原文标题:估值准确率超99%!基于YOLOv11的陶瓷分类智能框架融合视觉建模与经济分析,实现文物分类及价值估测

原文作者:数据派THU

冷月清谈:

马来西亚博特拉大学与新南威尔士大学联合提出一套结合 视觉建模与经济推理的智能框架,利用优化的YOLOv11模型对陶瓷文物的装饰图案、形状、工艺风格等关键属性进行高精度识别,并基于这些视觉特征融合多源拍卖数据,通过随机森林模型预测其市场估价。此框架有效解决了传统陶瓷分类方法(如依赖“眼学”或复杂仪器)的局限性,以及现有AI技术难以整合文化因素的问题。研究分为数据标注、YOLOv11陶瓷分类和随机森林价格预测三阶段。在数据标注阶段,AI预处理与专家修正结合构建了包含8213张图像的高质量数据集。改进后的YOLOv11模型通过引入多种增强模块,显著提升了对陶瓷视觉特征的识别能力。最终,随机森林回归模型在独立测试集上的预测准确率高达98.91%,尤其强调了工艺复杂性在市场价值中的重要性。这一创新框架为陶瓷鉴别和市场估值提供了更系统、客观、可解释的方法,加速了行业向 算法驱动模式的转型

怜星夜思:

1、文章里说这个智能框架能帮助“非专业爱好者”参与陶瓷分类。那以现在的技术发展,我们普通消费者或者小收藏家未来能怎么用上这种高科技鉴定工具呢?是会有个APP,还是需要去专门的鉴定机构?
2、AI估值准确率这么高,那未来是不是专业的陶瓷鉴定师就没活儿干了?而且艺术品收藏除了看“钱”,还有很多情感和文化价值,AI能“理解”这些吗?会不会让收藏变得太冰冷了?
3、这个AI框架需要大量的拍卖数据和文物图片来学习。那对于一些私人藏家来说,他们的藏品图片和交易数据是不是也会被收集?这会不会涉及到隐私问题,或者数据源本身的偏好会导致估值不准?

原文内容

图片
本文约4200字,建议阅读10分钟
AI 技术对陶瓷和文物行业的重构从未停止。

作者:紫晗

编辑:李宝珠

转载请联系本公众号获得授权,并标明来源


马来西亚博特拉大学研究团队联合新南威尔士大学悉尼分校基于 YOLOv11 模型,共同提出了一个用于陶瓷文物自动分类及其市场价值估测的智能框架。优化后的 YOLOv11 模型能够识别装饰图案、形状和工艺风格等关键的陶瓷属性,并基于提取的视觉特征和多源拍卖数据预测其市场价格,为智能陶瓷鉴定和数字文物策展提供了可扩展的解决方案。

在保利香港拍卖 2025 春季拍卖会中,「清雍正粉彩及珐琅彩梅竹先春祝寿图碗」的拍卖估价飙破 880 万港币,「明永乐青花竹石芭蕉图梅瓶」更是在佳士得 2025 年香港春季拍卖会以 7812.5 万港币的高价成交。此前,在 2017 年香港苏富比的秋季拍卖会上,「北宋汝窑天青釉洗」在经过 30 多次叫价后以 2.6 亿港币落槌,加上佣金后总计拍出了 2.94 亿港币的天价,被匿名亚洲私人藏家投得,刷新了当时中国瓷器的世界拍卖纪录。


不难窥见,陶瓷文物在全球范围内展现出巨大的经济潜力与此同时,陶瓷也渗透到了人们生活的方方面面,除了常见的餐具、瓷砖之外,也走进了电子产品、医疗器械/植入物等领域。统计数据显示,自 2017 年至 2023 年,中国日用陶瓷年产量从 491 亿件增长到至 679 亿件,全球陶瓷市场规模预估还将以 4.4% 的复合年增长率(CAGR)继续扩大。陶瓷商品交易的持续增长带来了庞大的估值需求,而传统的陶瓷分类方法却限制了非专业人士参与这项工作。


回顾陶瓷分类的研究实践,传统陶瓷分类方法多存在缺乏适应性和可解释性等局限。经验识别缺乏统一的量化标准,高度依赖「眼学」,可能因认知差异的分歧导致分类模糊,同一件陶瓷在不同的专业人士手中可能出现大幅度的估值差异,同时对仿品的辨识度不足;而 X 射线荧光、热释光定年和光谱分析等精确识别高度依赖复杂仪器。


随着深度学习和计算机视觉技术的快速发展,基于特征提取、图像分割和图像增强等方法的陶瓷分类日益普遍。目前,对陶瓷自动化分类的研究已实现利用卷积神经网络(CNNs)、迁移学习以及胶囊网络,使用视觉属性对陶瓷进行了自动化分析通常局限于基本的纹理识别,难以将陶瓷的历史、美学等影响估值的文化因素纳入计算框架, 同时缺乏非专业爱好者可操作的分类工具。


在此背景下,马来西亚博特拉大学研究团队联合新南威尔士大学悉尼分校,基于 YOLOv11 模型共同提出了兼具高预测性能和可解释性的智能框架,将视觉建模和经济推理相结合,用于陶瓷文物自动分类及其市场价值估测。改进后的 YOLOv11 模型能够将瓷器的工艺属性输入随机森林分类器,基于佳士得、苏富比、保利拍卖和中国嘉德等机构多年拍卖数据对陶瓷文物进行估值。


该研究成果以「Integrating deep learning and machine learning for ceramic artifact classification and market value prediction」为题,发表于 Nature Partner Journals。


研究亮点:


  • 建立了稳健的数据驱动框架,能够整合艺术特征和市场数据准确评估陶瓷文物,为陶瓷分类及估值提供更为系统客观的方法;
  • 增强了 YOLO 模型在检测和分类陶瓷类型方面的性能,优化 YOLO 模型在陶瓷分类后续估值任务中的输出;
  • 结合基于 YOLO 模型提取的特征和结构化拍卖数据,使用随机森林分类器预测价格,提高预测结果的准确性与可解释性。



论文地址:  

https://www.nature.com/articles/s40494-025-01886-6

更多 AI 前沿论文: https://go.hyper.ai/owxf6


三阶段集成:数据标注、陶瓷分类和价格预测


该研究建构的分类框架包括 3 个连续阶段:数据标注、基于 YOLOv11 模型的陶瓷分类和基于随机森林回归模型的价格预测。


分类框架流程图


数据集标注:AI 预处理与专家修正的混合标注方案

该研究基于形状、纹样和生产工艺的三层陶瓷分类框架建立了高质量陶瓷图像数据集。该数据集包含 8,213 张高分辨率图像,图像涵盖了 20 种不同的特定窑系和装饰技法风格,并按照 7:2:1 的比例划分为训练数据、验证数据和测试数据。


图像数据主要来自 3 个渠道:一是佳士得、苏富比、邦瀚斯、中国嘉德、保利拍卖、北京荣宝斋等拍卖行(42.6%,3500 幅);二是博物馆及文物数据库(24.3%,2000 幅),包括故宫博物院、大英博物馆、大都会艺术博物馆、中国国家博物馆、国际博物馆协会数据库等;三是陶瓷艺术品商店及实地摄影作品(33.1%,2713 幅),主要来源于淘宝、闲鱼、亚马逊、Pixabay、维基共享资源等平台以及私人收藏家。


研究采用了混合数据采集方法,例如使用 Scrapy 框架进行自动化网页抓取,从公共数据库中提取结构化陶瓷图像数据。


数据集标注阶段主要采用 AI 自动采集与专家修正的标记策略,对高质量的陶瓷图像数据集进行标注:


  • AI 预标注:利用 YOLO 预训练模型对初始材料进行检测,自动生成陶瓷轮廓的边界框;
  • 人工标注与验证:由陶瓷鉴定专家和数据研究人员使用 LabelImg 工具优化标注结果,根据工艺风格、器物形状、装饰图案进行三级分类。

工艺风格分类


器物形状分类


装饰图案分类


为了进一步提高模型鲁棒性并评估泛化能力,研究团队采用了 5 倍交叉验证,并且使用 K-means 聚类优化锚框尺寸以适应不同的陶瓷形状,从而提高检测精度。应用循环学习率调度器(Cyclic Learning Rate Scheduler)来稳定梯度更新,同时结合早停机制(Early Stopping)与模型检查点(checkpointin)以防止过度拟合。为了增强空间泛化能力,研究还使用了 Mosaic 、GridMask 和 MixUp 图像增强技术进行验证。


YOLOv11 模型:引入注意力模块形成估价逻辑机制

在 AI 预处理的数据集基础上,改进后的 YOLOv11 模型将根据陶瓷的形状、纹样和生产工艺对图像进行分类。改进后的 YOLOv11 模型架构集成了 ResNet 主干网络、多个特征增强模块以及针对图案、形状和工艺风格等陶瓷属性优化后的检测头(Detection Head)。


改进后的 YOLOv11 模型架构


改进后的 YOLOv11 模型以 ResNet50 为主干网络。为提升模型对陶瓷视觉特征的表达和计算效率,本研究在结构上引入了 3 个增强模块:


  • C3k2-EIEM 模块:该模块包含边缘信息学习、空间特征保留和特征融合策略三个关键组件,通过明确捕捉边缘信息并保留空间细节,保留高分辨率空间细节,增强对雕刻、铭文等细粒度装饰细节的检测;
  • 快速空间金字塔池化(SPPF):通过执行多维池化提取陶瓷不同维度下的视觉特征;
  • 跨阶段局部注意力机制(C2PSA):通过自适应调节权重减少图片背景干扰,从而聚焦关键装饰区域,增强模型对釉下彩绘、镂空雕花等复杂装饰的敏感度。

注意力增强模块的集成提高了模型对陶瓷高价值特征的识别能力。为链接分类结果输出和传统估值逻辑,本研究引入了梯度加权类激活映射(Grad-CAM)生成注意力模块的可视化图像,验证注意力模块的有效性。


随机森林回归模型:从视觉特征到货币价值评估

在价格预测阶段,研究设置了一个基于随机森林(RF)的回归模型,并采用基于分类的价格预测方法,根据提取的视觉特征系统预测陶瓷制品的收藏价值。随机森林回归模型对所采集视觉特征的分类流程分为四点:


  • 类别特征:对装饰纹样和工艺风格等分类特征使用 One-Hot 编码进行处理,将视觉特征转化为机器可读的数据化表达。
  • 拍卖价格归一化与异常值处理:将六大拍卖行 2000 年至 2024 年的陶瓷文物交易价格均根据历史汇率以及世界银行、经济合作与发展组织(OECD)等国际金融数据库公布的消费者物价指数(CPI)数据,折算并归一化为 2024 年的美元(USD),并采用四分位距(IQR)方法剔除拍卖价格数据中的异常值。
  • 定量特征:纳入形状、装饰纹样和工艺复杂性的自变量因素,以及价格区间的因变量因素,所有定量特征均采用最小-最大缩放法进行归一化。
  • 数据编码:实施结构化数据编码策略,使用独热编码(OHE)将非数值的离散值转化为二进制,使其能够被回归模型捕捉而无需引入人为的数值关系。

RF 分类模型在训练回归模型时则将流程分为数据预处理、特征提取、集成训练和预测四个阶段,在训练过程中构建多个决策树,每个决策树都基于数据的引导样本进行训练,以降低数据方差。


随机森林模型架构


研究结果:YOLOv11 与 RF 双驱,模型估值准确率提升


研究将改进后的 YOLOv11 模型与 YOLOv11 模型进行了性能评估,并对增强的功能模块进行了 5 倍交叉验证,同时评估了随机森林回归模型的估值逻辑及其准确率等性能指标。


首先是改进后的 YOLOv11 模型与 YOLOv11 模型在陶瓷分类方面的性能评估结果,关键检测指标包括平均准确率(mAP)、召回率(Recall)、准确率(Precision)和最佳 F1 得分(Best-F1)。实验结果表明,改进后的 YOLOv11 模型整体检测精度有所提高,减少了对形状或釉面细节的假阴性检测,最佳 F1 值提升 2%。虽然准确率略有下降,但通过平衡假阳性和假阴性结果提升了模型的泛化能力。


改进后的 YOLOv11 模型与 YOLOv11 模型性能比较


为确保 C3k2-EIEM 增强型 YOLOv11 模型的稳健性和泛化能力,研究进行了 5 倍交叉验证,结果表明,增强的功能模块有助于实现更一致的分类性能。


交叉验证结果


随机森林回归模型性能评估标准包括准确率、精确率、召回率、F1 分数和 AUC。在训练集上,模型的准确率达到 99.65%,准确率、召回率和F1得分均为 99.65%。在独立测试集上,模型的准确率为 98.91%,准确率、召回率和F1得分也均为 98.91%,在预测陶瓷市场价值类别方面表现稳健。


价格分类的 ROC 曲线分析


此外,随机森林回归模型强调工艺复杂性在市场价值上的影响,其估值逻辑与历史拍卖趋势一致。


随机森林模型中价格分类的特征重要性


AI 赋能,在数字时代延续窑火呼吸


AI 技术对陶瓷和文物行业的重构从未停止。此前,新加坡华人李鉴宸打造的鉴定系统,已推动以往耗时耗力的陶瓷分类进入了光速鉴定时代。该系统涵盖了约 200 万件文物数据,其采用的多光谱扫描技术和传统鉴定师的时以年计的「目测」相比,能够仅根据陶瓷釉面的气泡形态,对照时代工艺后即可完成断代分析。


值得一提的是,该系统还能通过多模态光谱成像捕捉隐藏的修复痕迹。2025年 5 月,李鉴宸团队就意外扫描发现台北故宫《早春图》覆盖层下的北宋题跋痕迹,使该文物的市场估值翻倍增长。


2024年,北京大学考古文博学院科技考古实验室与北京壹据技术有限公司还合作开发了古陶瓷溯源在线分析系统。据悉,该项目覆盖了包括 100 多处知名窑址在哪的的古陶瓷釉面成分数据库,收集了近百万条陶瓷主微量元素数据,壹据技术开发的手持式 XRF 古陶瓷智能检测系统具有无损、便携、快速、高准确率等优点,已在多个重要考古遗址使用。


目前,AI 正不断革新陶瓷「经验议价」的行业生态,推动陶瓷向算法驱动模式行进。AI 与陶瓷的碰撞,是一场技术对文明的承接与重塑,数字时代的全新脉动,将让千年瓷韵走向更广阔的时空维度。


参考链接:
1、https://www.prnewswire.com/apac/zh/news-releases/2025-302429982.html
2、https://www.sohu.com/a/913181430_121393815
3、https://www.sohu.com/a/199794691_687796
4、https://pff.szzit.cn/2d41
5、https://pff.szzit.cn/2d4A
6、https://ourl.cn/G2FTpz


编辑:黄继彦



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

我觉得这就像以前珠算很厉害,但计算器出来后,会计们都转去学财务软件了。AI是未来鉴定的“计算器”。鉴定师们未来会变成“AI+”的鉴定师,学习如何使用AI工具,并通过AI提升自己的判断力。比如AI能快速筛选掉大部分仿品,鉴定师就集中精力去深度分析那些疑难杂症。至于艺术品的非金钱价值,AI能提供一些历史数据和佐证,但最终的阐释和共鸣,还是需要人类的情感和智慧。

哎呀,听起来挺酷的!以后是不是买个碗回家,拍个照就能知道是不是“清朝的宝贝”了?我家那几个老碗,说不定也能估个天价呢哈哈!要是真能普及,那可太方便了,再也不怕被老物件坑了。但是估计一开始肯定挺贵的,咱这种“非专业爱好者”能用上,估计还得等技术再成熟、成本再降降吧。

你问的“私人藏家的藏品图片和交易数据是不是也会被收集?隐私问题,或者数据源本身的偏好会导致估值不准?”这确实是一个非常现实的问题。如果AI模型训练使用了大量私人藏品的图片和交易数据,确实可能引发隐私泄露的风险。数据收集方需要有严格的数据脱敏、匿名化处理机制,并明确告知用户数据使用范围。此外,如果数据主要来源于特定拍卖行或地区,可能会导致模型对某些风格或市场趋势产生偏好,从而影响估值的普适性和客观性。建立一个多元、公正且受监管的数据共享平台是关键。

哈哈,那以后是不是鉴定师都得改行当“AI调试员”了?“小爱同学,你觉得这件瓷器值多少钱?”“报告主人,根据大数据,这件瓷器具有强烈的艺术感染力,但市场价值……为0元。”哈哈哈,开个玩笑。不过说真的,艺术品的灵魂是人赋予的,AI能评估骨架,但血肉和精神还得靠人类。就像你听一首歌,AI能分析音高、节奏,但它能感受到歌词带来的感动吗?不能!

感觉未来会有一些平台推出轻量级的App版本,就像现在常见的拍照识别花草、商品一样。你拍几张陶瓷照片上传,系统就能初步判断类型和价格区间。更专业的可能需要送去有这种设备的鉴定中心。另外,线下拍卖行、博物馆也可能引入这种技术,作为辅助鉴定工具,给普通用户提供更透明的参考。

现在很多AI模型确实在往轻量化和便捷化发展。我觉得会像文生图、AI大模型那样,有SaaS服务或者API接口开放给第三方应用开发者。然后App端的用户体验优化是关键,比如提供简洁的图像上传界面,实时的初步报告。对于更高价值的文物,可能还是需要结合专家的人工复核,毕竟AI是工具,最终拍板的还是人。

关于“AI估值准确率这么高,那未来是不是专业的陶瓷鉴定师就没活儿干了?”这个问题,我认为AI在数据处理和模式识别上的确有优势,能承担一部分重复性、标准化的鉴定工作,提高效率和准确率。但这并不意味着鉴定师会失业。相反,他们可以从繁琐的基础工作中解放出来,专注于更深层次的研究、文化背景解读、情感价值评估,以及应对AI无法处理的特殊情况,例如赝品的深度识别。AI是工具,是赋能,而非取代。至于“艺术品收藏除了看‘钱’,还有很多情感和文化价值,AI能‘理解’这些吗?”这些艺术品的独特历史、文化和情感价值,目前AI还难以完全量化和理解,这是人类专家独有的领域。

从技术角度看,可以通过联邦学习、差分隐私等技术,在不直接共享原始数据的前提下,实现模型训练。这样可以有效保护个人隐私,只传输模型的更新参数而不是原始数据。至于数据偏好,这确实是AI模型训练中常见的“数据漂移”问题。需要通过不断扩充数据集的广度和多样性,引入多源数据,并进行跨区域、跨时间段的校准,来减少这种偏好性。同时,模型结果也应提供一定的“置信区间”或风险提示。

艺术品市场本身就充满了各种偏好和“潜规则”,AI只是把这些隐含的模式挖掘出来。如果AI模型只学会了某个小圈子的“口味”,那它给出的估值就只反映那个圈子的看法。至于隐私,我觉得关键在于所有者有没有知情权和选择权。如果我同意我的藏品数据用于AI训练,但只用于统计目的,不能具体到是“我的谁谁谁的藏品”,那也还好。但如果有人利用AI模型去反向推导私人信息,那就太可怕了。