联想勇夺零样本实例检测大赛全球冠军 大幅提升AI泛化能力

2023-08-08 18:00:00 0浏览

tlkwp2h4r3e4jbtccjnqphxbthvwch907749.gif

日前,在人工智能与计算机视觉领域中的顶级学术会议——国际计算机视觉与模式识别会议(以下简称“CVPR”)CVPR 2023 Workshop零样本实例检测大赛中,联想-交大联合团队凭借最佳模型性能与测试结果勇夺冠军。

k2ovweiognf2x6tvqf41rta6u1aogr061376.jpg

CVPR是全球计算机视觉三大顶级会议之一,覆盖最前沿的图像处理、机器学习、人工智能等多个领域的交叉学术交流,收录了最新的科研成果和技术发展趋势,在全球学术界与工业界均有广泛影响力。零样本实例检测挑战大赛正是CVPR 2023 Workshop最具挑战性的竞赛任务之一。

联想-交大联合团队在全球顶级挑战赛中摘得桂冠,不仅是联想与上海交通大学产学研合作的阶段性成果,更体现了联想在AI视觉领域,尤其是零样本学习方面全球领先的技术实力。

z29vaeiqye6ax9rm0eiqpfxlu9kkuo866161.jpg

据悉,此次零样本实例检测挑战赛聚焦的零样本学习是AI领域重要研究方向之一,主要是为了解决AI模型训练中数据缺失的问题。众所周知,AI技术的发展离不开海量数据“投喂”。但现实世界中,很多情况下无法获取标注数据,或者获取标注数据的成本非常大。如何在数据样本较少,甚至0样本的情况下高效训练模型一直是一个重要课题。

we8hwsf0m74chnlbw2mfsr6bp8thyr600452.jpg

为此,业内提出了小样本学习和零样本学习这两种策略。小样本学习通过学习少量样本的特征来实现对新样本的识别或分类,而零样本学习则更进一步,要求模型在没有见过目标实例的情况下,通过更高层次的抽象理解和推断能力,实现对全新物体的识别或分类。以工业质检为例,小样本学习可以通过少量问题样本快速生成相应的质检模型,而零样本学习则可以识别出从未出现过的质量问题。

目前全球火爆的大模型,正是零样本学习的典型应用之一。大模型通过在海量的文本数据上进行预训练,“学会”了如何理解和生成自然语言,以及如何从其训练数据中推断出一般性知识。因此,即使在训练期间没有明确地看到过某个问题或答案,GPT-4也能够生成合理的回答。

由此我们可以看出,具备更强“抽象理解”能力的零样本学习,能有效提升算法模型的泛化能力,进而提高了AI在实际生产生活场景中的实用性和适应性。

t2nopxusjnqrpzgi55c09e3wj4hm5a523005.jpg

目前,AI正在重塑千行百业,大量全新类型的数据加速涌现,这也给零样本学习技术带来了广阔的应用空间。尤其是在靠近数据产生源头的边缘侧,零样本检测算法经过适当工程化,可以满足几乎所有全新物体检测及分类需求,大幅提升边缘侧智能化水平。

以智能制造为例,在工厂流水线中,同种工件的不同部位可能存在多种异常情况,若对每一种异常情况的组合同时进行学习并分类辨别,不仅数据标注成本很高,部署效率也非常低下。而通过零样本实例检测,能够自动实现对这些部件异常的检测和识别,从而提高生产效率、产品质量和工作安全。

1zdtyakf89lcjx5fnncwtxjm7q8be8428573.jpg

而在智能驾驶场景中,由于路面交通的复杂性,算法模型在预训练过程中无法100%学习到可能对驾驶造成干扰的物体与路面情况。这时,零样本物体检测就可以通过抽象理解与推理能力,及时理解并判断出新的交通威胁,为人们的出行带来更多安全与便利。

不仅如此,在智能家居、智慧医疗等智能边缘场景中,零样本学习技术均可以通过对“新物种”的快速学习与识别能力,进一步拓宽AI应用场景,提升AI落地效率。

8bt0tpcqh5v0sn5mcpcxybhci7eyzh898460.jpg

作为中国领先的科技制造企业与主力智能解决方案提供商,联想早已在边缘智能领域强势布局,打造了包含边缘智能产品、边缘云、edge AI与行业应用的领先边缘生态,此次全球夺冠的零样本学习技术,对于提升联想整体边缘生态技术实力与智能化水平有所助益。

在领先的智能边缘生态支撑下,联想不断提升自身智能化水平的同时,还打造了一系列智能边缘解决方案,助力提速中国企业智能化转型进程。

以联想工业智慧眼解决方案为例,它是基于边缘计算设备与视觉智能监测算法,围绕工厂生产工艺流程,提供人员、物料、工序的图像识别、预警和联动系统,通过安装在工厂作业现场的各监控“眼”,实现对人员、设备、原料、环境的全方位实时监督,厂间瑕疵一目了然。一旦发现问题还将立即触发预警响应,真正做到事前预警,事中常态检测,事后规范管理,有效实现保生产、管人员的目标。

mrxrudxrdq3kj5mvupgnd6i8sknfbv871158.jpg

在联想与业内高端跑车和赛车制造商吉利路特斯合作的AI视觉检测项目中,路特斯的每辆车都采用定制化生,客户下单前要选车型选配置,每个部件都有多种配置,同类部件在尺寸、颜色、安装要求等方面各不相同。联想为其部署的的“智慧眼”AI视觉自动检测智能应用方案,通过视觉检测的方式代替人工目检,对汽车的动力系统、外观配件、内饰架构等多个单元进行综合质检,杜绝错装漏装,保证生产质量和质检效率。

qoa756rdsd5vjtl2qlrwwxdzywwq6e868875.jpg

客户现场建设前期只有少量负样本,存在严重的正负样本不均衡问题,需要长期的数据积累来训练可用的算法模型。发挥基于联想强大科技实力下的技术优势,融合传统视觉和深度学习技术,快速启动,分阶段执行实现半人工异常检测到无人化全自动检测的升级,并针对One-Shot目标检测和小目标检测算法进行深度优化。成功解决车型适配、人员遮挡和关键帧算法等多个关键应用问题,实现产线不停顿检测,保障了品控,同时缩短了检测时间,提高检测效率。

这只是联想AI技术实力的一个缩影。目前,联想已经构建了“端-边-云-网-智”新IT全栈AI能力,源源不断向各行业企业输送智能生产力,促进AI创新成果与各产业深度融合。

f9j62h1vvfh47jkfhdhu2p64vm9eb7441717.jpg

新一轮技术变革下,以AI为基础的智能化转型已经成为企业高质量发展的利器。联想以不断精进的AI全栈技术,不断强化AI赋能的产品、方案和服务,加速各行业企业的智能跃升,助力中国企业领跑智能化时代。

一起发现更好的联想

ONE LENOVO

cm60kb6innofar0lpu0reosqs9vy3m407201.jpg