[研报PDF] 电子行业:预训练跨模态模型日趋成熟,智能物联AIoT行业有望受益

>>查看PDF原文

  核心观点

  预训练模型引发 AIGC 质变,多模态技术实现多样性。 ChatGPT 的持续升温使人们关注到了 AIGC 的突破性进展,其中预训练模型和多模态技术功不可没。预训练模型,又称为大模型、基础模型( foundation model),即基于大量数据(通常使用大规模自我监督学习)训练的、拥有巨量参数的模型,可以适用广泛的下游任务。多模态技术推动了 AIGC 的内容多样性,让 AIGC 具有了更通用的能力,多模态即图像、声音、语言等融合的机器学习。在多模态技术的支持下,目前预训练模型已经从早期单一的 NLP 或 CV 模型,发展到现在语言文字、图形图像、音视频等多模态、跨模态模型。在此基础上,大型预训练模型的发展重点开始向横跨文本、图像、语音、视频的全模态通用模型发展。通过计算策略、数据调用策略、深度学习框架等方法提升模型效果成为目前研究的进展关键,其中的代表包括:开启了跨模态预训练模型的 Open AI DALL·E 及 CLI、 NVDIA GauGAN2、微软及北大 NüWA女娲、 NVIDIA POE GAN、 DeepMind 的 Gato 等。

  中国 AI+安防行业进入精细化发展阶段。 2020 年中国 AI+安防软硬件市场规模达453 亿元,艾瑞预测, 2021-2025 年市场进入产业结构调整期,市场增速将放缓,预计 2025 年规模超 900 亿元, AI 开始向公安交通等场景的下沉市场以及泛安防的长尾细分领域渗透,发展模式由过去粗放上量转变为精细化升级改造。在过去几年,人工智能与安防结合的热度很高,但仍存在算法场景限制高、深度应用不足等限制和问题。

  大型跨模态预训练模型有望突破 AI+安防行业瓶颈。 根据安防+AI 人工智能工程化白皮书,视频监控系统产生的数据量庞大,而且日趋多元化,包含非结构化数据、半结构化特征数据以及结构化数据。当前的人工智能视频大数据分析技术主要存在如下几个问题: 1)非卡口场景的视频分析算法在准确率、稳定性及计算成本等核心指标方面还有待于提高,导致非卡口场景的存量视频利用率极低,目前没有有效利用的非卡口监控视频约占监控视频总量的 97%左右; 2)智能 AI 摄像机及视频结构化分析产品开始进入安防市场,产生了海量的结构化视频数据,但基于结构化视频数据的深度智能应用,如时空分析、模式挖掘、预测预警、技战法训练等尚在探索阶段,有可能形成新的数据浪费和低效投资。目前 AIGC 高质量内容产出的背后是大型跨模态预训练模型的成熟,未来随着该模型算法在智能安防和智能物联 AIoT 等领域的渗透落地,行业整体视频识别算法的准确性、可靠性、应用广泛性将有望提高。

  投资建议与投资标的

  看好具备软硬件基础和优异的 AI 落地能力的智能物联 AIoT 龙头厂商有望受益于 AI技术的持续进步, 维持推荐海康威视、 大华股份。

  风险提示

  技术渗透不及预期; 相关公司大模型算法研发及应用进展不及预期;高算力芯片采购限制。

>>查看PDF原文

关于作者:

交易自己的交易,制定自己的交易。