投资事件:2023年3月14日,OpenAI发布大型多模态Transformer模型GPT-4。模型支持图片和文字输入,在视觉和文本结合的任务中展现了强大的理解力;模型在学术和职业能力相关测试中表现优异,在SAT的阅读理解考试中超越了93%的人类考生;GPT-4项目开发了深度学习Stack用于预测模型表现,能够用千分之一到万分之一的训练算力给出模型表现的准确预测结果。
GPT-4支持图像和文本的共同提示输入,拥有强大的视觉理解能力。GPT-4的视觉输入模式能够支持用户指定视觉或语言任务,可以对给出的图表和问题进行推理和解答,可以快速浏览图片格式的论文并给出概括,也可以识别梗图、漫画,甚至根据对于绘制的网页前端图片输出相应的网页代码。我们认为,这种计算机视觉的突破印证了大模型向多模态转变的必然趋势,展现了语言模型在多模态领域更强大的能力边界。未来随着人类对大模型能力的持续发掘,将能够在更多场景应用AI能力,多维赋能计算机、互联网、传媒、金融等领域,有望大幅提升生产力。
GPT-4在多个学术类测试集中跑出了SOTA结果,拥有更强大的创新能力。相比前代GPT,GPT-4在多个学术类测试中表现非常突出,在MMLU、HellaSwag、ARC等多个测试集跑出了SOTA结果。同时,在SAT阅读理解、LSAT等考试中也取得了超过93%、88%人类考生的成绩。我们认为,语言模型的聚焦方向或将从更通用转向更复杂和有针对性。随着未来更多应用场景需求的涌现,大模型针对特定任务的能力将不断提升,为AI应用开拓更广阔的应用空间。
OpenAI开发了深度学习堆栈,使用千分到万分之一的训练算力就能完成对GPT-4的表现预测,或将加速模型迭代和新技术落地速度。OpenAI表示,这种准确预测模型表现的能力是深度学习未来的方向,对于安全问题有着重要的意义。我们认为,随着大模型多维评价标准的持续完善和堆栈算法的发展,未来以小算力成本预测大模型表现的技术拥有很强的实用价值。类似技术有望大规模降低模型迭代的试错成本,或将加速模型迭代和相关技术落地的速度。
投资建议:我们认为GPT-4的发布印证了大模型向多模态转变的必然趋势,大模型的聚焦方向或将从更通用转向更复杂和有针对性。OpenAI提出的通过小算力来预测大模型表现的能力有很大应用价值,未来模型迭代速度有望加速,相关应用落地速度或超预期。建议关注模型层开发标的,如【科大讯飞】、【格灵深瞳】、【商汤-W】、【云从科技】;底层算力芯片和服务器等硬件支持标的,如【寒武纪】、【海光信息】、【浪潮信息】、【中科曙光】;数据标注和数据集建设标的,如【海天瑞声】;办公软件落地应用的相关标的,如【金山办公】、【万兴科技】、【宇信科技】、【彩讯股份】、【福昕软件】。
风险提示:相关技术落地不及预期,行业竞争加剧等