「引语」
DeepSeek新模型春节以来引发全球关注,相关热潮带动中国科技资产重估和成长行情的扩散。近期TMT板块交易额占比重回40%关口,本期投资笔记,嘉实大科技投资团队分享相关产业影响与投资线索观点。
过去两年,科技领域最大的变化是AI的迅猛发展;而过去两个月,AI领域最大的变化是中国初创公司DeepSeek带来的产业催化。随着近期TMT板块交易额占比重回40%关口,科技投资有哪些变与不变?
01
过去半年,AI产业的重点变化
AI产业的发展,主要围绕三大核心要素展开:算力、模型和应用。三大要素相辅相成、相互促进,共同推动着AI产业的快速发展。算力是基石,算力的进步会促进模型和应用的性能提升、成本下降;更好的模型能够带来更好的应用效果,应用的爆发又会反向拉动算力的需求和模型能力的优化。
不同阶段,三者的进展速度会有所差异。ChatGPT出圈以来的两年中,AI产业的进展更多集中在模型和算力方面,大家从“千模大战”、AI算力的行情上都可以感知到;而从2024年下半年开始,模型和应用的变化则更为显著,全球都在寻求应用产品落地,同时探索构建商业变现闭环。
过去半年,AI应用产品化和商业闭环都取得了边际进展。
模型方面: 模型决定了 AI 能力的天花板。从基模型到垂类模型都在持续探索AI能力边界。
产品化方面: 涌现出各种产品形态,包括 ToC/ToB、云端/终端、AI原生应用/AI赋能的传统应用。
商业闭环方面: 探索出多种盈利模式,包括会员订阅、广告、卖流量、软件模块销售以及硬件销售等。
从全球模型进展来看,第一,去年大语言预训练模型和多模态应用的发展暂未达到去年初预期的速度。
2024年年初,市场普遍预期GPT-5会很快发布,但直到年底也未能见到其身影,大语言模型预训练放缓;多模态模型的发展也低于预期,2024年2月Sora的demo发布时曾引起广泛关注,但直到12月才正式商用,业界期待的世界模型、原生多模态等也还未实现。
第二,既然预训练和多模态进展放缓,过去一年业界在忙什么?答案是深度推理。
如果说预训练模型思路是加大算力、加大参数,努力让模型的“大脑”更聪明;以GPT-4o1为代表的模型新思路是深度推理模型,引导模型在推理过程中一步步思考、自我优化答案,提升准确度,从而在综合推理能力上实现持续提升,在数学、代码、科研等领域的能力持续提升。明确模型的进步路径后,全球头部玩家大模型的差距在缩小,逐步在GPT-4/4o1这个层级上快速追平。
第三,模型降本、效率提升速度要比想象中更快。AI模型的训练和推理成本在过去18个月里大幅下降了1-2个数量级。以GPT-4作为标杆模型来看,训练该模型所需的算力集群从4万张卡,陆续降低到1万多张卡,而DeepSeek的V3版本仅需2000张卡。这种成本的大幅下降为AI应用的广泛落地提供了有力支持。
02
DeepSeek崛起带来的影响
结合上述变化,我们再来看国内模型DeepSeek的新突破为什么重要。
DeepSeek推出的R1和V3模型在性能和成本上都取得了重大突破,引发了全球科技产业的高度关注。如果说去年年初判断国内模型与海外模型的差距在6- 12个月。如今,差距已缩小到3个月。
从性能上看,R1的深度推理能力成为全球最接近OpenAI GPT-4o1的模型,大幅超过了其他竞争对手。虽然在幻觉等方面仍有不足,但其整体性能已经非常接近行业领先水平,同时在中文对齐方面表现出色,文本逻辑性优于其他模型,尤其擅长生成具有情感色彩和逻辑连贯性的文本,这使其在中文应用场景中具有独特优势。
从成本上看,DeepSeek的模型在训练成本上大幅降低。与OpenAI的同代际模型相比,DeepSeek的模型训练和推理成本又实现了不同程度的下降。这种成本优势使得DeepSeek的模型在全球范围内具有更强的竞争力,能够以更低的成本提供高性能的AI服务。
此外,DeepSeek将模型开源,意味着全球开发者都可以免费使用和修改这些模型,这将进一步加速AI应用的落地和创新,提升开源生态的产业影响力。
DeepSeek的崛起对全球AI产业格局产生了深远影响,国内模型在基础能力上相较海外加速收窄,成本、工程优化方面领先于海外,国产AI的快速进步非常亮眼。此次DeepSeek作为中国厂商推动开源模型的发展,也引起了全球科技巨头的重视,中国在AI领域的技术实力得到了全球认可。
R1的出圈证明了我们之前微观上看到的产业趋势——当大集群预训练放缓,模型进步开始依赖人才流动、工程化、数据质量的时候,中国会大幅收窄和海外的差距。R1的出现不是偶然,从底层逻辑看,卷工程、卷数据、卷人才,中国从来不会输。
03
细分投资线索展望
DeepSeek热点引起了业界对AI各子线索的重视,性能提升、成本下降将总体利好应用落地,也为科技产业带来新的投资机遇。
应用线索中,软应用的AI Agent,终端中的AI手机、AI眼镜、AI玩具、智驾、机器人等,可能都会在DeepSeek的推动下加速落地;算力线索中,国产算力、国产先进制程也会看到持续突破。
在未来,AI应用的落地场景将越来越广泛,从软件应用到硬件终端,从软件Agent到智能驾驶,AI技术将为各个领域带来新的变革和机遇。
我们认为中国科技资产充满机会,核心线索是AI的云到端,国内科技巨头可能引领一轮新的科技创新周期。结合中国自身的制造业优势,在围绕云端的国产算力、围绕终端的自动驾驶和AIOT、围绕科技自强的半导体高端突破,存在着持续的投资机会。我们将不断寻找产业变革带来的基本面超预期资产,挖掘科技投资精彩机遇!
注:仅为拟任基金经理当前市场观点,不代表产品未来必然投资方向。
风险提示:基金投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。过往业绩不预示其未来业绩,其他基金业绩不构成本基金业绩的保证。
「引语」
DeepSeek新模型春节以来引发全球关注,相关热潮带动中国科技资产重估和成长行情的扩散。近期TMT板块交易额占比重回40%关口,本期投资笔记,嘉实大科技投资团队分享相关产业影响与投资线索观点。
过去两年,科技领域最大的变化是AI的迅猛发展;而过去两个月,AI领域最大的变化是中国初创公司DeepSeek带来的产业催化。随着近期TMT板块交易额占比重回40%关口,科技投资有哪些变与不变?
01
过去半年,AI产业的重点变化
AI产业的发展,主要围绕三大核心要素展开:算力、模型和应用。三大要素相辅相成、相互促进,共同推动着AI产业的快速发展。算力是基石,算力的进步会促进模型和应用的性能提升、成本下降;更好的模型能够带来更好的应用效果,应用的爆发又会反向拉动算力的需求和模型能力的优化。
不同阶段,三者的进展速度会有所差异。ChatGPT出圈以来的两年中,AI产业的进展更多集中在模型和算力方面,大家从“千模大战”、AI算力的行情上都可以感知到;而从2024年下半年开始,模型和应用的变化则更为显著,全球都在寻求应用产品落地,同时探索构建商业变现闭环。
过去半年,AI应用产品化和商业闭环都取得了边际进展。
模型方面: 模型决定了 AI 能力的天花板。从基模型到垂类模型都在持续探索AI能力边界。
产品化方面: 涌现出各种产品形态,包括 ToC/ToB、云端/终端、AI原生应用/AI赋能的传统应用。
商业闭环方面: 探索出多种盈利模式,包括会员订阅、广告、卖流量、软件模块销售以及硬件销售等。
从全球模型进展来看,第一,去年大语言预训练模型和多模态应用的发展暂未达到去年初预期的速度。
2024年年初,市场普遍预期GPT-5会很快发布,但直到年底也未能见到其身影,大语言模型预训练放缓;多模态模型的发展也低于预期,2024年2月Sora的demo发布时曾引起广泛关注,但直到12月才正式商用,业界期待的世界模型、原生多模态等也还未实现。
第二,既然预训练和多模态进展放缓,过去一年业界在忙什么?答案是深度推理。
如果说预训练模型思路是加大算力、加大参数,努力让模型的“大脑”更聪明;以GPT-4o1为代表的模型新思路是深度推理模型,引导模型在推理过程中一步步思考、自我优化答案,提升准确度,从而在综合推理能力上实现持续提升,在数学、代码、科研等领域的能力持续提升。明确模型的进步路径后,全球头部玩家大模型的差距在缩小,逐步在GPT-4/4o1这个层级上快速追平。
第三,模型降本、效率提升速度要比想象中更快。AI模型的训练和推理成本在过去18个月里大幅下降了1-2个数量级。以GPT-4作为标杆模型来看,训练该模型所需的算力集群从4万张卡,陆续降低到1万多张卡,而DeepSeek的V3版本仅需2000张卡。这种成本的大幅下降为AI应用的广泛落地提供了有力支持。
02
DeepSeek崛起带来的影响
结合上述变化,我们再来看国内模型DeepSeek的新突破为什么重要。
DeepSeek推出的R1和V3模型在性能和成本上都取得了重大突破,引发了全球科技产业的高度关注。如果说去年年初判断国内模型与海外模型的差距在6- 12个月。如今,差距已缩小到3个月。
从性能上看,R1的深度推理能力成为全球最接近OpenAI GPT-4o1的模型,大幅超过了其他竞争对手。虽然在幻觉等方面仍有不足,但其整体性能已经非常接近行业领先水平,同时在中文对齐方面表现出色,文本逻辑性优于其他模型,尤其擅长生成具有情感色彩和逻辑连贯性的文本,这使其在中文应用场景中具有独特优势。
从成本上看,DeepSeek的模型在训练成本上大幅降低。与OpenAI的同代际模型相比,DeepSeek的模型训练和推理成本又实现了不同程度的下降。这种成本优势使得DeepSeek的模型在全球范围内具有更强的竞争力,能够以更低的成本提供高性能的AI服务。
此外,DeepSeek将模型开源,意味着全球开发者都可以免费使用和修改这些模型,这将进一步加速AI应用的落地和创新,提升开源生态的产业影响力。
DeepSeek的崛起对全球AI产业格局产生了深远影响,国内模型在基础能力上相较海外加速收窄,成本、工程优化方面领先于海外,国产AI的快速进步非常亮眼。此次DeepSeek作为中国厂商推动开源模型的发展,也引起了全球科技巨头的重视,中国在AI领域的技术实力得到了全球认可。
R1的出圈证明了我们之前微观上看到的产业趋势——当大集群预训练放缓,模型进步开始依赖人才流动、工程化、数据质量的时候,中国会大幅收窄和海外的差距。R1的出现不是偶然,从底层逻辑看,卷工程、卷数据、卷人才,中国从来不会输。
03
细分投资线索展望
DeepSeek热点引起了业界对AI各子线索的重视,性能提升、成本下降将总体利好应用落地,也为科技产业带来新的投资机遇。
应用线索中,软应用的AI Agent,终端中的AI手机、AI眼镜、AI玩具、智驾、机器人等,可能都会在DeepSeek的推动下加速落地;算力线索中,国产算力、国产先进制程也会看到持续突破。
在未来,AI应用的落地场景将越来越广泛,从软件应用到硬件终端,从软件Agent到智能驾驶,AI技术将为各个领域带来新的变革和机遇。
我们认为中国科技资产充满机会,核心线索是AI的云到端,国内科技巨头可能引领一轮新的科技创新周期。结合中国自身的制造业优势,在围绕云端的国产算力、围绕终端的自动驾驶和AIOT、围绕科技自强的半导体高端突破,存在着持续的投资机会。我们将不断寻找产业变革带来的基本面超预期资产,挖掘科技投资精彩机遇!
注:仅为拟任基金经理当前市场观点,不代表产品未来必然投资方向。
风险提示:基金投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。过往业绩不预示其未来业绩,其他基金业绩不构成本基金业绩的保证。