
中国AI公司深度求索近期发布的DeepSeek-V3和DeepSeek-R1大模型,围绕高效推理和经济训练的创新算法,以较低成本实现了大语言模型的性能效果突破,成为今年以来AI领域的现象级热点。
DeepSeek的爆火,对AI领域的“同行”会产生哪些影响?
“总体来看,DeepSeek的出现促进了市场对大模型应用的热度,为科大讯飞等已经提前布局的企业带来了市场加快成熟的新机会。”科大讯飞(002230.SZ)在最新公布的投资者关系活动记录表里称,该公司更加有信心依托纯国产化的星火大模型底座竞争力、数据飞轮和场景创新,能够在大模型的应用上持续深化护城河和差异化竞争优势。

对G端和B端业务影响相对复杂
“DeepSeek的火爆吸引了大量云服务厂商、算力企业、芯片厂商、应用端企业等产业链上下游积极参与,中国人工智能产业生态建设的速度进一步加快,人工智能的赋能价值和产业规模加速发展,对科大讯飞这样长期投入培育人工智能市场的企业有很大的综合好处。”科大讯飞称。
DeepSeek在英伟达卡上的工程化探索,对科大讯飞进一步提升国产算力基础上大模型性价比也有很好的借鉴作用。DeepSeek验证的长思维链可读化输出,有助于整个产业链降低在数据推理路径标注的投入,未来大模型在需要复杂推理的应用上落地过程会进一步加快。
科大讯飞表示,当前,行业众多“深水区”问题及需求已经到了突破解决的前夜,大模型技术阶跃发展是最关键和明确的曙光。讯飞星火会坚持全国产化路线和面向行业刚需落地,底座大模型会持续对标国内外最高水平。
此外,DeepSeek 的火爆,也让更多的行业客户对大模型技术和应用有了更加广泛的关注和期待,尤其是通过数据飞轮驱动的知识积累和场景创新的业务领域,如教育、医疗等领域,人工智能应用的规模化落地会进一步加快。
基于此,科大讯飞认为,讯飞星火当前在教育、医疗等行业都是市场占有率第一的大模型,该公司在这些领域的先发优势会进一步得到发挥,未来也会形成更稳固的行业领先优势。

具体到G端(面向政务部门)和B端(面向企业客户)业务,DeepSeek的火爆对科大讯飞影响会更为复杂。
G端上,科大讯飞称,部分 G 端客户当前对DeepSeek的技术创新和产业影响处于关注和学习阶段,短期内对正在实施的智算中心的建设节奏有一定滞后影响,但从长期来说,各地政府对国产智算中心等新型基础设施建设、产业生态体系完善、拓展AI+新型工业化应用场景、加快政府的数智化治理转型等方面的投入会进一步加大,这些对讯飞的G端业务都会带来好处。
而在以央国企为代表的B端企业市场,DeepSeek的开源免费,一些企业在AI落地项目中大模型底座建设资金投入比例上会更加谨慎,但越来越多的企业在AI应用和构建行业专属大模型需求的激活后,讯飞在人工智能企业应用落地中的自主可控优势、专属模型训练工具链、场景落地能力的优势,有可能会促使其在央国企业务合作上的收入规模增长。

星火X1新版本预计在3月内完成
DeepSeek-R1并不是唯一高水平的国产深度推理大模型。去年9月OpenAI o1-preview发布以后,国内技术领先的大模型厂商也在快速跟进。
“科大讯飞在2024年10月就实现了蒙特卡洛树搜索(MCTS)等算法创新并跑通了深度推理模型训练算法,因为只能使用国产算力,我们额外花费2个月完成华为昇腾 910B 算力的适配和优化,并大幅提升训练效率。”科大讯飞称。
今年1月15日,该公司完成了星火深度推理模型X1的训练和发布,已达到可以和 OpenAI o1-preview对标的水平。
“随着国产算力的逐步到位,模型参数增加后,我们完全有信心实现数学答题和过程思维链能力全面对标甚至超过OpenAI o1。”科大讯飞还表示,结合与中国教科院等诸多教育专家的合作成果,将使得X1的思维链结果更加符合教育教学的专业要求,在教育、医疗等领域实现更大的应用赋能价值。
和 DeepSeek 类似,科大讯飞受限于有限的算力资源,过去几年对于星火大模型训练和推理成本效率的持续优化也做了大量投入。“和DeepSeek直接使用英伟达H800卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。”科大讯飞说。

训练成本也是讯飞星火大模型的竞争优势,随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。
科大讯飞认为,大模型对算力的需求为训练和推理两个方面,而训练实现的难度远大于推理,目前仍只有讯飞星火一家是训练和推理均在国产算力上进行的,并且仅用 1 万张 910B 国产算力卡,“科大讯飞做了大量国产算力平台上的无人区的适配和效率优化,追求国产算力的极致效率,这更需要技术实力和战略勇气”。
值得注意的是,科大讯飞透露,正在训练的星火X1新版本预计在3月内完成,并有信心实现数学答题和过程思维链能力全面对标甚至超过世界一流同行。

做全栈自主可控的大模型国家队
Deepseek 引发了全球关注,社会各界对通用人工智能有了更大的热情和期待。
“DeepSeek的效应,将吸引国产算力厂商投入更大资源支持国产大模型的适配,有利于国内人工智能的产业链更好发展。”科大讯飞称,DeepSeek 的效应将吸引更多产业资源、政府资源的支持的同时,一批原先瞄准通用大模型为目标的创业公司和互联网公司将因为资源无法支撑而退出角逐,转而做特定方向的人工智能应用落地,这有助于国内人工智能产业资源的更合理分布。
科大讯飞介绍,未来会继续保持“1+N”的战略投入定力即“1个底座大模型+N个行业大模型”的整体布局,底座大模型持续对标国内外最高水平,同时围绕赋能教育、医疗、金融、汽车、能源、司法、安全、工业互联网及AI for Science等关键领域构建N个重点行业大模型。

事实上,讯飞星火大模型的战略生态定位非常清晰:聚焦自主可控的底座能力和面向民生刚需以及赋能科研与生产的重点应用赛道,以长期主义精神保持战略定力,做全栈自主可控的大模型国家队。
在1月25日的科大讯飞年会上,科大讯飞董事长刘庆峰表示,“将持续进行战略聚焦,加强C端、做深B端,选择G端。价值第一、产品为王,只有选对客户+选对业务,产品才有可能跨越鸿沟。”
“DeepSeek 的火爆进一步表明当前通用人工智能前所未有的创新活力和发展潜力,通用大模型的天花板仍然在被持续打开,我们会坚定不移地在大模型底座研发上持续投入并且不断输出最新成果。”科大讯飞称。
截至2月14日收盘,科大讯飞(002230.SZ)报收于54.58元/股,上涨3.41%。
作者|许昊杰
编辑|张彩莉















