
1月15日,科大讯飞举办了一场发布会,没有花团锦簇、排场宏大的会场,只简单搭建一张台子,三个人坐在一起,将产品功能一一介绍给观众。
虽然低调,但发布的却是当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1,同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,这也是讯飞星火的第九次升级。
针对AI算力芯片遏制打压近期受到广泛关注,由此也引发对国产算力一定程度上的焦虑。
回首过往,自讯飞星火大模型首次亮相至今,一年半多的时间内经历了九次升级,而“陪跑”的就是全国产算力。
2023年5月6日,讯飞星火大模型发布会上,灯光璀璨,不少观众站着听完全程。
“今天认知大模型刚刚起步,对科大讯飞团队来说还只是一个起点。相信我们的大模型和相关应用,一定会代表行业,甚至代表中国,不断地前进,不断地创造令人欣喜的成果。”彼时的科大讯飞董事长刘庆峰信心满满地说,通用人工智能的曙光已经出现,这一次会带来更大、更全景视角、改变整个人类的生产生活方式的重大变革。
当初的这个研判正在得到验证。事实上,技术的进步以及应用落地的过程中,屡有超出事先预料之处。
大模型的技术阶跃和快速进化,让人工智能不断掀起全新热潮。
用AI科技的一业突破点燃千行百业的变革星火,这或许就是通用人工智能时代的趋势。乐观地说,让“人工智能建设美好世界”的梦想已经成为燎原之势。
星火大模型从首发至今,几乎每两三个月就会迎来一次升级。这背后,离不开算力支撑。
在遏制和打压不断升级的当下,科大讯飞持续迭代升级,既走出一条全国产化大模型能力提升的希望之路,也更具说服力地展现了源头技术牢牢地实现自主可控的可能和可行的底气。

深度推理大模型来了
自去年OpenAI发布o1深度推理模型后,推理大模型正成为行业新的竞争方向。尽管国内已有不少企业陆续发布了类似模型,但全国产算力平台上的深度推理大模型仍处于“无人区”。
破局已现。1月15日,科大讯飞称,其携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力的具备深度思考和推理能力的大模型——讯飞星火X1。
什么是推理大模型?简单理解,AI会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。
目前一些通用大模型通过大量知识和数据的训练,让AI拥有快速直觉、无意识且快速反应的能力,但总会让人觉得回答质量不够稳定、能力不够强,似乎并不能“真正理解提问”。但推理大模型更具有意识、有逻辑,会在回答之前进行一段时间的“思考”,提供更全面的解答。

举个最简单的例子,用讯飞星火X1解答高考数学题等复杂题目,讯飞星火X1不仅可以准确给出题目的答案,还能对解题思路和步骤进行了详细拆解,有全面的思考、分析和推理过程。
由此也看出深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。
也正因为深度推理模型更接近人类的“慢思考”方式,相较于通用大模型,在某些领域,深度推理大模型能用更少的算力取得同等的效果。
据介绍,讯飞星火X1在近期参加的小初高以及大学等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。

此外,讯飞星火4.0 Turbo底座能力也再次迎来全新升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。这也是讯飞星火从发布至今的第九次升级。
此次升级最重要的特点,便是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好帮助用户。
就拿图文识别能力来说,在实际工作中,经常面临图文识别的“疑难杂症”,如医疗的体检报告、法院的文书等,还有复杂长表格、手写公式等情况。而讯飞星火4.0 Turbo图文识别能力升级,可以让通用文档版面分析、文字识别的准确率相对提升40%,复杂表格结构、潦草手写文字等方面的准确率相对提升60%,大幅提升高价值数据的获取能力。

大模型“标王”
人工智能的光明前景毋庸置疑。但大模型要想进一步成为生产力的变革工具,就必须与各行各业的场景相结合并落地应用,用实际效果说话。
今年的安徽省政府工作报告指出,“人工智能+”浪潮正劲,要加强通用和垂类大模型研发布局、迭代升级,扩大在工业、科研、教育、医疗等领域融合应用,支持面向终端消费者的产品研发生产,加快把技术领先优势转化为市场应用优势。
事实上,“大模型发展,应用才是硬道理”,也是科大讯飞一直秉持的观点。

据介绍,讯飞星火X1率先在教育等真实场景中实现了应用落地。目前,讯飞星火X1已在多地试点,在一题多解、教学知识关联、拓展学生高阶思维等方面已经赢得好评。
医疗领域,讯飞星火X1的模型策略也已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。科大讯飞称,将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。
另一方面,随着国内大模型领域的竞争更趋激烈,市场无力承担无止境的“烧钱”,相关公司也必须对大模型的商业落地效果进行考量,看是否能满足用户需求、产生价值增益。
得技术者强,得产业者胜。
2024年度大模型中标项目的“标王”也同样被科大讯飞拿下。某第三方机构公布的数据显示,在2024年的大模型招投标全年总盘上,科大讯飞的中标数量(91个中标项目)和中标金额(84780.8万元)均居第一。此外,科大讯飞还超过了第二名到第六名的中标金额之和。
从中标项目看,在科大讯飞的91个中标项目中,涵盖了通信、金融、能源、政务、医疗等多个行业,主要以央国企客户为主。应用类项目数量占比最大,其中排名靠前的应用场景包括数字人&客服、知识问答&知识平台、智能编程等。
“标王”背后,不仅是技术支撑,更需要对不同行业的深度理解。基于“技术+应用”的不断正向循环,讯飞星火4.0 Turbo的行业能力全面提升,金融、油气、能源、电力、钢铁、 航司等领域综合能力的绝对提升全部超过10%,可以说是“最懂行业的大模型”。
据悉,为帮助各行各业更好地落地大模型,科大讯飞以“通专结合、端云联动、软硬一体”的方式助力更多企业完成数智化升级,构建了从“建算力、理数据、训模型”,到“落场景、保安全、精运营”的全套解决方案。
来自科大讯飞的数据显示,截至去年底,科大讯飞已经与中国石油、中国移动、中国海油等央国企及20多个行业的头部企业一起发布行业大模型,覆盖300多个应用场景。

“闯关”全国产化算力
当前,人工智能应用日益进入到场景化的深水区,无论是模型的训练还是推理,都需要高性能的算力平台作为基础。但算力资源也面临着缺乏国产化方案的现实难题,以及对自主可控的迫切需求。
作为中国人工智能“国家队”,科大讯飞为实现大模型领域完全的国产化,与华为携手自研算力底座,并于2023年10月24日联合发布了国内首个全国产算力平台“飞星一号”,常态化支持万亿参数的大模型训练。
去年10月24日,科大讯飞还与华为、合肥市大数据资产运营有限公司联合打造国产超大规模智算平台“飞星二号”,将实现新模型新算法的持续适配和智算集群规模的再次跃迁。
百舸争流之中,科大讯飞基于“飞星一号”打造的星火深度推理模型X1,成为当前全国产算力平台上唯一推理大模型,意义十分重大。这不仅是对全国产算力的可靠性验证,更是对自主可控的AI科技底座能力的可行性确认。
不可否认的是,目前国产算力在单卡、集群、生态上都和国际领先水平有一定差距。
“假如我们现在不是用国产平台,而是用已经成型的国外平台,今天星火大模型的效果可能会更好。但这一步你非走不可,除非你不想自立自强。”科大讯飞董事长刘庆峰说。

“星火大模型一开始就坚定地走全国产化路线,但是X1训练又是一条新的技术路线,后训练算力也直接飙升了一个数量级,所以我们马不停蹄和华为启动了合作攻关。说是攻关,其实这个过程更像闯关,我们没有成功案例可以借鉴,只能一点点地啃骨头。”科大讯飞一位研究员介绍,最终,科大讯飞的算法不仅在国产算力上成功适配,而且训练效率也极大提升。
科大讯飞是安徽人工智能产业发展的生动缩影。近年来,安徽抢抓通用人工智能发展机遇,系统推进大模型、大算力、大应用,强化人才、基金、数据等要素供给,全省智能算力超过1.4万P。
去年11月赛迪顾问发布的《中国人工智能区域竞争力研究》显示,安徽人工智能产业发展评价2023年排名全国第6位,其中产业未来潜力、企业成长潜力分别居全国第1位、第2位。
“现在基础已经打牢了,国产算力水平也在不断提升,相信我们的技术会应用到更多场景里面去。”科大讯飞有关负责人说。
作者|许昊杰 许可亮
编辑|许昊杰
题图|科大讯飞















