科大讯飞动真格:星火大模型七大维度评测,率先落地应用

5月6日,科大讯飞(002230.SZ)正式发布讯飞星火认知大模型(下称“星火”)。

当有的厂商为大模型不确定的商业化落地前景感到焦虑时,科大讯飞迎头赶上,不仅现场收集问题进行测试,还针对大模型推出七大评测维度。

更重要的是,红星资本局注意到,科大讯飞成为了国内率先将大模型落地应用的厂商,并推出了推出面向教育、办公、车载等行业的解决方案。

科大讯飞在AI领域十年如一日的积累,在此时成为了可以燎原的星火。

现场收集问题进行测试

科大讯飞动真格,七大维度评测

科大讯飞一上来就是动真格。

5月6日,在发布会现场,科大讯飞的董事长*峰、研究院院长刘聪在发布会现场用几分钟收集了上千个问题,并随机抽取了5个问题现场测试。

——“外星人感冒了需要戴口罩吗?”

——“我想把40㎡的房子装修成70㎡的感觉,请给出可行的方案。”

——“公众场合大声喧哗会影响别人的心情,那小声讲话是不是就不会影响?”

如果只靠回答这些问题来证明星火的能力,那科大讯飞恐怕又会落入俗套,*峰显然看得更加长远,不是从企业、而是从整个行业的角度去看待问题。

“我特别想说的是,如果我们要让认知智能真的解决社会刚需(问题),而不是简单地做PR、做宣传的话,我们就要建立一套实实在在的用科学系统来评测的*。”*峰说。

作为人工智能领军之一,科大讯飞通过认知智能全国重点实验室牵头设计了评测*,并与相关联盟共同探讨形成了覆盖七大维度的481个细分任务对通用认知大模型进行评测。

其中,七大维度指的是文本生成、语言理解、知识问答、逻辑推理、数字能力、编程能力和多模态,星火在此次的发布会上被现场考验了每一个维度的问题。

——“请问孔子在2008年的奥运会上说了些什么?”

——“等腰三角形的顶角是底角度数的2倍,请问这个三角形的底角是多少度?”

——“俗话说,男子汉大丈夫宁死不屈;但俗话又说,男子汉大丈夫能屈能伸。这两种说法应该怎么理解呢?”

红星资本局在现场注意到,星火在个别维度上的表现偶有瑕疵,但整体表现优秀,尤其是在后一个维度多模态上,它的表现可谓是惊艳。

先是刘聪语音输入要求,让星火以“立夏”为题写一篇200字散文,然后又要求星火以温柔的男声朗读,每个任务星火都完美达成。甚至,在被提出生成女性形象的虚拟人朗读时,星火只用不到10秒的时间成功生成虚拟人的视频。

从接受语音需求到文本生成,再从语音朗读到实时生成虚拟人,星火展现了大模型能达到的丰富形态和能力,让我们认识到大模型在生活中存在的另一种无限可能。

业界尚愁落地不确定性

科大讯飞一口气推出多款落地产品

当前,业界普遍还认为,通用认知大模型的商业化前景尚不明确,行业落地存在不确定性。而科大讯飞凭借在AI领域的多年积累,此次一口气推出了搭载大模型的多款产品。

以教育领域为例,搭载星火的科大讯飞AI学习机T20系列实现了中英文作文类人批改。

*峰认为,在语言学习的过程中,作文能力很难得到提升。因为针对性的指导和批改耗时耗力,老师很难对每一个学生的情况进行深度的分析、教导,而星火带来了全新的体验。

从现场实时演示来看,和传统学习机一样,该学习机也能进行针对字词标点纠错、识别句式修辞错误等基础批改,同时,该学习机还能围绕写作要求分析全篇结构和文采,如某一句可以优化、建议加入动作描写和神态描写等。

相对来看,学习机可能只调用了星火在文本生成、语言理解等维度的能力,另一产品更能综合地体现星火*度的能力——“大模型+数字员工”。

在发布会上,刘聪要求星火复盘科大讯飞的“飞凡计划”(招收优秀应届毕业生的*项目),在无人操作的情况下,星火自动登录HR系统,并根据要求导出数据、分析数据、生成PPT。

红星资本局注意到,在整个过程中,星火或动用了语言理解、逻辑推理、数字能力、编程能力和多模态等*度的能力完成指令。

星火正在对科大讯飞的“飞凡计划”进行复盘

事实上,除了上述两个领域外,科大讯飞还发布了星火在办公和汽车等领域的行业应用成果,如“大模型+智能办公本”、“大模型+讯飞听见”和“大模型+智能座舱”等。

从目前推出的大模型进度来看,科大讯飞毫无疑问是率先应用落地的厂商。可以说,星火的现在,或许可能就是不少投身AI创业浪潮之人还在畅想的未来。

科大讯飞的多年积累

从数据、算法到模型、算力均有优势

为什么科大讯飞能成为率先将大模型应用落地的厂商?

正如*峰在此次发布会上说的,“这一次认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。”

红星资本局注意到,科大讯飞早在2011年就承建了语音及语言信息处理国家工程实验室,而且在认知智能领域中不断投入进行研发,有长达十几年的积累。

以数据为例,刘聪今年曾对媒体透露,在严格遵守适用法律法规前提下,科大讯飞在多年认知智能系统研发推广中积累了超50TB的行业语料和每天超10亿人次用户交互的活跃应用。

当然,光有数据积累是不够的,还需要优秀的算法和模型。

科大讯飞财报曾披露,其在认知智能大模型核心的Transformer深度神经网络算法方面拥有丰富的经验,且已广泛应用于科大讯飞的语音识别和图文识别等,已达到国际领先水平。

另外,科大讯飞现已开源6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在Github平台获得星标数位列同类中文预训练语言模型前列。

这也体现在科大讯飞连年增长的研发费用中。红星资本局翻阅财报发现,在过去五年中,科大讯飞的研发费用分别为12.63亿元、16.40亿元、22.11亿元、28.30亿元和31.11亿元。

更为重要的是,科大讯飞在算力上占据优势。

科大讯飞在今年4月曾通过投资者关系活动记录表披露称,其在总部自建有业界一流的数据中心,且已建成4 城7中心深度学习计算平台,为大模型训练平台建设奠定了硬件基石。

这些或许是科大讯飞喊出“10月底整体赶超ChatGPT”的底气,我们拭目以待。

(唐浩)

以上就是【科大讯飞动真格:星火大模型七大维度评测,率先落地应用】的相关内容,查看其它ai资讯请关注微咔网

服务及版权声明

根据二〇〇二年一月一日《计算机软件保护条例》第十七条规定:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。

本网站所有发布的源码、软件和资料,均为作者提供或网友推荐收集各大资源网站整理而来,仅供功能验证和学习研究使用。

所有资源的文字介绍均为网络转载,本站不保证相关内容真实可信,同时不保证所有资源100%无错可用,也不提供相应的技术支持,介意勿下。

您必须在下载后24小时内删除,不得用于非法商业用途,不得违反国家法律,一切关于该资源的商业行为与本站无关。

如果您喜欢该程序,请支持正版源码,得到更好的正版服务。、如有侵犯你的版合法权益,请邮件与我们联系处理【投诉/建议发送至邮箱:3066548754@qq.com】,本站将立即改正并删除。

本声明为本站所有资源最终声明,所有与本声明不符的表述均以本声明内容为准。


微咔网 » 科大讯飞动真格:星火大模型七大维度评测,率先落地应用
享更多特权,建议使用 QQ 登录
喜欢我嘛?喜欢就按“ctrl+D”收藏我吧!♡