“日日新”大模型*首亮相！能写代玛、生成数字人商汤要做大模型的“超市”-微咔网

正文概述

4月10日，商汤科技“日日新”大模型*正式发布，包括1800亿参数的中文语言大模型“商量SenseChat”、10亿参数的文生图生成模型“秒画SenseMirage”，以及AI数字人视频生成平台“如影SenseAvatar”，3D内容生成平台“琼宇SenseSpace”、“格物SenseThings”等一系列生成式AI模型及应用。

商汤科技董事长兼CEO徐立表示，将此大模型*命名为“日日新SenseNova”，寓意“苟日新、日日新、又日新”，希望在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI的更多可能。“‘日日新’很像一个超市，会源源不断地产生越来越多大模型。”

商汤科技联合创始人、大装置事业*副总裁陈宇恒在采访中指出，对于未来1到2年追赶甚至超过GPT-4，感到颇有信心。

“我们会把模型往更大地去做，现在是千亿级、后续会做到万亿级的模型参数，通过更大的算力、更大的模型去形成更强的智能，为生产力工具或产品的用户体验，提供人工智能的驱动引擎。”

“日日新”大模型超市首亮相

商汤“日日新”大模型*，可分为基础大模型、领域大模型，以及在此基础上结合行业数据，形成实际的行业落地闭环。

在徐立的介绍里，推出“日日新”大模型*后，商汤便相当于为上下游提供了一个大模型的“超市”，有数据、模型训练以及部署的三位一体的飞轮，以此来作为上下游合作的基础。

作为自然语言基础大模型，商汤发布的“商量SenseChat”拥有1800亿参数，具备问答、理解与生成等中文语言能力，支持超长文本知识理解。在现场演示中，“商量”化身为编程助手，帮助开发者高效地编写和调试代玛。

同时，商汤也展示了各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用。

其中，“秒画SenseMirage”文生图创作平台，支持6K高清图的生成。用户还可根据自身需求训练生成模型。比如，输入数张90年代香港女星的照片，“秒画”就能通过自主学习，生成用户所需的“港风”图像；

“如影SenseAvatar”AI数字人视频生成平台，仅需一段5分钟的真人视频素材，即可生成出来声音及动作自然、口型准确、多语种精通的数字人分身；

“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台，则可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。

“基于千亿级参数的基础大模型，我们演化出文生图大模型、代玛大模型、语言大模型等领域大模型。”陈宇恒说。“在这些领域大模型之上，会提供API以及UI，可以让用户与这些大模型进行交互。商汤现有的模型库提供了上万个不同特色的文生图模型，能应用在多个行业，也是商汤在大模型领域长期的积累。”

算力是大模型发展的关键，被称为人工智能时代的“石油”。商汤这次展示的1800亿参数中文语言大模型，正是得益于商汤在算力布局上的深厚积累。据悉，商汤人工智能计算中心可输出5.0 exaFLOPS的总算力，能支持20个千亿参数超大模型同时训练。

“我们有超过27000张的GPU卡，可并行地训练20个以上的ChatGPT类模型，使研发节奏能非常快地追赶世界领先水平。在今年，我们会做到3000-4000张的算力基础设施，预计明年也会达到万卡级。” 陈宇恒提到。

陈宇恒强调，商汤在算力、人才等各方面的积累，都不会过于落后OpenAI。“甚至算力层面，我们和OpenAI是站在同一起跑线上的。包括在大模型的研发层面，也有很多年的积累。”

因此对于追赶OpenAI ，陈宇恒表达了比较乐观的态度。“我们要做出中国特色的人工智能大模型，符合国内用户习惯、符合整体产品体验的大模型。有了这样的大方向，对于未来1到2年，我们追赶甚至超过GPT-4，我是比较有信心的。”

着重B端应用布局

在发布会现场，徐立演示了“商量”大语言模型在医疗服务领域的应用。比如，用文字输入对症状的描述，由AI医生给出初步的病情判断，指导病人去医院相关的科室就医。

徐立介绍，商汤已经与新华医院、瑞金医院、华西医院等在辅助诊疗、随访、健康咨询等方面开展合作。

“公司这些年把重点在B端服务客户。而C端的现象级产品，让更多人知道了人工智能大模型，并认可其发展潜力。”陈宇恒表示，“这反而是对商汤在相关的产品、技术战略有很强的支撑印证。说明我们一直在做一件正确的事情。”

迄今，商汤的大模型已覆盖核心公司业务，涵盖智能汽车、智慧生活、智慧城市、智慧商业。

在智能汽车领域，20*，绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付，量产交付数超50万辆，新增定点数超800万辆，持续领跑行业。通过人工智能大模型赋能的辅助驾驶以及智能车舱的产品研发，共覆盖30多家车企的80多款车型。

在元宇宙领域，商汤推出的数字人产品，融合了文本生成图像等大语言模型的一系列技术，亦形成了行业落地。20*初，商汤和宁波银行展开了深度合作，打造了数字员工“小宁”，通过拟人的形象，为银行客户提供各类业务知识和办理的服务。同时通过一套虚拟的IP解决方案，集成了各种AI技术，实现高效率、低成本的AIGC内容创作。

在AI for Science的科研领域，商汤也与生物企业达成合作，为蛋白质结构的大模型研发提供训练和推理的优化服务。“我们把预测时间缩短了60倍，大幅度地提高了蛋白质结构预测的抗体筛选效率，这都是商汤大装置结合各个行业，来形成一些垂直解决方案，以及带来的真实的B端价值的案例。”陈宇恒介绍。

AI 将赋能各行各业

随着大模型的发展，AI对各行各业的赋能被认为是未来的新爆发点。商汤则希望在此过程中形成大模型生态，与各行业的企业联合共赢。

“真正地把AI的能力去输出到各行各业，让我们的用户和客户提前体验到人工智能技术发展的红利。” 陈宇恒指出。

在算力层，商汤已有超过7000张GPU算力，对外服务于8家大型客户进行大模型训练；

在MaaS（模型即服务）领域，商汤提供推理平台、模型管理平台、数据平台等，以及加速人工智能大模型生产效率的整套工具链，帮助行业客户高效地开发人工智能大模型；

此外，商汤还开放模型即服务的API，让游戏、互联网、银行、科研机构等客户，以调用API的方式，把大模型的能力应用在其产品上。

“用户可以重新训练大模型，也可以在我们提供的大模型上微调，商汤会提供整套工具链。同时，我们也会给予现成的Model-as-a-Service的 API ,让用户直接调用。通过不同的产品和服务组合，满足不同技术能力的用户诉求。” 陈宇恒表示。

大型通用模型研发和训练成本高昂，是阻碍其落地的一大门槛。但如果把大模型的能力迁移至小模型上，就能进一步降低落地成本。

“比如训练一个超大模型，再*小一点的模型。通过小模型的微调和训练，把大模型的推理成本分摊下去。这样，行业知识通过小一点的模型去解决，从而提高推理侧商业落地的投资回报率和性价比。” 陈宇恒说。

大模型时代的到来，将推动人工智能开发从“零散的小作坊”到“大规模工业化生产”的升级，更好地实现技术和商业的平衡，让 AI 加速赋能各行各业。

“小模型时代模型生产的方法，类似传统的小作坊。人工智能大模型的出现后，其大的特点是泛化能力非常强，更直接地服务于各行各业。不再像以前，需要做大量的手动优化或者重新训练的工作。这会导致人工智能的应用成本急剧地降低，是商业模式上的很大转变。” 陈宇恒解释。