“日日新”大模型*首亮相!能写代玛、生成数字人 商汤要做大模型的“超市”

4月10日,商汤科技“日日新”大模型*正式发布,包括1800亿参数的中文语言大模型“商量SenseChat”、10亿参数的文生图生成模型“秒画SenseMirage”,以及AI数字人视频生成平台“如影SenseAvatar”,3D内容生成平台“琼宇SenseSpace”、“格物SenseThings”等一系列生成式AI模型及应用。

商汤科技董事长兼CEO徐立表示,将此大模型*命名为“日日新SenseNova”,寓意“苟日新、日日新、又日新”,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。“‘日日新’很像一个超市,会源源不断地产生越来越多大模型。”

商汤科技联合创始人、大装置事业*副总裁陈宇恒在采访中指出,对于未来1到2年追赶甚至超过GPT-4,感到颇有信心。

“我们会把模型往更大地去做,现在是千亿级、后续会做到万亿级的模型参数,通过更大的算力、更大的模型去形成更强的智能,为生产力工具或产品的用户体验,提供人工智能的驱动引擎。”

“日日新”大模型超市首亮相

商汤“日日新”大模型*,可分为基础大模型、领域大模型,以及在此基础上结合行业数据,形成实际的行业落地闭环。

在徐立的介绍里,推出“日日新”大模型*后,商汤便相当于为上下游提供了一个大模型的“超市”,有数据、模型训练以及部署的三位一体的飞轮,以此来作为上下游合作的基础。

作为自然语言基础大模型,商汤发布的“商量SenseChat”拥有1800亿参数,具备问答、理解与生成等中文语言能力,支持超长文本知识理解。在现场演示中,“商量”化身为编程助手,帮助开发者高效地编写和调试代玛。

同时,商汤也展示了各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用。

其中,“秒画SenseMirage”文生图创作平台,支持6K高清图的生成。用户还可根据自身需求训练生成模型。比如,输入数张90年代香港女星的照片,“秒画”就能通过自主学习,生成用户所需的“港风”图像;

“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,即可生成出来声音及动作自然、口型准确、多语种精通的数字人分身;

“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,则可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

“基于千亿级参数的基础大模型,我们演化出文生图大模型、代玛大模型、语言大模型等领域大模型。”陈宇恒说。“在这些领域大模型之上,会提供API以及UI,可以让用户与这些大模型进行交互。商汤现有的模型库提供了上万个不同特色的文生图模型,能应用在多个行业,也是商汤在大模型领域长期的积累。”

算力是大模型发展的关键,被称为人工智能时代的“石油”。商汤这次展示的1800亿参数中文语言大模型,正是得益于商汤在算力布局上的深厚积累。据悉,商汤人工智能计算中心可输出5.0 exaFLOPS的总算力,能支持20个千亿参数超大模型同时训练。

“我们有超过27000张的GPU卡,可并行地训练20个以上的ChatGPT类模型,使研发节奏能非常快地追赶世界领先水平。在今年,我们会做到3000-4000张的算力基础设施,预计明年也会达到万卡级。” 陈宇恒提到。

陈宇恒强调,商汤在算力、人才等各方面的积累,都不会过于落后OpenAI。“甚至算力层面,我们和OpenAI是站在同一起跑线上的。包括在大模型的研发层面,也有很多年的积累。”

因此对于追赶OpenAI ,陈宇恒表达了比较乐观的态度。“我们要做出中国特色的人工智能大模型,符合国内用户习惯、符合整体产品体验的大模型。有了这样的大方向,对于未来1到2年,我们追赶甚至超过GPT-4,我是比较有信心的。”

着重B端应用布局

在发布会现场,徐立演示了“商量”大语言模型在医疗服务领域的应用。比如,用文字输入对症状的描述,由AI医生给出初步的病情判断,指导病人去医院相关的科室就医。

徐立介绍,商汤已经与新华医院、瑞金医院、华西医院等在辅助诊疗、随访、健康咨询等方面开展合作。

“公司这些年把重点在B端服务客户。而C端的现象级产品,让更多人知道了人工智能大模型,并认可其发展潜力。”陈宇恒表示,“这反而是对商汤在相关的产品、技术战略有很强的支撑印证。说明我们一直在做一件正确的事情。”

迄今,商汤的大模型已覆盖核心公司业务,涵盖智能汽车、智慧生活、智慧城市、智慧商业。

在智能汽车领域,20*,绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付,量产交付数超50万辆,新增定点数超800万辆,持续领跑行业。通过人工智能大模型赋能的辅助驾驶以及智能车舱的产品研发,共覆盖30多家车企的80多款车型。

在元宇宙领域,商汤推出的数字人产品,融合了文本生成图像等大语言模型的一系列技术,亦形成了行业落地。20*初,商汤和宁波银行展开了深度合作,打造了数字员工“小宁”,通过拟人的形象,为银行客户提供各类业务知识和办理的服务。同时通过一套虚拟的IP解决方案,集成了各种AI技术,实现高效率、低成本的AIGC内容创作。

在AI for Science的科研领域,商汤也与生物企业达成合作,为蛋白质结构的大模型研发提供训练和推理的优化服务。“我们把预测时间缩短了60倍,大幅度地提高了蛋白质结构预测的抗体筛选效率,这都是商汤大装置结合各个行业,来形成一些垂直解决方案,以及带来的真实的B端价值的案例。”陈宇恒介绍。

AI 将赋能各行各业

随着大模型的发展,AI对各行各业的赋能被认为是未来的新爆发点。商汤则希望在此过程中形成大模型生态,与各行业的企业联合共赢。

“真正地把AI的能力去输出到各行各业,让我们的用户和客户提前体验到人工智能技术发展的红利。” 陈宇恒指出。

在算力层,商汤已有超过7000张GPU算力,对外服务于8家大型客户进行大模型训练;

在MaaS(模型即服务)领域,商汤提供推理平台、模型管理平台、数据平台等,以及加速人工智能大模型生产效率的整套工具链,帮助行业客户高效地开发人工智能大模型;

此外,商汤还开放模型即服务的API,让游戏、互联网、银行、科研机构等客户,以调用API的方式,把大模型的能力应用在其产品上。

“用户可以重新训练大模型,也可以在我们提供的大模型上微调,商汤会提供整套工具链。同时,我们也会给予现成的Model-as-a-Service的 API ,让用户直接调用。通过不同的产品和服务组合,满足不同技术能力的用户诉求。” 陈宇恒表示。

大型通用模型研发和训练成本高昂,是阻碍其落地的一大门槛。但如果把大模型的能力迁移至小模型上,就能进一步降低落地成本。

“比如训练一个超大模型,再*小一点的模型。通过小模型的微调和训练,把大模型的推理成本分摊下去。这样,行业知识通过小一点的模型去解决,从而提高推理侧商业落地的投资回报率和性价比。” 陈宇恒说。

大模型时代的到来,将推动人工智能开发从“零散的小作坊”到“大规模工业化生产”的升级,更好地实现技术和商业的平衡,让 AI 加速赋能各行各业。

“小模型时代模型生产的方法,类似传统的小作坊。人工智能大模型的出现后,其大的特点是泛化能力非常强,更直接地服务于各行各业。不再像以前,需要做大量的手动优化或者重新训练的工作。这会导致人工智能的应用成本急剧地降低,是商业模式上的很大转变。” 陈宇恒解释。

展望未来,商汤将剑指更大规模的基础模型研发。

“在不断接近所谓的通用人工智能的道路上,势必要把基础模型越做越大。作为人工智能的头部的企业,我们肯定会挑战更大的模型。这是未来2到3年,整个无论从学术界还是从工业界,还是从我们自身对AI的理解上,都是比较明确的方向。” 陈宇恒透露。

以上就是【“日日新”大模型*首亮相!能写代玛、生成数字人 商汤要做大模型的“超市”】的相关内容,查看其它ai资讯请关注微咔网

服务及版权声明

根据二〇〇二年一月一日《计算机软件保护条例》第十七条规定:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。

本网站所有发布的源码、软件和资料,均为作者提供或网友推荐收集各大资源网站整理而来,仅供功能验证和学习研究使用。

所有资源的文字介绍均为网络转载,本站不保证相关内容真实可信,同时不保证所有资源100%无错可用,也不提供相应的技术支持,介意勿下。

您必须在下载后24小时内删除,不得用于非法商业用途,不得违反国家法律,一切关于该资源的商业行为与本站无关。

如果您喜欢该程序,请支持正版源码,得到更好的正版服务。、如有侵犯你的版合法权益,请邮件与我们联系处理【投诉/建议发送至邮箱:3066548754@qq.com】,本站将立即改正并删除。

本声明为本站所有资源最终声明,所有与本声明不符的表述均以本声明内容为准。


微咔网 » “日日新”大模型*首亮相!能写代玛、生成数字人 商汤要做大模型的“超市”
享更多特权,建议使用 QQ 登录
喜欢我嘛?喜欢就按“ctrl+D”收藏我吧!♡