8月15日,在讯飞星火认知大模型V2.0升级发布会上,科大讯飞重磅发布代码能力和多模态能力升级,同步发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品。

科大讯飞董事长刘庆峰表示,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路,也是讯飞既定的人工智能技术长期战略,大模型赋能个体和行业的大未来正在到来。

人人都是开发者

星火突破代码能力并发布智能编程助手

代码是大模型“硬碰硬”的能力。讯飞星火2.0对代码能力进行5个维度的升级,包括代码生成、代码补齐、代码纠错、代码解释、单元测试生成。

现场演示中,使用Python画红色的心形线、画出马鞍面方程三维立体图并设置渐变色、用代码生成小游戏对讯飞星火都不在话下。

“代码数据能提升认知大模型的‘智慧’,代码能力是认知大模型聪明程度的重要标志。”刘庆峰说,代码能力也是构建和链接数字世界的有效手段,可以大幅降低数字经济的创业门槛和成本,不用个个都是编程高手,只要发挥自己的想象力、基于对应用场景的认知,就可以提升开发效率、实现相关创业。

据介绍,根据OpenAI构建的代码能力公开测试集HumanEval,星火V1.5 Python语言的效果只有41分,V2.0已经到了61分、接近ChatGPT。根据认知智能国家重点实验室构建的代码的真实的场景使用的测试集,代码生成和补齐维度上已经超过了ChatGPT。根据计划,讯飞星火代码各维度的能力将在今年10月24日超越ChatGPT,明年上半年对标GPT-4。

代码能力升级后如何让开发者更方便使用?现场,科大讯飞发布了讯飞星火的应用级产品——智能编程助手iFlyCode1.0。现场简单几步Prompt完iFlyCode界面后,一行代码都不用写,“凌空手写”功能就已马上实现,而在以前,即便是有经验的工程师,也要半天到1天才能完成,现在只需要几分钟。

多模态能力再升级

讯飞智作2.0让视频生成更高效

拍了美图想“秒速”发一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?只要输入一段文字,一键就想生成声情并茂的小视频?这些功能,讯飞星火V2.0全部可以实现。

发布会现场,刘庆峰对讯飞星火的多模态能力进行重磅发布,讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。他表示,“讯飞星火的多模态能力在业界可测的大模型中明显领先。”

对升级多模态能力,刘庆峰介绍:“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”他说,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。

“多模态能力也是科大讯飞既定的人工智能技术长期战略。”最近3年,科大讯飞已在多模态领域获得了17个国际权威评测冠军,2022年初讯飞就已发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的“讯飞超脑2030计划”,让懂知识、善学习、能进化的机器人走进每个家庭。“这其中最重要的一项技术就是多模态能力。”

多模态能力的升级也将为AIGC带来前所未有的产业机会,发布会上多模态能力升级后的产品——讯飞智作2.0也正式发布,无论是视频的后期处理还是创意视频生产,搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定。

上线星火语伴2.0

星火打造每个人的AI助手

面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师,科大讯飞在6月9日发布了讯飞语伴APP。本次结合多模态能力,讯飞语伴2.0全新升级,除了能够进行主题对话、虚拟人对话,重点推出两大核心能力——口语模考和情景交流,可用AI实现真人式陪练。

刘聪现场和讯飞星火语伴2.0进行了一场代入感极强的口语模拟考试,他进入星火语伴的雅思考试入口,一位AI英语老师便跟他展开对话,对话结束后,系统马上给出准确度、流畅度、语法、词汇等维度的系统性评价,并推荐相关课程,通过及时反馈来强化学习结果。

据了解,目前口语模考功能已支持CET、雅思、托福等大型权威考试。此外,8月15日,讯飞输入法“AI创作助手”正式开启内测。AI创作助手可在办公、学习、生活、社交等多个领域为用户提供场景化文案服务;还能对各类文案进行智能创作、润色,支持多种风格一键切换,提供更智能、便捷、有趣的输入体验。

现场,科大讯飞还全新发布的星火教师助手,支持教学设计的三大环节,创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,大大提升老师的备课效率。搭载了讯飞星火认知大模型的教师助手,通过数据驱动因材施教,用人工智能助力课堂创新,至今已服务全国超过2.5万所学校、超过1200万名师生。

合肥日报-合肥通客户端记者 葛清政