加载中...

logo

小九nba直播|新闻

首页 > 小九nba直播|新闻

“知识助手”来了!科大讯飞发布首个长文本、长图文、长语音的大模型

时间 : 2024-04-26 16:06:48  作者: 小九nba直播|新闻

  4月26日,讯飞星火大模型V3.5(以下简称讯飞星火)在春季上市。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅仅可以对各种信息源自的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。

  科大讯飞进一步升级星火语音大模型,首发多情感超拟人合成,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。

  同时,面向企业应用场景,科大讯飞推出星火智能体平台,帮企业解决大模型落地的最后一公里难题。

  持续用技术进步解决真实刚需,讯飞星火也正在获得慢慢的变多用户的认可。据七麦多个方面数据显示,讯飞星火App在安卓端的下载量已超越9600万次,在国内工具类通用大模型App中排名第一。

  通过讯飞星火App能够正常的看到,用户使用的最高峰不是周末,而是工作日的上午9:30和下午3:30。这在某种程度上预示着,大部分用户用讯飞星火来解决和工作相关的刚需问题,而高效的知识获取是用户和开发者都高度关注的问题。

  科大讯飞分析发现,在知识获取和学习的过程中,广大新老用户能拿到的资料往往不仅是现成的长文本,还有随手可见的报刊书籍内容、各种研讨会的PPT内容,老师黑板上的板书、同学的笔记,以及各种会议录音、访谈,各种网上的发布会、培训教育视频等。能不能把这些文本、图片、语音等都上传到讯飞星火中,快速地获取知识?

  为此,科大讯飞推出首个支持长文本、长图文、长语音的大模型,来解决用户真实场景中多源信息的获取需求。

  本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已超越GPT-4 Turbo。

  长文本功能的落地要解决信息高效处理的问题:面对上百万甚至上千万文字,长文本大模型消耗的运算资源非常大。

  为了解决大模型应用效率和准确率问题,刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传、解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都做到业界最优。

  面向复杂的图文场景,科大讯飞在图文识别、公式识别大赛多年国际第一的技术积累基础上,首次推出星火图文识别大模型。

  相比传统小模型逐行文字识别的限制,星火图文识别大模型具有三大优势:1、能够直接处理很复杂的版面分析,目前已经覆盖31个典型场景,比如书刊、学术论文、专利、报纸、海报、PPT等,同时能自动识别标注出18类不同的版面要素,比如页眉、页脚、标题、段落、表格、公式、印章、手写等;2、融合篇章上下文语义进行文字识别,识别更精准;3、面向教育、金融、医疗、科研等专业领域深度优化,能自动实现更多领域的专业符号识别。

  根据国际公开的权威英文测试集来看,讯飞星火的图文识别效果超过微软和谷歌。从典型应用场景来看,在科研、金融以及企业产品技术文档等方面的识别效果都处于业界领先地位。

  此外,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,能轻松实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

  万物互联时代下需要更真实的AI语音交互。年初讯飞星火V3.5发布会上,科大讯飞推出了超拟人对话功能,AI的声音更自然更线%,受到用户的广泛欢迎。无论是语音可懂度、流畅度还是表现力,效果均超过OpenAI、微软。

  此次科大讯飞发布多情感超拟人合成,逐步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音更生动、真实。

  除了超拟人对话,科大讯飞还推出一句话声音复刻功能,一句话就能定制你的AI助手声音。比如模仿小朋友的声音,每天给爷爷奶奶读书读报;在我们出差的时候,模仿我们的声音给孩子讲故事。这个功能能让世界变得更有温度。

  此外,星火智能体平台还能够最终靠拖拽方式实现新智能体的创建和多智能体的协作。星火智能体平台,敏捷触达大模型应用企业落地的最后一公里。

  据刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。


上一篇:英语教培新革命奇速英语定制时文阅读促进听说读写一体化发展!
下一篇:【GET2017】Cambly中国区负责人寿灿良:教师是在线教育产品最核心的资产
返回顶部
返回顶部