2023年科大讯飞研究报告 星火大模型发布,积极掌握AI源头技术

2023-05-11 11:54:29

来源:安信证券

1.科大讯飞:星火大模型发布,积极掌握AI源头技术

1.1.从讯飞超脑到星火大模型,认知智能技术持续积累


(资料图)

认知智能多年积累,AI 源头技术持续研发。科大讯飞坚持源头核心技术创新,人工智能关键 核心技术始终保持国际前沿水平。公司承建有国家首批新一代人工智能开放创新平台、全国 首个认知智能国家重点实验室(首批标杆全国重点实验室),以及语音及语言信息处理国家 工程研究中心等国家级平台。

科大讯飞多年来积累了认知智能大模型综合研发实力、持续关 键技术突破和创新能力,相关积累包括:1)在认知智能大模型最核心的 Transformer 深度 神经网络算法方面拥有丰富的经验,Transformer 算法已广泛应用于科大讯飞的语音识别、 图文识别、机器翻译等任务,并已经开源了 6 个大类、超过 40 个通用领域的系列中文预训 练语言模型,相关模型库月均调用量超 1000 万,在 Github 平台获得星标数位列同类中文 预训练语言模型第一;2)在多年认知智能系统研发推广中积累了丰富的行业数据,为认知 智能大模型的研发和专业领域优化提供了扎实基础;3)牵头国家专项,在国产化训练推理 平台建设和优化方面持续投入形成的扎实积累。

“讯飞超脑 2030”计划牵引,促使机器从“能听会说”向“能理解会思考”演进。2014 年, 公司发布讯飞超脑计划,明确提出要让机器像人一样具备能理解会思考的能力。2023 年初, 公司正式迭代并发布“讯飞超脑 2030 计划”。“讯飞超脑 2030 计划”将构建基于认知智能 的人机协作、自我进化的复杂智能系统。即让机器的感知能力超过人类,深度理解领域专业 知识,具备持续自主进化的能力;让机器全方面感知人和环境,懂各行各业知识,有通识和 情感,能灵活运动,会多维表达,打造可持续自主进化的复杂智能系统,助力家庭陪伴机器 人走进千家万户,造福亿万百姓生活。

讯飞超脑 2030 计划分为三个阶段,每个阶段都围绕“懂知识、善学习和能进化”,将软硬一 体机器人和数字虚拟人向前推进。其中,第一阶段,在 2022-2023 年,科大讯飞将打造可养 成的宠物机器人和专业虚拟人家族;第二阶段,时间为 2023-2025 年,将打造自适应行走的 外骨骼机器人和陪伴虚拟人家族;第三阶段,时间为 2025-2030 年,将打造软硬一体懂知识 会学习的陪伴机器人和自主学习虚拟人,帮助人类更好地应对未来。

从“讯飞超脑 2030”到星火大模型,认知智能技术迭代突破。以“讯飞超脑 2030 计划”为 牵引,公司关键技术持续突破,同时,公司布局认知智能大模型关键技术,不断推动认知智 能技术迈向新台阶。2017 年,讯飞智医助理首次通过国家执业医师考试临床综合笔试,并以 456 分的成绩超过了 96.3%的人类考生,让机器首次具有担任全科医生的能力;在 2019 年全 球机器阅读理解顶级水平测试 SQuAD 2.0 中,科大讯飞系统效果首次超过人类平均水平;2022 年 4 月的 CommonsenseQA 2.0 常识推理挑战赛中,科大讯飞以 76.06%的成绩获得第一;

2022 年 7 月,面对特定领域的知识推理,科大讯飞在 OpenBookQA 科学知识推理挑战赛中刷新最 好成绩,成为全球首个超越人类平均水平(91.7%)的单模型;2022 年 12 月,在多模态阅读 理解评测 VCR(Visual Commensense Reasoning)中再次获得第一,标志机器的阅读理解能 力实现了从单模态到多模态的跨越。

2022 年 12 月,科大讯飞启动了“1+N 认知智能大模型技术及应用”专项攻关,其中“1”指 的是通用认知智能大模型算法研发及高效训练方案底座平台,“N”指的是将认知智能大模型 技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。2023 年 5 月 6 日,公司成 功举办“讯飞星火认知大模型”成果发布会。讯飞星火大模型是公司面向通用人工智能的技 术探索,也是对标海外头部产品如 ChatGPT 的技术演进。与其他的大模型厂商产品发布不同, 讯飞的星火大模型系列成果不仅包含了通用人工智能大模型,还包含了多种搭载了大模型的 产品和落地场景,一方面展现了具体的应用方向,另一方面也将为大模型的持续迭代提供丰 富的数据入口和数据资源。

星火大模型有望持续升级,年内仍有三大关键里程碑值得期待。星火大 模型仍将持续迭代升级。6 月 9 日首先将突破开放式问答(即实时问答),不是简单搜索,而 是通过类搜索插件抓取知识,以更人性化的方式呈现结果;再次升级多轮对话能力;数学能 力还会再上一个新的台阶。8 月 15 日,将会突破代码能力,让开发者、合作伙伴非常方便地 调用使用;多模态的交互能力也将正式开放。到今年 10 月 24 日的“1024 开发者节”,希望 星火大模型能够在通用的认知大模型能力上,通过科学的评测体系实现对标 ChatGPT,在中 文上实现能力超越,在英文上实现能力的对齐。

1.2.星火大模型聚焦七大核心能力,向通用人工智能迈进

发布通用认知智能大模型测评体系,聚焦七大核心能力。科大讯飞和中国科学技术大学共同 承建的认知智能全国重点实验室牵头设计了面向通用人工智能大模型的测评体系,从 7 个主 要方向、481 个细分任务类型对模型效果进行细化评价,包括文本生成、语言理解、知识问 答、逻辑推理、数学能力、编程能力和多模态能力等,从而促使大模型的能力呈现更加客观。具体到星火大模型而言,发布会从七个方向对模型能力进行了全方位的展示,具备包括:多 风格、多任务长文本生成;多层次、跨语种语言理解;泛领域、开放式知识问答;情境式、 思维链逻辑推理;多题型、可解析数学能力;多功能、多语言代码能力;多模态输入和表达 能力。

一是多风格、多任务长文本生成。星火大模型可以实现多种文本生成功能,比如生成欢迎词, 创作一个特定要求的故事,还可以根据要求写作工作邮件等公文。此外,星火大模型可以实 现用多种语言生成文本,例如用英文生成一个品宣文案,并支持对文案进行翻译。不仅如此, 星火大模型还可以对文字用不同的风格进行再次创作,例如用小红书的风格重写文案等。我 们认为,多风格、多任务的长文本生成式大预言模型的基础应用之一,星火大模型已经具备 了相应的能力,为其他的应用奠定了基础。

二是多层次、跨语种语言理解。星火大模型可以实现不同层次的语义理解。如最细粒度的单 词和语法方面的检查,以及对于句子含义的理解,乃至最高层次的关于句子情感的分析。语 义理解是认知智能大模型的主要应用领域和研究方向之一,能够准确进行分词和情感识别, 也是未来复杂场景下任务处理的基础。三是泛领域、开放式知识问答。星火大模型针对生活常识、科学知识、工作技巧以及医学知 识等大众关注的领域,可以进行相应的回答,且仍在不断地丰富学习和完善中。例如,可以 询问专有名词的解释,一些医学领域的常识等,这类应用有望部分取代搜索引擎的功能,实 现知识的快速查询。

四是情境式、思维链逻辑推理。星火大模型可以实现常识推理、科学推理以及时空推理等多 方面的逻辑推理。我们认为逻辑推理能力是未来通用人工智能产生质变的重要能力,当前各 家大模型厂商均在尝试,客观而言逻辑推理能力相比人而言仍有较大差距,但是这是值得研 究和突破的重要方向。星火大模型具备了初步了逻辑推理能力,未来有望持续迭代升级。五是多题型、可解析数学能力。数学能力包括计算、代数、几何、解方程、情景应用等。数 学能力一定意义上代表了通用人工智能认知大模型的智慧水平。公司目前的星火大模型,已 经初步具备一定的数学解题能力。

六是多功能、多语言代码能力。这一能力星火大模型仍在迭代过程中,公司将在 8 月 15 日的新版本中进一步突破代码能力,从而实现为开发者赋能。七是多模态输入和表达能力。星火大模型一方面搭载了讯飞多年积累的语音识别和合成技术, 能够实现语音的输入和输出。另一方面,发布会展示了星火大模型对图像的识别,以及生成 虚拟数字人视频的场景。我们认为这些能力仍将进一步持续迭代,从而拓展星火大模型的应 用范围和场景。

大模型持续迭代,仍有问题亟待攻克。虽然包括星火在内的大模型已经具备了在多种下游任 务中的通用化能力,但是目前仍有部分问题亟待解决。例如对于新知识难以及时更新的问题, 对于时事类问答容易“张冠李戴”的问题,对于史实、传统典籍等容易“编造情节”的问题, 以及对于数学和逻辑推理方面仍需进一步提升。我们认为这是模型演进的未来方向,讯飞有 望在原有模型的基础上,通过多轮迭代,继续提升产品性能,真正向通用人工智能迈进。

2.从技术探索到场景落地,星火首发四类应用场景

围绕 1+N 大模型体系,首发四大类应用产品。科大讯飞除了做到核心技术“顶天”之外,也 在多个垂直应用领域建立了“根据地”优势。结合公司在垂直行业多年的深耕优势和产品, 公司此次发布会了搭载星火大模型的四大类应用产品。分别为:1)AI+教育:发布搭载星火 大模型的 AI 学习机新品,实现中英文作为的自动化批改;2)AI+办公:发布搭载星火大模 型的智能办公本,实现会议语音转写和纪要的语篇规整和一键成稿;3)AI+汽车:发布搭载 星火大模型的汽车座舱人机交互系统,提供多轮、多人、多区域、多模态的智能汽车人机交 互范式;4)AI+数字员工:发布搭载星火大模型的 AI 虚拟数字助手,实现导购、线上营销 等多种功能,以及实现工作流程的自动化(RPA)。未来,讯飞还将探索星火大模型在医疗、 智慧城市、司法、工业等场景下的落地产品。

我们认为,大模型能力和垂直场景的结合才能凸显相应的竞争优势,讯飞在教育、医疗、消 费者业务等领域深耕多年,掌握了大量垂直行业的专业数据,有助于实现模型的产品级应用, 从而真正跑通大模型的商业模式。

2.1.AI+教育:学习机实现自动化阅卷和英语口语自然对话

全新升级讯飞学习机 T20,搭载星火大模型实现类人教学。此次搭载星火大模型的第一个应 用场景就是 AI+教育场景,也是讯飞深耕多年的优势赛道。讯飞 AI 学习机自上市以来,得到 用户和行业的高度认可。在竞争激烈的学习机行业中,讯飞 AI 学习机市场 份额和品牌知名度持续提升,用户净推荐值 NPS 持续保持行业第一。2022 年科大讯飞 AI 学 习机销售额增长超 50%,继续强势增长并跑赢行业大盘。618 大促期间获得线上全渠道全周 期(天猫&京东&抖音)累计 GMV 排名第一,双 11 期间线上销量实现 100%增长;线下门店 数量增长 100%,线下销量连续两年增长超 100%。

此次星火大模型搭载后,学习机主要实现两种功能的提升:1)实现自动化中英文作文批阅: 作为一直占用老师非常多的批阅时间,且主观性较强无法实现千人千面的个性化教学,搭载 星火大模型的 AI 学习机,可以针对中英文作文的语法、句子、修辞方式等做出全方位的批 改,从而实现类人的阅卷模式。2)实现英语口语自然对话:口语对话一直是学生学习英语 的难点,搭载星火大模型后,学习机可以实现多轮自然的英语口语对话,助力学生实现口语 能力的提升。

2.2.AI+办公:实现会议纪要语篇规整和一键成稿

星火大模型融入 AI 办公全产品线,实现会议纪要语篇规整和一键成稿。讯飞拥有 AI+办公全 系列产品,包括讯飞智能办公本、讯飞智能录音笔、讯飞听见会议系统、讯飞耳机等各类产 品。其中,根据年报披露,讯飞智能办公本产品体系逐步完善,连续两年荣获 618、双十一 京东/天猫双平台电纸书类目品牌及单品销售额冠军,同时在线下市场领跑墨水屏办公本品 类,市场占有率第一。讯飞智能录音笔持续领跑智能录音笔行业。618、双十一期间,已连 续四年获得京东&天猫双平台录音笔品类销售额第一;已入驻 3630 家线下门店或零售网点; 用户遍布全球日、韩、东南亚、北美、欧洲、澳洲等 180 个国家和地区,连续三年荣获德国 iF 设计大奖。

此次搭载星火大模型的办公系列产品,主要实现了三大功能:1)会议纪要语篇规整:应用 星火大模型,可以将一篇转写的口语稿件变成书面稿,实现阅读效率提升。根据发布会描述, 语篇规整后的原文忠实度保持在 96%以上,关键信息几乎完全保留,同时将文章的篇幅缩短20%到40%;缩短之后由于看起来更规整、更通顺,阅读效率可以提升 50%以上。2)要点挖掘:通过星火大模型,实现会议纪要的摘要生成。例如对于一篇 7252 字的会议纪 要,可以生成 240 字的摘要,从而一目了然看懂会议重点。3)一键成稿能力:可以将一篇会议的转写纪要,通过一键生成的形式,形成不同风格和内 容的文稿,例如将其转化为新闻稿、宣传稿等,从而实现相应内容的一键成稿。

2.3.AI+汽车:实现更加智能的汽车人机交互

星火大模型赋能车载场景,实现更加智能的人机交互。讯飞车载智能座舱语 音交互系统,能够提供多轮、多人、多区域、多模态的智能汽车人机交互形式,服务车型超 过 1330 个,服务用户累计 4200 万,在汽车中文语音市场占有率持续领先。2022 年,公司智 能汽车业务新增前装出货量超过 710 万套,累计出货量超过 4610 万套,年度交互次数突破 30.4 亿次,平均月活用户 1488 万。此次搭载星火大模型之后,可以让汽车的人机交互再上 新台阶,实现更加自由、拟人化的人机沟通,真正实现系统对汽车的理解。

2.4.AI+数字员工:打造虚拟数字人和 RPA 平台

星火大模型打造数字员工,实现虚拟人定制和 RPA 自动生成。在数字员工方面,星火大模型 的赋能主要体现在两个方面:1)自由定制虚拟数字人:2021 年底科大讯飞推出 AI 虚拟人交 互平台之后,目前这个平台已经有超 1000 个虚拟形象资产,有 300 多个专业且不同的声音, 有 30 多万用户自定义的音库,目前已经在多个产业场景落地。搭载星火大模型的虚拟数字 人,能够更加智能、人性化地实现与人之间的互动,例如进行商场的虚拟导购,实现 24 小 时不打烊等。

2)打造生成式 RPA 平台:过去的 RPA 平台利用人工拖拽构建自动化流程,非 常依赖专业人员如业务流程专家和实施工程师,同时构建流程耗时周期长、成本高。现在有 了星火大模型的加持,RPA 就变成了深层次的自动化流程平台。只需要把需求流程场景描述 出来,就能自动生成所有流程。RPA 加星火大模型让企业与流程相关的工作,实现人人可操 作,降低了对专业人士的依赖,同时构建流程的周期变短、成本下降。

2.5.开放合作,共建人工智能“星火”生态

依托讯飞开放平台,构建星火大模型开放生态。公司除了实现核心技术的源头创新、垂直场 景的应用落地和产品发布之外,也一直致力于生态环境的构建。根据年报披露,讯飞人工智 能开放平台作为首批国家新一代人工智能开放创新平台,致力于向开发者提供业界领先的人 工智能核心技术,围绕开发者群体持续构建生态。同时,通过整合产业链多维度资源赋能开 发者创业团队,协力共建千行百业的人工智能商业化标杆案例。根据公司公告,截至 2022 年末,讯飞开放平台已开放 559 项 AI 能力及场景解决方案,聚集 398.1 万开发者团队, 总应用数达 164.6 万,链接超过 500 万生态合作伙伴。此次星火大模型发布会,公司将在 未来推动星火大模型的认知能力开放、插件开放和行业共创,真正实现星火大模型对千行白 业的赋能,也通过各领域的应用来反哺大模型的迭代,从而实现良性的产业循环。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

关键词: