百模大战,行至中场。
2023年5月中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,参数在10亿规模以上的国产大模型,彼时已发布79个。数字在随后的7月破百。“百模大战”至少在赛道选手数量上已经坐实。
前期在基础能力上的研发比拼接近尾声,中场的竞争聚焦在基于应用的产品层面。
我国的大模型,有多个已经推出文本创作、图表生成、图文生成视频等产品功能。2023年8月15日,星火认知大模型V2.0发布,iFlyCode1.0、教育数字基座、畅言智慧课堂星火教师助手等产品上线,讯飞智作、星火语伴、科大讯飞AI学习机等产品升级更新。
星火大模型上线100天的节点,科大讯飞在生成式人工智能上的进化速度令人咋舌。早前在中国信通院发布了大模型优秀应用案例中,科大讯飞AI学习机、智能办公本和智能RPA三个应用案例被评为大模型优秀应用案例。
通用人工智能上,多模态能力显得关键。数据能看出端倪,2023年5月-6月,科大讯飞C端硬件GMV创历史新高,同比翻倍增长。以学习机为例,5月-6月,大模型加持后学习机GMV分别同比增长136%和217%。
应用产品的开发,也需要星火整个生态平台的能力聚合。星火大模型的100天节点中,科大讯飞人工智能开放平台新增70万个实名认证的开发者团队,相当于每天新增7000个开发者团队。而自6月9日星火大模型V1.5版本发布以来,已有4109个助手开发者团队开发出7862款星火助手。
伴随星火2.0版本的迭代,讯飞展现给世人的产品也是可圈可点。能用两个手指捏合写字的“凌空手写”功能,2022年的1024节就被人孰知。本来至少需要半天的开发过程,现在通过iFlyCode1.0只需要几分钟就可以完成。而在8月15日前,科大讯飞研发效能平台已经用2000多名内部开发人员作为样本,对iFlyCode1.0的开发效率做了周期一个月左右的内测,结果显示在一些典型场景中,iFlyCode1.0代码采纳率达30%,编码效率提升30%,综合效率提升15%。
讯飞智作2.0,也是星火认知大模型2.0的多模态能力在AIG上的应用升级。这已经是一个拥有超过375万总用户量,生产出超过2100万个视频作品的AIGC内容生产平台。在背后的大模型能力升级后,讯飞智作2.0能够更精确的理解用户的创作意图,满足多元的视频制作需求。
另外,在科大讯飞24年来日益重要的核心产业场景之一的教育方面,讯飞的畅言智慧课堂已经在全国1200多万师生中广泛使用。匹配星火教师助手,在星火认知大模型V2.0的理解能力基础上,可以根据学科内容进度完成单元教学设计、课堂活动设计,甚至一键生成课件。上海、广东、安徽等一线教师试点体验后,结果显示星火教师助手可以提升50%以上的单元教学规划和课件制作效率,教学活动丰富度也提升了20%以上。
作为口语陪练老师的星火语伴也升级到了2.0版本,主题对话数量从73个提升到了393个,多模态能力下的虚拟人沉浸式陪练机制进一步加强。并且相比之前,星火语伴2.0新增了CET、雅思、托福的智能评价反馈以及新的情景交流功能,后者支持图片、文档自定义情景。
就在星火大模型2.0发布的同一天,由国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布的《生成式人工智能服务管理暂行办法》(以下称《办法》)正式施行。《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展。算力安全和内容安全,成为对每一个大模型的标准要求。
核心的安全可控方面,星火认知大模型针对污语料和幻觉问题形成立体化的“内容安全机制”,保障大模型进入行业之后的内容安全。华为作为科大讯飞的合作伙伴保障算力安全。星火一体机基于昇腾AI硬件、昇思AI开源框架,提供业界领先的大模型训练、推理能力,为大模型全流程创新提供坚实的自主创新算力底座。
看起来,科大讯飞正在引领中国的通用人工智能的产业细化应用发展。刘庆峰和他的讯飞团队以及星火开放生态平台,已经锚定下一个时间节点:10月24日,实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。照此演进,明年上半年星火对标GPT-4应该也不是问题?让人期待。