百度飞桨生态成果最新披露:开发者数已达800万 模型数超80万

山西晚报   2023-08-18 00:16:05

8月16日,由深度学习技术及应用国家工程研究中心主办的WAVESUMMIT深度学习开发者大会2023举办。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,大语言模型具备理解、生成、逻辑、记忆四项能力,为通用人工智能带来曙光。会上,百度发布文心大模型、飞桨平台、AI原生应用如流等一系列技术、产品及生态成果。

据悉,得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进,飞桨生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。王海峰阐释了飞桨开发者社区AIStudio中文名“星河社区”的隽永含义,“文心加飞桨,翩然赴星河”。

王海峰进一步表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力。


【资料图】

以文心一言为例,作为百度自主研制的知识增强大语言模型,文心一言首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,并采用有监督精调、人类反馈的强化学习和提示等技术,具备知识增强、检索增强和对话增强等技术优势。

近几个月来,文心一言持续快速进化。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布文心一言的五个原生插件:百度搜索、览卷文档(基于文档的交互)、E言易图(数据洞察图表生成)、说图解画(基于图片的交互)、一镜流影(文字转视频),文心一言现支持一次同时使用3个插件。

吴甜披露,AIStudio(星河社区)已是中国最大的AI社区,凝聚了609万个开发项目。大会现场,AIStudio(星河社区)进行了最新升级,正式推出星河大模型社区,让开发者可以获得一体化大模型开发体验。飞桨+文心贯通全开发流程,与开发者持续共创大模型项目和应用。目前,星河大模型社区已积累超300个大模型创意应用。会上同时正式启动大模型插件的邀请测试,大模型插件依托于“文心一言”的核心技术,为大家提供了插件开发工具集,可以进行信息服务类、工具类,以及基于大语言模型创新类的插件开发。通过平台接入进来之后,可以和应用层生态进行紧密结合。吴甜还宣布推出文心大模型“星河”共创计划,提供生态和产业资源,与广大开发者共同推动人工智能应用创新。

文心一言的快速进步,得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进。据悉,在效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署协同优化,文心大模型训练速度达到原来的3倍,推理速度达到30多倍。

大会现场,百度AI技术生态总经理马艳军正式发布飞桨开源框架v2.5版,基础架构全面升级。新架构微分功能更完善,性能优化更通用。同时,飞桨科学计算工具组件赛桨PaddleSciencev1.0正式发布,飞桨螺旋桨PaddleHelix发布HelixDock蛋白-化合物构象亲和力预测大模型。

飞桨还推动建设了软硬件适配的国家标准。由中国电子技术标准化研究院牵头,百度、曙光、飞腾、浪潮一起联合起草了国家标准《人工智能深度学习框架多硬件平台适配技术规范》。基于该国家标准,文心大模型与英伟达、中科曙光、昆仑芯、寒武纪、华为、天数智芯、壁仞科技、高通、英特尔、联发科、摩尔线程、安谋科技等12家硬件伙伴开展了适配,覆盖了云和端侧多种硬件类型。

基于AI原生思维,百度集团副总裁、百度集团首席信息官李莹宣布,百度智能工作知识管理理念“创新流水线=AIX知识管理”升级到2.0。同时,正式发布百度如流“超级助理”。现场,李莹围绕移动端任务执行、智能文档处理、CBI会话式商业智能、智能沟通等四大场景,对“超级助理”进行了10余个演示。

业内认为,企业办公领域的重大变革,是大语言模型为代表的人工智能加速各行各业转型升级的一个缩影。在这个进程中,技术创新和应用落地形成良性循环,理解、生成、逻辑、记忆等能力持续提升,产业应用的广度和深度持续拓展,大语言模型为通用人工智能带来曙光。