栏目分类
热点资讯
IDC首发中国大模子本事评估论述:百度智能云中国第一
发布日期:2024-11-26 12:28 点击次数:160
近日,大家最初的IT市集规划和辩论公司IDC发布《中国生成式AI诓骗建造平台市集:企业妥洽AI建造平台的雏形》论述。该论述不仅对市集上主流的大模子平台厂商进行了对比分析,还为企业用户采选大模子平台提供了过失的本事目标。在这次评估中,百度智能云获取七项满分,位于悉数大模子平台厂商第别称。亚马逊云AWS、阿里云比肩第二名。
IDC论述指出,大模子平台给诓骗要领建造提供了一个新的旅途,企业在采选大模子平台的时间,应该要点怜惜厂商在模子层和数据层的才智。在模子层才智方面,若何让模子更好的适配企业的诓骗场景至关进犯。而在数据层才智方面,若何作念好RAG(检索增强生成),保证生成内容的准确性,摒除幻觉最为过失。
而在这两个方面,百度智能云皆有深厚的本事积聚。百度智能云千帆大模子平台(以下简称千帆平台)是大模子与AI诓骗建造及劳动平台,不错从模子建造、模子劳动、诓骗建造三大维度,为企业提供全经由劳动。当今,文心大模子日均调用量跳跃15亿次,千帆平台还是匡助客户精调了3.3万个模子、建造了77万个企业诓骗。
模子精调助力大模子与产业深度交融
大模子具有重大的泛化才智,不错处理好多通识类问题,但在某些特定行业及界限的弘扬不如东说念意见。这是因为不同业业有着特有的专科常识、逻辑和数据特色,通识常识无法全皆隐敝这些特等需求。模子精调是增重大模子在行业诓骗中弘扬的过失,通过将行业的专科常识和数据特征融入大模子,不错让其更好地知足行业特定需求,从而擢升诓骗的准确性和可靠性。
行业内主流大模子劳动商也正在通过大模子平台提供模子精调劳动,匡助企业快速打造AI诓骗。
AWS SageMaker集成了亚马逊的高性能预视察模子库,这些预视察模子在大界限的通用数据上进行了视察,还是学习到了丰富的特征暗示和常识,为模子精调提供了雅致的基础,同期,SageMaker 还提供了多种先进的机器学习算法,用户不错说明精调任务的特色和需求,采选顺应的算法来进一步优化模子性能。
百度智能云千帆大模子平台提供了齐全的器具链,是业界首个上线DPO、KTO等模子视察模范的平台,提供了高质料通用语料数据和开箱即用的模子精调样板间。不管是念念要我方准备数据、作念精调,照旧念念快速上手、复制行业最好引申,千帆平台皆不错高效复古。当今,在千帆平台上,每天有跳跃一半的调用量是来自精调后的模子。
拿医疗行业例如,杭州全诊医学基于千帆平台和文心大模子打造了AI医疗助理诓骗,省略在导诊、预诊、诊间、住院、手术、随访等全阶段劳动医师患者。以扶直医师撰写病历为例,全诊医学通过使用20万份精标病历数据对大模子进行了精调,使AI医疗助理的医学用语更准确、更模范,大幅擢升病历内容质料。病历生成的准确度擢升了45%,医师的接诊量提高了20%,造福更多病患。
RAG已成为企业惩处大模子幻觉问题的有用妙技
生成式 AI 已成为企业布局和投资的要点,企业但愿借助大模子已毕降本增效和居品立异。然则,通用大谈话模子(LLM)在骨子诓骗中相似存在幻觉问题或回应不准确的情况,尤其是在面向 B 端场景时,难以有用知足企业的落地需求。为惩处这一问题,企业常常罗致 RAG(检索增强生成)本事,将生成式 AI与企业里面数据库、常识库络续合,使生成内容愈加准确、合理。在此过程中,向量数据库凭借其在语义判辨和高效检索方面的特有上风,成为企业已毕 RAG 的过失构成部分。
不久前,IDC发布了《RAG与向量数据库市集远景展望》论述,对使用大模子的企业进行了深化调研。论述知道,在生成式 AI 的建造过程中,41% 的高管以为构建 RAG 架构至关进犯;此外,81% 的 IT 疏浚者以为,基于业务数据的生成式 AI 模子省略为企业带来权贵的竞争上风。这标明,RAG 本事在擢升通用大模子准确性方面效能权贵,且企业对其认同度正握续提高。跟着更多企业相识到 RAG 的进犯性,它有望成为生成式 AI 落地的过失推能源。
在分析了RAG和向量数据库市集的发展趋势后,IDC还评估了市集上的主要厂商。在这一评估中,百度智能云的向量数据库 VectorDB 在中枢肠能、功能全面性、大模子复古、政策与生态协调、工程化落地五个过失界限保握最初,抽象排行比肩第一。
当今,百度智能云 VectorDB 还是在跳跃 500 家客户中骨子落地使用,复古 HNSW、Puck、PQ 等常用算法,主流 LLM、RAG 框架,以及百度智能云千帆和开源 Embedding 模子,复古企业一站式部署落地。面向未来,百度智能云 VectorDB 将络续在居品步地、内核功能、生态复古三个方面要点发力,为企业 AI 诓骗落地劳动,提供最专科的向量数据库劳动。