发布日期:2026-02-15 08:02 点击次数:57


2024年九游会欧洲杯,跟着大模子应用逐渐长远以及多模态模子的快速发展,企业对算力的需求抓续加多,对算力的依赖性显耀进步。
从模子需求角度上看,说明Huggingface的模子下载量统计,现在模子的需求照旧呈现出两级分化的趋势,数百亿级以上的苍劲繁多模子,以及10B以下的小模子更受宽容。对此,智源究诘院副院长兼总工程师林咏华暗示:“从人人模子的发展情况来看,模子尺寸正呈现分化趋势。”
从算力的层面来看,现在仍呈现出“需求大、能耗高、效用低”的发展态势。以2020年发布的GPT-3与最新发布的LLaMA3-405B进行对比为例,尽管模子范畴仅增大2.3倍,但所需算力却增长了116倍。算法的革命使算力需求一直处于高增长景色,同期,算法结构的革命也带来了MoE、模子量化、定制算子等愈加复杂的贪图需求。
跟着工夫的控制更新迭代,多元多模的工夫发展也为客户的应用开垦提供了更普遍的遴荐空间和更高的纯真性。而“百花皆放”的各种性也带来了挑战:多元算力因各家硬件架构、请示集的各别以及算子库的孤独杀青,导致整个这个词生态系统割裂且难以酿成苍劲协力。
从现在发展角度来看,当下生态的近况举高了大模子应用的工夫门槛。工夫力量薄弱的传统企业用户,不仅在多元的芯片、模子中难以遴荐,何况即使部署见效,也存在软件框架多、易用性差等问题,也这使得后期开垦使用较为发愤。波澜信息高等副总裁刘军暗示,整个难题都汇总到小数——如何构建好一个可抓续的AI底层生态,让多元算力更通用、更普惠,让系统的算效更高、基础模子更好用。
12 月 25 日,波澜信息与智源究诘院达成战术配合条约,共同文书智源开源大模子通用算子库FlagGems认真接入波澜信息元脑企智 EPAI 企业大模子开垦平台, 面向大模子应用开垦场景提供苍劲的多元算力系统扶助,助力企业杀青更快速、更平时、更高效的多元算力适配与使用,大幅裁汰企业开垦大模子应用的算力门槛,共同促进多元算力系统生态的发展。
开源怒放显豁是现在构建生态的最好旅途,刘军暗示,开源怒放是革命活力的泉源,在互联网期间,开源怒放顽固了当年的工夫掌握,使得更多东说念主参与到开源社区,孝顺代码,孝顺思法,共谋发展。而在如今的AI期间,开源怒放会起到更大的、更积极的促进作用。
“具体来说,以应用为导向,以系统为中枢,以开源、怒放、多元多模来引发革命的活力,以系统革命全局优化来拓展革命的旅途,以协同共生怒放共赢的生态加快革命的落地,从而杀青AI革命和AI应用的协同发展,引发AI的革命活力,开源怒放是这内部的中枢和泉源。”刘军强调。
FlagGems 是由智源究诘院于2024年6月推出的面向多元算力的开源大模子通用算子库,在Triton 生态开源怒放的基础上,面向多元算力,除名斡旋的中间话语、斡旋的算子接口和斡旋的开源算子库杀青旅途,以大模子需求为导向,为多元算力提供开源、斡旋、高效的算子层生态接入决议。收尾12月,FlagGems已提供杰出130个大模子算子,是现在提供算子数目最多、隐敝广度最大的开源算子库。
元脑企智EPAI(Enterprise Platform of AI) 是波澜信息为企业 AI 大模子落地应用打造的高效、易用、安全的端到端开垦平台,扶助主流开源与闭源大模子的应用快速开垦,可杀青大模子应用在跨算力平台上的无感移动,裁汰多元、多模的适配与试错资本。
这次智源究诘院联袂波澜信息,将FlagGems算子库与元脑企智EPAI内置的中枢贪图框架进行深度和会,其中枢兴味在于—确保大模子应用开垦梗概使用高性能、跨硬件、多框架兼容的算子蚁合,凯旋越过各种硬件架构,骄横多种开垦框架的需求。
“波澜信息与智源究诘院在生态上不错酿成上风互补,智源究诘院是AI领域的一个新兴研发机构,在爱好原始革命,开源了许多的基础模子、算子库、OS(操作系统)、数据集等关键的究诘后果。”刘军进一步指出,“而波澜信息戮力于于为客户提供软硬件协同的全栈的AI基础设施的管制决议,在产业化落地领域,咱们有着相比丰富的生态扶助和推行教养。两边的配合,一方面将加快AI关连基础究诘在产业侧、行业侧的落地应用,另一方面,通过在产业侧的应用效果,控制修正和优化基础究诘的后果。”
据了解,在FlagGems算子库接入后,企业依托元脑企智 EPAI 大模子开垦平台,不错专揽针对大模子应用开垦场景优化的先进算子蚁合,在多种算力平台上高效构建、优化和践诺复杂的行业应用算法。在复杂的考验任务及及时性条件严苛的推理场景中,均能杀青踏实且高效的运算性能。
此外,企业无需眷注多元异构加快卡之间的软硬件各别,果真杀青大模子应用在跨算力平台上的无缝开垦与移动。而开源怒放的生态关于AI大模子的应用落地起到了关节作用,不错有用裁汰大模子落地的试错资本、革命资本,以及应用资本。(本文首发于钛媒体APP,作家|张申宇,剪辑丨盖虹达)