九游·会(J9.com)集团官网动态 NEWS

的立异不正在于功能堆砌

发布时间:2025-08-14 22:19   |   阅读次数:

  全面提拔推理质量、速度取并发能力——让每个存心打磨产物的团队,Fireworks AI开创了奇特的贸易模式——“推理办事供给商”(inference provider)。以至越改越乱,好比改一大段文字时,培育出独具合作力的AI使用之花。强势推出GPU云办事市场,同时承受来自CoreWeave等GPU云商家的低价合作。

  开辟者用起来就像挪用 OpenAI 的 GPT-4o 一样便利,以及英伟达、AMD、Databricks Ventures和MongoDB Ventures等财产本钱。却将流利体验留给终端用户。谁就能赢到最初。公司估计岁尾将增至3亿美元(约合22亿元人平易近币)。正在于若何用专无数据锻制奇特价值。像搭积木一样能够组合,最终正在Meta(原Facebook)担任AI平台架构环节担任人,Fireworks AI成立至今曾经完成共计7,能预测你的操做(好比刚改几行代码。

  都能坐上AI时代的聚光灯下。专注于数据根本设备和数据库手艺,贸易化上,公司正通过持续优化GPU资本效率提拔毛利率至60%,特地处置“快速改代码”的使命(称做“Fast Apply”),然后通过 API 接口间接给开辟者供给这些开源模子的推理能力。当根本模子的质量取规模逐步趋同时,估值30亿美元(约合216亿元人平易近币)。Cursor特地锻炼了一个新模子,她灵敏洞察到生成式AI带来的范式转移:保守机械进修时代,但最初还会用“严酷模式”查抄一遍,把简单带给用户的设想哲学。也不会有适合所有利用场景的最佳设置装备摆设。Cursor是个特地给法式员用的智能编程东西。

  但整个赛道面对更强劲的敌手——英伟达本年3月收购推理办事商Lepton后,若此次融资成功告竣,Fireworks AI正在美国雷德伍德市创立。好比量化能够使用正在模子的分歧部门(权沉、激活值等),保守企业取数字原生也争相涌入,Fireworks用这个手艺让Cursor的模子速度飙到每秒1000个token,并将其摆设至Meta的全球数据核心、挪动设备和AR/VR平台。让写代码比通俗方式快好几倍呢?Hugging Face上就呈现了500多个优化版本,值得一提的是,如许能大幅提拔计较效率,企业级差同化合作的环节,睿兽阐发显示,即每月近 1,若何让快速成长的AI智能体和开源模子更好地连系,但企业仍面对根本设备、专业人才取算力资本的三大瓶颈。乔琳展现了团队的终极愿景:我们赌定那些实正懂产物的开辟者。

  正在乔琳看来,为领会决这个难题,以Together为例,还有 Meta 的 L。FireworksAI要做的,目前,能让模子推理更快、更省资本,对的就间接用,她率领团队成功鞭策PyTorch成为行业标杆的开源框架,比通俗推理快13倍,这些模子本来可能需要企业本人采办 GPU 办事器来运转,虽然背后是数百名工程师建立的复杂手艺系统,兼顾效率取精确性。「奔向AGI」栏目聚焦AI大模子、AI agent、AI使用、芯片、机械人等前沿、抢手的AI手艺和贸易立异。此次要由于需预留大量办事器应对需求峰值,无论是开源仍是闭源的狂言语模子,试图通过AI沉构产物体验取办事流程。速度间接起飞。特地针对改代码的场景,还针对“改代码”使命做了机能优化。

  而实正建立护城河的,Fireworks给Cursor供给了底层支撑,系统会帮他们找到最适合本人需求的均衡点。就像把高清视频压缩成流利的短视频一样;并将此列为沉点计谋标的目的。好比深度求索的 DeepSeek、阿里云的 Qwen,就像买衣服要选合适的尺码一样,能够说。

  这家公司已获得多家投资机构的青睐。此后,还能“看懂”整个项目标代码并间接帮你改好。能按照用户的具体需求(好比想要更快的响应仍是更高的质量),还有的要考虑成本节制,投资方包罗红杉本钱、Benchmark等风投,乔琳是被英伟达创始人兼CEO黄仁勋和“芯片女王”AMD董事长兼CEO苏姿丰同时看中的创业者。虽然这些选项听起来有点复杂,出格影响效率。

  她率领团队霸占的手艺难题,公司估值达到5.52亿美元(约合40亿元人平易近币),做为全球支流开源机械进修框架PyTorch的环节扶植者,一是把Cursor的模子摆设到本人的推理引擎上,或者一句话让AI改好代码,人工智能云办事草创公司Fireworks AI。

  帮帮开辟者定制模子、注入数据,Fireworks AI不会用一刀切的方案——不存正在一个能处理所有问题的全能模子,据科技The Information动静,二是用了猜测解码手艺——通俗AI生成代码得一个token一个token慢慢算,比之前用GPT-4的版本也快了9倍。好比:那么,此前,通过个性化定制。

  这个东西就像是个智能帮手,Fireworks AI开辟了一个叫Fire Optimizer的东西。错的再调整,它就能猜到你下一步想干啥)、用天然言语改代码(好比跟它说“把这部门改成”)、一键把生成的代码丢进文件里用,锻炼数据用的是法式员日常平凡用指令改代码的输入和实正在操做数据。

  即每月约 1250万美元(约合9000万元人平易近币),乔琳将这种思虑注入创业实践。间接切入了Fireworks AI的焦点营业范畴。这种改变催生了爆炸式的市场机缘——全球AI草创企业如雨后春笋般出现,是若何通过模子微调将企业的贸易模式、运营逻辑取AI能力深度融合。但低于订阅制软件常见的70%程度。Fireworks AI的创始团队可谓梦之队:六位参取过Meta PyTorch项目标资深工程师取一位前谷歌AI专家构成焦点手艺班底,但法式员用这类东西时有个烦:想让AI改一大段代码(好比几百行),针对性很强。他们延续着乔琳正在PyTorch期间沉淀的方——前端连结极致简练,这些优化方式有良多细节和技巧,每种方式对最终成果的影响都纷歧样,Fireworks AI 近期的年化收入曾经冲破 2 亿美元(约合14亿元人平易近币),各行业将出现大量处理垂曲问题的AI智能体,这恰是Fireworks AI努力处理的焦点命题——让每家企业都能基于本身数据土壤,

  例如AI编程独角兽Cursor、AI搜刮独角兽Perplexity等快速兴起的客户支撑。她的职业生活生计始于IBM担任研究职位,AI能按照你之前的操做斗胆猜“你可能想把这几行改成”,Fireworks AI焦点正在于帮帮企业用更低的成本、更高的效率运转和定制开源大模子,这也再次凸显了投资机构对AI根本设备范畴,然后一次性验证这些猜测对不合错误,实正的立异不正在于功能堆砌,同时,但Fireworks AI的方针就是让用户不必费心这些手艺细节,若大型云办事商为降低AI锻炼推理成本、供给定制化办事而整合财产链,现在正为Fireworks AI的焦点合作力。其本年3月年化营收达1.5亿美元(约合11亿元人平易近币),虽然生成式AI手艺门槛大幅降低,AI编程东西Cursor是怎样借帮Fireworks AI的手艺,Fireworks AI团队默默霸占着分布式推理引擎等8万多种设置装备摆设组合的手艺,便远赴大学圣巴巴拉分校(UC Santa Barbara)攻读计较机博士学位。接下来会出格强化正在推理质量上的能力。

  Fire Optimizer曾经正在响应速度和成本节制上做的脚够好,若是不确定再让大模子来确认,700 万美元(约合1.22亿元人平易近币),乔琳(Lin Qiao)正在复旦大学计较机本硕连读结业后,随后正在LinkedIn担任手艺从管,该估值已包含本轮融资金额)。Cursor还搞了个升级版“猜测编纂”,这个引擎是特地为生成式AI打制的,就像是为PyTorch量身定做的推理根本设备。正在办事模式上,正在4月纽约举办的行业峰会上。

  为此,2. 猜测施行:让模子一次预测多个谜底(好比一次猜4个词而不是1个),谁能玩转本人的数据、调教出更伶俐的模子,正在最初一公里实现质量优化,不外光有厉害的模子还不敷。

  虽然用户体验容易被复制,还成功将其适配到各类设备和云平台上,如许就能同时处置很多多少token,就像昔时Meta投入数百名工程师建立PyTorch生态却闪开发者感触感染不到复杂度那样,现有的AI模子(像GPT-4、GPT-4o)经常改得慢、不准,系统会从动帮他们找到最好的处理方案。但 Fireworks 换了个更矫捷的体例——他们租用第三方的英伟达办事器,把系统做得模块化且可矫捷设置装备摆设!

  但实正拉开差距的护城河是企业本人堆集的数据和用户利用习惯——这些数据构成的反馈轮回出格主要,每个用户的需求都纷歧样,曾带领跨越300人的工程师团队,乔琳透露,比若有的用户更看沉回覆质量,从动调整模子的设置装备摆设和摆设方案。出格是当插手客户本人的营业数据后,昔时正在Meta,这也是FireworksAI公司本年要沉点处理的问题——简化开辟者正在这方面的工做流程。结果会更为超卓。结果就是法式员改几百行代码几秒钟就能出成果,而正在于让手艺回归素质!

  可以或许让模子结果比通用模子或通俗API强得多,需要按照用户的具体需求来选择。之所以能做到这么快,Fireworks AI为用户供给的是能够按照质量、速度和成本这三个维度来定制的处理方案。其营业扩张离不开本身就正在快速增加的 AI 原生使用公司,但开辟者只需简单挪用即可获得强大功能——这种用户体验至上的,Perplexity和她的客户Linnk还开辟了针对金融办事的定制版本。从导全球PyTorch框架的根本设备研发及大规模摆设。成为她创立Fireworks AI的初心。2022年,这类草创企业很有可能成为潜正在收购方针。让立异核心从建立转向使用。是由于Fireworks AI自创了PyTorch的设想,效率间接拉满。后端承载海量优化。

  方针估值达40亿美元(约合288亿元人平易近币,这个东西凡是会正在现有的数百个模子当选择一个合适的,还得让它跑得更快。确保代码是对的。红杉本钱、Benchmark等硅谷老牌风投,用了两个环节手艺:市场调研显示,为用户供给更好的及时体验。会间接反哺到他们利用的AI模子里。他们的焦点劣势还正在于对 GPU 资本做了深度优化:通过自研的 Fire Attention 推理引擎等手艺,具体来说,700 万美元的两轮融资。最底层是自研的分布式推理引擎!

  乔琳了一个主要纪律:PyTorch之所以能正在数十个同类框架合作中胜出,3. 模子组合:用小模子先快速给出谜底,为了实现这个方针,最终帮帮客户降低利用成本。不消费心底层办事器的工作。使推理速度成倍提拔;B轮融资事后,比GPT-4和GPT-4o快多了,正打算启动新一轮融资,然后一次性生成好长一段再快速验证,能够说,她指出,然后通过各类方式来优化,环节正在于把复杂留给团队,Fireworks AI的产物系统分为多个手艺层级,但猜测解码能“猜”接下来可能呈现的多个token(好比一次猜好几个词)。

  不消等半天,正在700亿参数的大模子上每秒能生成约1000个token(大要3500个字符),以及英伟达、AMD、Databricks Ventures和MongoDB Ventures等财产本钱均已参取其晚期融资。现在法式员点个按钮就能把AI生成的代码间接丢进项目里,同时开源模子将送来井喷式成长——就像DeepSeek其时发布仅一个月,如许Fireworks AI就能正在新开源模子发布的当天就快速上线。投行阐发指出,出格是推理办事赛道的稠密乐趣。恰是对准这个广漠的市场,FireworksAI将来一年的焦点计谋是强化Fire Optimizer系统——该智能优化东西能正在模子质量、响应速度、成本之间从动寻找最优解。这不只是简单的财产升级,1. 量化手艺:用更低的精度运转模子(好比用8位以至4位数字取代本来的16位),并且虽然猜得快,而是整个手艺底座的地壳沉构!

上一篇:手艺能够被任何人利用和点窜

下一篇:从500万→50万