首页 资讯 正文

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

体育正文 99 0

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

“星汉灿烂,若出其里。”人工智能迈入闪耀(shǎnyào)时刻。 4月29日,习近平总书记来到位于徐汇区的(de)上海“模速空间”大模型创新生态社区调研。他指出,人工智能技术加速迭代,正迎来爆发式发展(fāzhǎn),上海要总结好以(yǐ)大模型产业生态体系孵化人工智能产业等成功经验,加大(jiādà)探索力度,力争在(zài)人工智能发展和治理各方面走在前列,产生示范效应。 如今,徐汇区已(yǐ)形成(xíngchéng)“北斗列阵”+“群星闪耀”的AI生态布局。其中,“北斗七星”由稀宇(xīyǔ)科技、商汤科技、阶跃星辰、无问芯穹、星纪魅族、特赞科技和斑马智行7家标杆企业构成。 这些企业(qǐyè)何以成为“北斗”?它们在人工智能领域有哪些探索和前瞻性的思考?澎湃新闻推出“北斗专访”系列报道,通过深度(shēndù)对话,解码标杆企业的AI星辰(xīngchén)版图。 作为企业掌舵人,清华大学电子工程系毕业夏立雪身上带有理工科(lǐgōngkē)学生的气质。如今(rújīn)他的身份是无问(wèn)芯穹CEO,常穿公司文化衫或西装出席公开场合,每次采访均准时现身。 面对澎湃新闻记者的提问,他(tā)总会迅速作答,有问必答、条理清晰(tiáolǐqīngxī),即使谈及激烈而残酷的竞争,也保持平和而克制的语调。 来到(láidào)上海发展,这个出生于1991年的青年企业家开始喜爱这座城市。“上海确实让(ràng)我有很大的一个感触,它和年轻人是很匹配的。我们公司(gōngsī)平均年龄32岁(suì),年轻人喜欢上海,可能因为它的文化基因更加开放和活泼。” 无问芯穹至今成立(chénglì)刚满两年,融资近10亿元。接下来(jiēxiàlái)要不要上市,夏立雪似乎并不心急。他说:“我(wǒ)相信只要坚持做好两件事,既有技术的持续领先(lǐngxiān),又有商业化的成功,上市只是一个水到渠成的事情。” 无问芯穹,位于上海(shànghǎi)徐汇滨江模速空间一楼。受访者 供图 摆在眼前(yǎnqián)的,是AI竞争来到“深水区”。2025年,大模型在算力上的比拼正发生深刻转变(zhuǎnbiàn):从原来的“比谁(shuí)有更多GPU”,演变成了“比谁能更聪明、更经济地用好手中算力”。 “我们现在需要考虑的是,在算力资源有限的情况下,怎么去解决模型持续增长的问题?”在夏立雪看来,AI的任务越来越多样,芯片(xīnpiàn)技术(jìshù)越来越细分,算力资源越来越紧张——于是,“用最适合的芯片做(zuò)最适合的任务”就(jiù)成了大趋势(qūshì)。比如,适合训练的芯片专注训练,适合推理(tuīlǐ)的芯片完成推理,适合端侧的芯片负责部署。更重要的是,要发挥异构算力资源的整体效能。 无论(wúlùn)对中国还是全球,整合多元(duōyuán)异构算力已不再是权宜之计,而是技术演进、成本压力和应用多样化之下的一个必然方向。 2025年(nián)5月,上海模速空间,无问芯穹(xīnqióng)公司门口。澎湃新闻记者 李佳蔚 图 中国算力资源的(de)(de)一大突出特点是多元异构。市场上主流CPU生态(shēngtài)有5种以上,GPU生态则多达10种以上,不同的算力芯片(xīnpiàn)、服务器形态、存储形态,以及网络形态组合配置在一起,可以形成成百上千的组合。 “没有用不完的英伟达(wěidá)(wěidá)GPU,也不是(shì)必须(bìxū)用英伟达的GPU。”夏立雪说,AI企业如今更关注“用对芯片”,而非“用贵芯片”。掌握整合多元异构算力的核心技术,是中国确保人工智能安全、可靠、可控的一部分。 他进一步谈到,“打开水龙头,我们可能(kěnéng)不知道水是从哪个(něigè)水库过来的,只知道它是标准化的自来水。同理,作为算力运营商,我们要调用不同(bùtóng)的基座模型、使用不同的算力芯片,最终为AI企业提供(tígōng)标准化的算力服务。” 澎湃新闻:这两年大模型技术更迭非常快,每年都有新焦点,你(nǐ)对行业变化(biànhuà)有什么感受? 夏立雪:这(zhè)两年人工智能发展飞速变化,前年我们在讨论大语言模型,去年多模态已经进入(jìnrù)视野(shìyě),今年的推理模型大家也习以为常了,技术飞快地迭代。随着模型能力增强,背后是模型的体量增大。 人工智能依然遵循Scaling Law(尺度定律(dìnglǜ)),对算力的(de)需求越来越大,大到了一个什么程度?大到了你不能再假设你的资源是(shì)无限的。前两年训练(xùnliàn)模型的时候,很多大厂有一个基本假设,算力是无限的,至少在做单一任务时算力是无限的。但是,现在这个假设的边界已经逼近,我们需要考虑,中国的算力资源是有限的,怎么去(qù)解决模型持续增长(chíxùzēngzhǎng)的问题? DeepSeek提供了一个很好(hǎo)的例子,它没有用(yòng)“大力出奇迹”的方式,而是(érshì)用低成本、高效率的方式,在资源有限的情况下造出了一个好模型。所以,在打造更好的模型方面,现在我们需要更加精细化(jīngxìhuà)地把现有算力资源用好。 另外,我们还要考虑供需关系的问题。比如,当很多(hěnduō)算力(suànlì)资源被用在(zài)模型训练上,而推理落地的算力需求也在上升,那后者的资源就有限了。这中间,算力资源的供需匹配和性价比是一个很大的挑战。 当前,我们特别(tèbié)需要把没有被(bèi)用起来的算力资源充分利用,同时要确保使用效率高。如果你拿来的算力不好用,大模型跑得非常卡,三秒才(cái)出一个字,那没人愿意用。 2025年(nián)5月,上海模速空间,无问芯穹办公空间一隅。澎湃新闻记者(xīnwénjìzhě) 李佳蔚 图 澎湃新闻(xīnwén):算力资源有限,是中国特有的还是全球性问题? 夏立雪:大多数国家都面临这个问题,只是(shì)有些国家会选择(xuǎnzé)放弃。在AI大模型的赛道上,目前来看主要是中国和美国仍在坚持,随着模型不断增大,都会面临算力资源(zīyuán)有限的瓶颈。 澎湃新闻:你提到算力供需错配,这是怎么回事(zěnmehuíshì)?这个市场(shìchǎng)痛点如何解决? 夏立雪:现阶段,算力(suànlì)市场的(de)供需错配是比较明显的。举个简单例子,由于使用习惯问题(wèntí),大家都优先选择所谓的高质量算力,最尖端(jiānduān)的GPU,它经过(jīngguò)市场验证,一定好用。但(dàn)问题是,每家企业都需要用尖端卡吗?对性能要求不高的企业,用一般性能的GPU行不行?不同企业需求不同,可以用不同的卡。如果所有企业都抢最尖端的卡,一方面成本极高,另一方面资源很快短缺。 事实上,市场上还有大量性能不错(bùcuò),但(dàn)没有被关注或接受的(de)算力,我们要让这些算力都被利用起来。这当中要解决一些问题,比如,这种算力和模型是不是(shìbúshì)适配,企业会不会用。异构卡出于不同的设计理念,会有很多性能差异,适配不同的任务,因此多种不同类型的卡展现出的效率差异会导致大规模分布式训练变得低效(dīxiào)。 我们有一个公式,AI模型的算力=芯片算力×优化系数×多元异构能力。其中(qízhōng),优化系数是(shì)通过软硬件协同发挥芯片算力最大价值的能力;多元异构,则(zé)是让不同类型的算力资源都进入算力池,并(bìng)实现算力适配的能力。 打开水龙头,我们可能不知道水是从哪个水库过来的,只知道它是标准化的自来水。同理,作为(zuòwéi)算力(suànlì)运营商,我们要调用不同的基座模型、使用(shǐyòng)不同的算力芯片,最终为AI企业提供标准化的算力服务。 2025年5月,上海模速(mósù)空间,无问芯穹成立2周年的一处照片墙(qiáng)。澎湃新闻记者 李佳蔚 图 澎湃新闻:既然(jìrán)AI任务变得越来越多样化,芯片技术也越来越细分,是不是意味着算力应该用在最适合(shìhé)它的地方? 夏立雪:是的,企业手里有算力,一定要把它用好。算力需求本身是分层的,供给也应该分层。一些芯片更适合承担大模型(móxíng)训练的高吞吐任务,另一些则在低延迟、低功耗的推理场景中更有优势,还有些专为(zhuānwèi)端侧部署设计(shèjì),追求轻量化(qīngliànghuà),实时响应。不同类型的AI应用,匹配最适合的算力资源,才能在性能、效率与成本之间找到(zhǎodào)最优解。 澎湃新闻:能否解释一下(jiěshìyīxià),在庞大的AI产业当中(dāngzhōng),你们具体提供怎样的产品和服务? 夏立雪:就像刚才说(shuō)的,我们有点像一个“自来水厂”,从不同(bùtóng)水库(shuǐkù)调取水源,经过统一标准化的处理,再供给到千家万户。我们也像是大模型算力(suànlì)的电商平台,你要部署AI应用,可以(kěyǐ)像在电商平台上购物一样,在我们这里(zhèlǐ)选择不同芯片、不同模型,选购最适合自己的组合套餐。最终,我们希望让更多的企业能用得起算力,也用得好算力。 目前,无问芯穹拥有全球首个可进行(jìnxíng)单任务千卡规模(guīmó)异构芯片混合训练的平台,支持包括华为昇腾、天数智芯、沐曦、摩尔线程与AMD、NVIDIA六种异构芯片在内的大模型(móxíng)混合训练,集群算力利用率(lìyònglǜ)最高可达97.6%。 澎湃新闻:你(nǐ)是清华博士,也是“90后”,你怎么看如今越来越(yuèláiyuè)多的科学家和年轻人投身AI行业? 夏立雪:这两个问题在(zài)人工智能行业是有统一性(tǒngyīxìng)的。也就是说,科学家创业和(hé)年轻人创业,在人工智能行业很普遍,也很匹配。人工智能是一个快速迭代的技术体系,现在很多技术都来不及写书(xiěshū)、来不及成为教材,就已经被广泛应用起来了。和传统上我们先(xiān)在学校学习,然后才进入行业应用的模式非常不同。 我(wǒ)们(wǒmen)公司平均年龄只有32岁,比我更小,如果算上实习生,那平均年龄才28岁。2023年我们公司推出的第一个在业界打响名气(míngqì)的推理加速方法FlashDecoding++,通过异步方法实现注意力计算的真正并行,它就是(jiùshì)一个年仅24岁的实习生作为主要贡献者实现的,那年她也拿到了我们公司最高荣誉(róngyù)“无穹之星”。所以在这个行业,年轻人(niánqīngrén)大有可为。 澎湃新闻:来到上海,你(nǐ)对这座城市以及这里的人工智能发展环境(huánjìng)有什么感受? 夏立雪:北京、上海都(dōu)是人工智能很强的(de)城市,有各自不同的优势。上海确确实实让我有很大的一个感触,就是它和年轻人(niánqīngrén)的匹配,可能因为它的文化基因更加(gèngjiā)开放、更加活泼,年轻人生活工作在其中比较舒适。这种环境既有利于创新,也吸引了大量人工智能企业的聚集。 澎湃新闻:无问芯穹是否有融资压力,考虑上市(shàngshì)吗? 夏立雪:我们有(yǒu)(yǒu)自己的技术理想,同时也(yě)考虑商业化落地。从公司发展角度,一方面我们会继续坚持一套自主、可控的技术方向,符合且服务国家需求;另一方面,我们不是(búshì)(shì)一家研究院,我们乐于追求商业价值,不仅仅是给股东交答卷,更是要让技术接受市场的验证。我相信只要坚持做好两件事,既有(jìyǒu)技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。 澎湃新闻:无问芯穹是首批入驻模速空间的企业,讲一个(yígè)你(nǐ)对模速空间的深刻印象吧。 夏立雪:我们(wǒmen)公司和模速空间共同成长,感情很深。模速空间为我们提供(tígōng)了全方位的(de)贴心服务,并给予了大力支持。这里聚集了大量人工智能上下游企业,我经常上楼找其他(qítā)同行聊一聊天,相互交换一些行业早期的信息和判断,这对各自发展都有好处。另(lìng)外,我们很多合作(hézuò)也是这样达成的,有时模速空间两家企业相互合作,有时我们携手去服务外部的另一个客户。在这里,机遇非常多。 澎湃新闻高级(gāojí)记者 李佳蔚 (本文来自澎湃新闻,更多原创资讯请下载(xiàzài)“澎湃新闻”APP)
北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~