欧洲杯体育这是专为AI责任负载联想的RISC-V芯片-开云体育登录入口kaiyun官网首页
发布日期:2026-04-02 06:48    点击次数:114

欧洲杯体育这是专为AI责任负载联想的RISC-V芯片-开云体育登录入口kaiyun官网首页

生成式AI的兴起鼓舞了对能在土产货硬件上运行或寻查模子的AI责任站的需求。但是,当代PC已被讲解注解不及以胜任这一任务。典型的札记本电脑唯有实足的内存来加载具有80亿到130亿参数的大谈话模子,这比据揣摸领有升迁一万亿参数的前沿模子要小得多欧洲杯体育,智能经由也低得多。即使是最壮健的责任站PC也难以为领有升迁700亿参数的大谈话模子提供行状。

Tenstorrent公司的QuietBox 2试图填补这一空缺。尽管它看起来像一台PC责任站,但QuietBox 2包含四个该公司定制的Blackhole AI加快器、128GB的GDDR6内存(GPU中使用的专用内存)和256GB的DDR5系统内存(所有这个词384GB)。这种成就提供实足的内存来加载OpenAI的GPT-OSS-120B,何况不错以接近每秒500个Token的速率运行Meta的Llama 3.1 70B等中等限度模子。看成参考,这比OpenAI的GPT-5.2或Anthropic的Claude 4.6的平均响应速率快几倍。QuietBox 2的预期零卖价为9999好意思元,策动于2026年第二季度发布。

Tenstorrent和洽独创东谈主兼系统工程师Milos Trajkovic说:"咱们AI加快器所领有的128GB GDDR信得过界说了你能以合理速率运行多大模子。咱们的128GB GDDR6 RAM需要四块Nvidia RTX 5090显卡才智终了。这无法装进今天1600瓦的风光因子中,而且四块RTX 5090 GPU的本钱是精深的。"

功耗问题至关要紧

功耗效果讲解注解是至关要紧的。Nvidia提议单块RTX 5090的系统功率为1000瓦,因此即使是双GPU树立也会升迁典型15安培、120伏电路的一语气功耗。配备四块RTX 5090的系统在负载时可能需要4000瓦或更多功率。

另一方面,QuietBox 2在满负荷时仅糜费1400瓦。它不会跳闸,因此不错在典型桌面PC可能插入的任何场合使用,包括家庭办公室。

这并不是QuietBox 2伪装成平方PC的唯独姿色。该机器的定制机箱专为相沿micro-ATX主板风光因子而构建,主板自己是搭载AMD CPU的AMD芯片组。硬件通过访佛于PC责任站和游戏筹画机使用的闭环液冷系统保合手冷却。它致使具有可定制的RGB LED照明和一个展示硬件的大型半透明窗口。

Tenstorrent热机械工程师兼团队幽静东谈主Chris Goulet说:"咱们的好多里面迷惑东谈主员皆条件一台QuietBox,因为它们尽头容易部署。你只需将建造输送给他们,他们把它放在桌子上,通电,就不错开动责任了。"

QuietBox 2与桌面PC的不同之处在于其AI加快器。它配备了四个Tenstorrent的Blackhole专用集成电路,这是专为AI责任负载联想的RISC-V芯片。Blackhole封装在扩张卡上;每个卡有120个Tensix AI加快器和32GB GDDR6内存,所有这个词480个Tensix AI加快器和128GB GDDR6。Blackhole还在每个加快器上有大批片上SRAM,为180MB。

Nvidia的竞争有谋划

Tenstorrent在这种法子上并不零丁。Nvidia昨年发布的DGX Spark将Nvidia的GB10芯片封装在一台饭盒大小的机器中。Spark的升级版DGX Station搭载Nvidia的GB300,于2026年3月16日开动接受订单。

DGX Station看起来像桌面PC责任站,变体版块将由Dell和Asus等有名PC品牌制造。Nvidia的产物比QuietBox 2领有更多内存,最高可达748GB,但系统功率标注为1600瓦,这相当接近15安培、120伏断路器能处理的最大值。这响应了他们对机器使用姿色的不同愿景。天然,Nvidia DGX Station的特殊内存并未低廉。固然大多数DGX Station系统制造商尚未公布订价,但一家零卖商已翌日自PC制造商MSI的DGX Station标价为85000好意思元。

当我在2025年DGX Spark和Station发布后与Nvidia产物营销总监Allyn Bourgoyne交谈时,他说公司瞻望大多数DGX通盘者将把这些建造用作费力探望责任站。"你可能看到的常见情况是,我有我的Windows札记本电脑,我将通过网罗使用我的DGX Spark。我将向它发送任务。"他补充说,公司不错部署DGX Spark和Station系统来同期为多东谈主提供行状。

Tenstorrent QuietBox 2不错这么使用,但该公司也但愿针对东谈主与筹画机一双一交互提供精采体验。Trajkovic说:"你不消费力SSH插足该建造。你通过HDMI聚拢流露器,它就像你家里的PC同样。它有Ubuntu桌面和实用要领。"

Nvidia的DGX系统也运行Ubuntu的变体(DGX OS)并包含桌面环境,但细节很要紧。DGX系统使用基于ARM架构的Nvidia CPU和定制芯片组。QuietBox 2使用AMD x86 CPU和兼容芯片组,成就更像传统PC。这对QuietBox 2的软件兼容性应该是一个上风。

Tenstorrent通过专注于开源软件来诈欺这少量。QuietBox 2的通盘软件栈,从TT-Forge(该公司的AI编译器)到TT-Metalium(提供内核级硬件戒指的初级软件迷惑用具包),皆是开源的并在GitHub上可用。Tenstorrent还发布了其Tensix中枢的领导集架构,因此迷惑东谈主员不错竟然地看到他们的责任负载如安在硬件上实行。比较之下,Nvidia专注于其特有的CUDA生态系统,DGX OS不是开源的。

Goulet说:"咱们的软件栈很大一部分是完满怒放的,咱们合计从硬件角度来看,咱们也念念走访佛的谈路。"

Q&A

Q1:QuietBox 2和平方PC比较有什么上风?

A:QuietBox 2配备了四个定制Blackhole AI加快器和384GB总内存,能以接近每秒500个Token的速率运行Meta的Llama 3.1 70B等大谈话模子,比平方PC的AI处贤惠商强得多。同期它仅糜费1400瓦功率,可在家庭办公环境正常使用。

Q2:Tenstorrent和Nvidia的AI责任站有什么不同?

A:Tenstorrent QuietBox 2订价9999好意思元,接受AMD x86架构,软件栈完满开源;而Nvidia DGX Station订价约85000好意思元,接受ARM架构,使用特有CUDA生态系统。QuietBox 2更戒备个东谈主胜利使用体验,DGX Station更偏向费力探望使用。

Q3:这些AI责任站主要料理了什么问题?

A:主要料理了土产货运行大谈话模子的硬件收尾问题。平方札记本只可运行80-130亿参数的模子,而这些AI责任站能运行700亿参数以上的大型模子欧洲杯体育,为企业和迷惑者提供了土产货部署高性能AI模子的料理有谋划。



 
 


Powered by 开云体育登录入口kaiyun官网首页 @2013-2022 RSS地图 HTML地图