美国Groq公司及张量流处理器介绍

投诉电话：13410128442 老官网

首页> 新闻动态> 新品速递>

新闻动态

News trends

新品速递

公司新闻

知识分享

0755-26738591

服务时间

首页> 新闻动态> 新品速递>

美国Groq公司及张量流处理器介绍

2025-04-22

325

Groq 位于美国加利福尼亚州山景城。核心领域：专注于AI加速芯片设计，尤其是针对大语言模型（LLM）推理的高性能张量流处理器（LPU, Language Processing Unit）。

技术优势：

确定性执行架构：通过硬件级编译优化，消除传统GPU的并行调度不确定性，实现超低延迟。

超高内存带宽：单芯片内存带宽达80TB/s，远超同类竞品。

可扩展性：支持多芯片无缝互联，线性提升算力。

行业地位：被誉为“英伟达挑战者”，其LPU在自然语言处理（NLP）推理任务中表现显著优于GPU。

张量流处理器（LPU）核心产品线如下：

1. GroqChip™（第一代LPU）

制程工艺：14nm

算力指标：

INT8算力：750 TOPS

FP16算力：188 TFLOPS

内存带宽：80TB/s（基于SRAM设计，无外部DRAM依赖）

典型应用：

大模型推理（如GPT-3、LLaMA），支持每秒500+ tokens生成速度。

实时语音处理、自动驾驶感知决策。

部署形式：

单卡：搭载1颗GroqChip，功耗约200W。

多卡集群：通过GroqRack™机箱扩展至数十颗芯片，算力线性叠加。

2. GroqNode™ 系统

定位：企业级AI推理服务器

配置：

标准版：集成4颗GroqChip，提供3 PFLOPS（FP16）算力。

扩展版：支持8颗芯片，算力翻倍。

兼容性：

支持PyTorch、TensorFlow框架模型直接部署。

提供GroqWare™ SDK，优化编译与任务调度。

3. 定制化解决方案

合作案例：

国防领域：为美国军方定制低功耗、抗辐射LPU，用于边缘设备实时决策。

医疗领域：与医疗机构合作开发医学影像分析专用芯片（优化3D卷积计算）。

技术指标：

支持定制SRAM容量（最高1GB/芯片）。

可调整指令集适配特定算法（如量子化学模拟）。

产品对比与竞品分析

指标 GroqChip NVIDIA A100 Google TPU v4

内存带宽 80TB/s 2TB/s 1.2TB/s

LLM推理速度 500+ tokens/s 50-100 tokens/s 200-300 tokens/s

架构特性确定性执行并行多线程矩阵加速单元

注意事项：

更详细的技术资料需通过提供项目详情获取，欢迎咨询。

我公司自营进出口权，直接海外采购，国外现货航空件几天就能交到您的手中。

在线客服

edg

日本CHINO千野

称重传感器

edg

产品项目选型

edg

韩国Dacell大拿

edg

edg

edg

美国Celtron世铨

17162663706184878

微信公众号

17162563969721158

17162663706184878

391324f4-7af7-4300-821b-60378f5be384

ri2

电话:0755-26738591

ri3

E-mail：sales@octsources.com

weibo

0fe2f0ff-adba-4d93-b8e3-bef2a756071b

ri4