全新 AI 芯片横空出世

02/21/2024

6826

日前，AI 芯片创企 Groq 开放了自家产品的免费试用。相比其他 AI 聊天机器人，Groq 闪电般的响应速度迅速引爆互联网讨论。经过网友测试，运行的大模型生成速度接近每秒 500 tokens，碾压 ChatGPT-3.5 大约 40 tokens/秒的速度。

据 AI 模型和托管提供商 ArtificialAnalysis.ai 的测评数据，该接口创下了新的大模型吞吐量记录，达到每秒 430 Tokens。Groq 还提供 Llama2 7B 模型访问，最高可实现每秒 750 Tokens。

据介绍，Groq 平台基于其自研 LPU（Language Processing Unit，语言处理单元）芯片运行，该芯片在大模型推理任务上速度是英伟达 GPU 的 10 倍。

Groq表示，LPU 推理引擎是一种新型端到端处理单元系统，可为 AI 大模型等计算密集型应用提供最快的推理速度。据 Groq 介绍，在 LLM 方面，LPU 较 GPU/CPU 拥有更强大的算力，从而减少了每个单词的计算时间，可以更快地生成文本序列。此外，由于消除了外部内存瓶颈，LPU 推理引擎在大模型上的性能比GPU高出几个数量级。

不过，需要强调的是，Groq 并没有研发新模型，它只是一个模型启动器，主页上运行的是开源模型 Mixtral 8x7B-32k 和 Llama 270B-4k。

Groq在官网发布的免费大模型服务，包括三个开源大模型：Mixtral 8×7B-32K、Llama2-70B-4K和 Mistral 7B-8K，目前前两个已开放使用。

Groq 由谷歌前员工乔纳森·罗斯（Jonathan Ross）在 2016 年创立，主要针对云计算市场开发 AI 芯片，其主要成员曾参与研发谷歌的 TPU（张量处理单元）。

资料来源：综合报道；图片来源：Groq Inc.

资金缺口致世卫组织启动裁…

美国爆发 “50501”…

WTO 警告：全球贸易前…

特朗普政策重创美国旅游业…

欧盟 27 国一致通过对…

微信从美国 “恶名市场”…

SpaceGut 推出 …

中国或将发行 6 万亿元…

现代汽车印度启动 33 …

新加坡杰出中小企业在市场…

美国消费市场多元领域涨价…

日本拟大幅降低股票市场最…

特朗普称将大幅降低中国商…

韩国查获大量企图 “洗产…

美国对柬马泰越太阳能产品…

泡泡玛特 APP 跃居美…

星链 6 月或登陆韩国

美国消费市场多元领域涨价…

日本拟大幅降低股票市场最…

Foodpanda 将于…

全新 AI 芯片横空出世

LEAVE A REPLY Cancel reply

立即订阅，通过电邮获取免费的电子杂志。

Subscribe and Win!

DXC被评为顶级寿险核心技术供...

科技赋能多元拓市，宝安制造硬核...