科技

阿里云开源通义千问 70 亿参数模型

08/07/2023

229

中国媒体报道，阿里云日前开源通义千问 70 亿参数模型，包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。两款模型目前已经在 Hugging Face 和 ModelScope 平台上开放，均免费、可商用。

根据介绍，Qwen-7B 是支持中、英等多种语言的基座模型，在超过 2 万亿 token 数据集上训练，上下文窗口长度达到 8k。Qwen-7B-Chat 是基于基座模型的中英文对话模型，已实现与人类认知对齐。开源代码支持对 Qwen-7B 和 Qwen-7B-Chat 的量化，支持用户在消费级显卡上部署和运行模型。

用户既可从 Hugging Face 和 ModelScope 直接下载模型，也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat，阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

这次的开源也让阿里云成为中国首个加入大模型开源行列的大型科技企业。

阿里云表示，开源大模型可以帮助用户简化模型训练和部署的过程。这意味着用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型。

今年 4 月，阿里云发布了通义千问大语言模型，被外界成为阿里版 GPT。官网信息，它是一个专门响应人类指令的大模型，是效率助手，也是点子生成机，支持多轮对话，文案创作，逻辑推理，多模态理解，多语言支持。

资料来源：综合报道；图片来源：通义千问官网

WTO 警告：全球贸易前…

特朗普政策重创美国旅游业…

欧盟 27 国一致通过对…

美国对中国商品 104%…

中国国有企业出手稳定 A…

微信从美国 “恶名市场”…

SpaceGut 推出 …

中国或将发行 6 万亿元…

现代汽车印度启动 33 …

新加坡杰出中小企业在市场…

WTO 警告：全球贸易前…

中美贸易战升级中方叫停…

韩国推 230 亿美元芯…

五家美企起诉特朗普称其…

特朗普考虑豁免汽车进口关…

中美贸易战升级中方叫停…

韩国推 230 亿美元芯…

印度拒绝比亚迪投资转寻…

中国国有企业出手稳定 A…

中国对美采取系列反制措施…

阿里云开源通义千问 70 亿参数模型

LEAVE A REPLY Cancel reply

立即订阅，通过电邮获取免费的电子杂志。

Subscribe and Win!

中日动漫产业头脑风暴带来新机遇...

提智向新聚势前行 ̵...