中国媒体报道,阿里云日前开源通义千问 70 亿参数模型,包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。两款模型目前已经在 Hugging Face 和 ModelScope 平台上开放,均免费、可商用。
根据介绍,Qwen-7B 是支持中、英等多种语言的基座模型,在超过 2 万亿 token 数据集上训练,上下文窗口长度达到 8k。Qwen-7B-Chat 是基于基座模型的中英文对话模型,已实现与人类认知对齐。开源代码支持对 Qwen-7B 和 Qwen-7B-Chat 的量化,支持用户在消费级显卡上部署和运行模型。
用户既可从 Hugging Face 和 ModelScope 直接下载模型,也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
这次的开源也让阿里云成为中国首个加入大模型开源行列的大型科技企业。
阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程。这意味着用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
今年 4 月,阿里云发布了通义千问大语言模型,被外界成为阿里版 GPT。官网信息,它是一个专门响应人类指令的大模型,是效率助手,也是点子生成机,支持多轮对话,文案创作,逻辑推理,多模态理解,多语言支持。
资料来源:综合报道;图片来源:通义千问官网