腾讯自研通用大语言模型混元亮相

0
686

在 2023 腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。

根据介绍,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超 2 兆 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

腾讯表示,腾讯混元大模型是 “从实践中来,到实践中去” 的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等超过 50 个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。

腾讯还宣布通过腾讯云对外开放。混元大模型将作为腾讯云 MaaS 服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。

腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生表示,以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。

腾讯集团副总裁蒋杰表示,公司研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。他还宣布,腾讯将全面拥抱大模型。

值得一提的是,针对大模型容易给出不正确答案的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。

(综合报道)

Previous article印尼人民银行准备扩大金融投资组合
Next article亚马逊云科技针对人工智能/机器学习推出多项存储新服务及功能

LEAVE A REPLY

Please enter your comment!
Please enter your name here