腾讯混元大模型公布新进展：已接入180个内部业务，开放“文生图”功能

锐丰小天才宏观经济 2023-10-28 89293

本次升级距离腾讯正式发布混元大模型不到两个月。据腾讯透露，目前超过180个腾讯内部业务已接入腾讯混元，已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户通过腾讯云调用腾讯混元大模型API。

对于混元大模型前期训练成本投入的问题，腾讯机器学习平台算法负责人康战辉在接受采访时表示，混元作为千亿级参数规模的大模型，目前训练成本较高。对于适用于复杂场景的通用大模型，相比于成本投入而言，腾讯更重视效果；而一些细化场景可以使用小模型，更强调成本投入的高性价比。

已接入超180个内部业务

9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，并宣布通过腾讯云对外开放。如今，腾讯公布了最新进展。

在内部应用上，超过180个腾讯内部业务已接入腾讯混元，包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。最近，QQ浏览器还基于腾讯混元推出了“PDF阅读助手”，具备智能摘要、智能问答和多轮提问等功能。记者注意到，实际上，腾讯混元通过自家应用，也间接面向外部C端用户。

外部用户方面，已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户，通过腾讯云调用腾讯混元大模型API，应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。今年9月首批通过备案后，腾讯混元大模型也已经面向C端用户陆续开放体验，用户通过小程序或网页端，就能与腾讯混元对话。

腾讯混元大模型公布新进展：已接入180个内部业务，开放“文生图”功能

在能力提升方面，一大亮点是开放混元大模型“文生图”功能。“文生图”能够实现输入对图片的描述文字后，AI（人工智能）平台根据文字描述生成对应的图片，是AIGC（生成式人工智能）具有广泛应用前景的场景之一，也是全球大模型竞速下的“主战场”之一。

10月26日，腾讯混元大模型“文生图”技术负责人芦清林在接受包括每日经济新闻在内的媒体采访时表示，大模型“文生图”的难点体现在对提示词的语义理解、生成内容的合理性以及生成图片的效果。针对这三个技术难点，腾讯进行了专项的技术研究，提出了一系列原创算法来保证生成图片的可用性和画质。目前腾讯混元“文生图”能力，已经被用于素材创作、商品合成、游戏出图等多项业务中。

此外，腾讯也升级了混元的代码、数学能力。记者了解到，混元大模型经过对32种主流语言代码文件、各类计算机书籍和博客的学习增训，代码处理水平提升超过20%，腾讯内部目前已经有多个开发平台接入了腾讯混元大模型，工程师们可以使用腾讯混元来进行代码生成、代码补全、代码漏洞检测和修复、表格数据处理、数据库查询等工作。

大模型看效果，小模型看效益

混元大模型拥有超千亿参数规模，预训练语料超2万亿tokens，相比于同行十亿、百亿级别的参数规模，研发与训练成本较高。

谈到大模型的研发成本，腾讯机器学习平台算法负责人康战辉在接受媒体群访时表示，目前腾讯研发大模型有两个方向：在通用大模型上，相比于成本投入而言，腾讯更重视效果，强调长期投入；在小型模型上，希望能更加精细化，将不同的模型应用到不同场景，同时更加考虑投入和产出的性价比和效益。通俗来说，就是“大模大做，小模小做”。

出于上述逻辑，腾讯超180个内部业务接入混元大模型的参数量规模也有所差别。“模型的选择关键还要看场景，要结合业务场景给出灵活的方案，例如现在腾讯的业务部门有的用千亿模型，有的用中小模型，有的用混合模型，我们不断根据业务流量和商业模式去调整出我们自己的技术底座。”康战辉说道。

《每日经济新闻》记者注意到，就在本月，多个厂商陆续发布大模型商业应用：百度发布文心一言大模型4.0版本，并推出十余款AI原生应用全面赋能业务生态。在垂直领域，美图发布了自研AI视觉大模型MiracleVision（奇想智能）3.0版本，通过“提示词智能联想”“提示词精准控制”等功能，可以让用户的各种奇思妙想实现所想即所得；宇信科技(300674)推出了首批金融行业大模型应用产品和解决方案，包括4个应用级产品和1个开发平台。

大模型商业化进程正持续推进，腾讯对此也有一些思考。芦清林以“文生图”为例，阐述对未来应用路径的展望。“‘文生图’的应用价值在广告场景是非常明确的，第一是能够帮助广告主更快地提升投放广告的效率，第二是腾讯拥有丰富的广告经验和知识，知道如何针对广告主投放广告的人群，生成更符合人群特点的广告，因此广告主愿意在这个产品上投入。”他说道。

据腾讯透露，目前在广告业务下的多轮测评中，腾讯混元“文生图”的案例优秀率和广告主采纳率分别达到86%和26%。

每日经济新闻