9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式对外亮相。据悉,全链路自主研发的腾讯混元大模型源自实践、面向应用而生,未来也将把大模型技术用到实践中去,为千行百业持续创造价值。
全链路自研 把关键技术掌握在自己手里
当前,中国大模型呈现百花齐放、迅猛发展的态势,腾讯、华为、阿里、百度等科技企业纷纷入局,投入资源、潜心研究。竞争与追赶间,中国以大模型为代表的人工智能技术得以不断锤炼。在短短一年的时间里,中国的科技企业和研究机构奋起直追、缩小差距。尽管差距仍在,但可以毫不夸张地说,中国大模型的技术取得了长足的进步,中国人工智能技术水平已经处于世界第一方阵。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”
随着腾讯混元大模型的亮相,中国数字科技领军企业都已经公布了大模型研发的进展。超百个国产大模型呈现百舸争流的景象,侧面折射出中国科技企业重视科技创新。而大模型不仅要追求数量,更要通过研发把关键技术牢牢掌握在自己手里。
根据腾讯在全球数字生态大会上披露的信息,腾讯混元大模型是一款由腾讯全链路自主研发的通用大语言模型,其模型参数达到了千亿级别,在中文创作、复杂语境下的逻辑推理和可靠的任务执行等方面均有良好表现。
在混元大模型的首次亮相中,自主研发是其中的一大关键词。
腾讯集团副总裁蒋杰介绍,腾讯混元大模型是从零开始训练,公司掌握了从模型算法、机器学习框架、人工智能基础设施的全链路自研技术。
把关键技术掌握在自己手里,就需要用长期主义把大模型研发看成是一场“马拉松”。
以腾讯为例,从2021年开始,先后推出了多个千万和亿级参数模型,在实际应用中不断优化大模型底层算法开发,提升工程能力。2018年起,腾讯累计投入了超过2300亿元的研发经费。
复旦大学中国研究院副研究员刘典表示,人工智能的发展不是一蹴而就的,我们需要继续加强对人工智能的投入,坚持自主研发、自立自强的核心思想,做好在人工智能领域“打持久战”的准备。
全面拥抱大模型 下半场看应用落地
有人将人工智能技术比作类似发现电的工业革命一样的机遇。对于工业革命来讲,重要的是把底层的算法、算力和数据扎实做好。大模型不只是聊天机器人,大模型竞争赛跑的后半程更关键的是要看应用场景的落地。
应用一直是腾讯的强项。凭借公司内部丰富多元的应用场景,腾讯混元大模型通过实践充分磨练、多次迭代。
在腾讯全球数字生态大会,蒋杰现场展示了接入腾讯混元大模型后,腾讯会议、腾讯文档、腾讯广告等产品和业务的应用能力和创新探索。
我们可以畅想不久之后就可以实现的工作场景:
——在多人线上数小时的会议后,人工智能技术将仅仅通过简单的自然语言指令,就能快速准确地提炼各方观点,智能生成会议纪要;
——文档可以一键生成标准格式文本,精通数百种Excel公式,自动基于表格内容生成图表;
大模型技术的落地应用已经转换成了实实在在的生产力。在腾讯内部,腾讯混元大模型已经深度支持了50多个业务。
“腾讯将全面拥抱大模型。”蒋杰说。
不断应用创新 用大模型技术服务千行百业
虽然中国大模型及其行业规模已经足够有优势,但是大模型当前的应用主要还集中在容错率高、任务简单的休闲场景,在更具价值的严肃场景、工作场景和专业场景,大模型的应用尚待解锁。
一方面,我们要走出当前大模型单纯拼参数的误区;另一方面,我们需要鼓励企业进行应用创新,把技术落在实处,发挥出大模型的实用性。
清华大学人工智能研究院视觉智能研究中心主任、教授邓志东表示,大模型的价值在于应用。只有在多样化的实际应用场景中赋能智能经济与智能社会的发展,才能找到产业价值,同时也才能成就大模型自身。
共享大模型能力、为更多行业带来智能化机遇,成为许多中国科技企业的选择。在内部多个业务接入内测和应用检验后,腾讯宣布将通过腾讯云对外开放混元大模型能力,以自研技术服务好千行百业。
腾讯混元大模型将作为腾讯云MaaS服务的底座,企业用户不仅可以直接调用混元,也可以将混元大模型作为基底模型,为不同产业场景构建专属应用。
对于中国大模型的未来发展,业内专家建议继续鼓励企业积极进行应用创新。刘典说,中国一方面要继续优化自己的大模型质量,另一方面也要基于现有的产品,利用我国特有的超大规模市场和丰富应用场景,深耕应用层面,切实地为千行百业赋能。