百度副总裁吴甜：文心大模型已应用于搜索等产品，开发者超6万人

百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜（来源：百度官方）

自从OpenAI发布GPT-3之后，大模型成为几乎所有全球头部人工智能（AI）公司的逐鹿目标。

钛媒体App 4月19日消息，百度集团副总裁吴甜近日接受钛媒体App等采访时表示，百度产业级知识增强大模型“文心”，目前已经大规模应用于百度内部的各类产品，包含搜索、信息流、小度智能屏、百度地图等。而“文心大模型”的个人、企业开发者数量已超过6万人。

吴甜强调，“今年是文心大模型产业落地关键年”。

据悉，“大模型”是目前世界AI研究领域最热门的话题之一。AI 技术发展到今天，GPT和BERT等参数量巨大的模型被人们开发出来，他们在计算机视觉和自然语言处理等领域取得了前所未有的成就。

随着数据井喷、算法进步和算力突破，泛化能力和通用性强的预训练大模型，正在成为 AI 技术发展的关键方向，并成为 AI 产业应用的重要推动力，有望让 AI 技术与各行各业的差异化场景深度融合，让大部分企业的标注数据更少、开发效率更高、应用成本更低，从而大幅降低 AI 的应用门槛。

2019年3月，百度发布中国首个正式开放的预训练模型ERNIE1.0；2021年12月，ERNIE 3.0升级为知识增强千亿大模型“鹏城-百度·文心”，模型参数规模达到2600亿，是目前全球最大中文单体模型。

同时，2021年12月发布全新的文心大模型全景图，文心大模型家族包含NLP（自然语言理解）大模型、CV（计算机视觉）大模型、跨模态大模型，以及工具与平台。

在吴甜看来，“文心大模型”作为产业级大模型，核心价值在于驱动 AI 技术的规模化应用。

因此，为了进一步降低应用难度，百度还为“文心大模型”开发易上手、轻量化的部署工具平台，包括提供各类开发套件，零门槛AI 开发平台EasyDL 、全功能AI 开发平台BML等，让不同群体都能低门槛实现AI技术应用。

吴甜表示，通过百度AI开放平台，现在已经有近1400项能力是开放给企业开发者使用的。

吴甜对钛媒体App表示，基于百度飞桨平台与百舸集群，“文心大模型”在算法、框架、算力层面实现了自主创新。通过大模型与国产深度学习框架融合发展。支撑“文心大模型”训练的是百度飞桨平台自主研发的端到端、自适应、分布式训练框架与4D混合并行技术。百度已经构建出自主创新的AI基底，能驱动 AI 规模化应用。

目前，“文心大模型”已通过飞桨平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业落地应用。其中在智能制造场景中，大模型可应用于质检、巡检这一类型以计算机视觉场景，以及数据设备的运维等自然语言处理场景当中。

具体案例方面，百度与中国人寿合作，针对保险合同中条款文本进行关键字段的提取。基于文心大模型，实现了保险合同条款的智能解析，自动提取近40个维度的关键字段，业务处理效率大幅提升。

“基于企业自己积累的标注信息，然后用‘文心大模型’与此前数据一起进行二次训练，会帮助客户做一些数据增强工作。再通过多次客户反馈构造数据，进行模型迭代，就达到实用状态了。”吴甜对钛媒体App表示，真正使用时，把大模型的能力嵌到私有云当中，在保险人员的工作流中嵌入一个功能，告诉他一些分析后的建议，然后基本上可以快速上手使用“文心大模型”能力了。

交付形态上，“文心大模型”主要有三种交付模式：通过调用API供开发者使用，百度EasyDL、BML全功能AI开发平台（Baidu Machine Learning）等平台上的嵌套工具，以及包含在一些面向场景的产品中交付，例如智能文档分析TextMind，智能创作平台等。

收益来源方面，作为一项基础性质的工作，“文心大模型”的收入来源，一方面百度自身的业务需求，另一方面是通过行业客户的垂直场景结合，进入百度智能云的营收当中。

不过，吴甜告诉钛媒体App，“文心大模型”在前期训练的时候十分消耗算力，在百度搜索场景中，利用昆仑芯在进行文心ERNIE的推理计算，每一天都是过亿的流量在进行计算。而但并不是所有企业都拥有这么大规模的算力平台，到企业场景真正使用大模型，很多只要进行二次训练就可以了，二次训练并不会像训练千亿基础模型那么大的消耗。

对于大模型重复建设以及良性竞争问题，吴甜表示，每一家企业和机构最后会产生的价值和作用，其实是各自侧重的。现在还是有很大的创新空间。

（本文首发钛媒体App，作者｜林志佳）

关键词：百度副总裁吴甜文心大模型已应用于搜索等产品开发者超