国内众多科技、AI巨头都相继公布了各家大模型的发布会时间:4月8日华为盘古大模型发布,华为盘古大模型,最近的发布多少有点高开低走,突破性进展不多,尤其是在C端几乎没有新应用侧产品,主要还是展示了华为在B端智能化方向上的技术实力,为华为云服务和可见的销售市场做技术支撑。
4月8日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇介绍了盘古大模型的进展及其应用状况,包括NLP大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等的研发与应用的相关情况。
在会前,最引人关注的莫过于盘古的NLP大型模型,据介绍,该模型利用了深度学习与自然语言处理技术,并且采用海量中文语料库对其进行培训。
而在参数和数据的堆量方面,百度文心一言参数为100亿,数据为4TB。而GPT-4则达到了1750亿,数据45TB。华为盘古大模型的参数高达1000亿,数据高达40TB。如果单从参数上看,盘古大模型已接近GPT-3.5。
但在这次发布会中,田奇却并没有提到盘古NLP大模型的相关应用。只是将过去已经发布的功能,进行了较为简单的集合介绍。相对而言,另外两个大模型则着墨更多,以较多篇幅介绍了CV大模型和科学计算大模型的应用范例。这也让众多翘首期盼华为能发布一款赶上ChatGPT应用的“粉丝”们,多少有一些失望。
但实际上,早在发布会之前的相关交流中,内部专家就已经就该话题做出了相关回答:
“首先,在华为发展历史上,很少是在新的趋势出现后立马就追上来的。公司发展的30多年间,基本没有做到过先发,而是一直采用后发制人的打法,在手机、在云、在汽车上是如此,在这个领域中也会如此。”
“想要做出一个比较完美的NLP大模型,是一个集团级的项目, 通常做出决定会比较缓慢,在一两年内也不太会出现。而当前公司在尽力地完成AI工程化、AI产品化,公司认为这是商业化不得不走的路线,如果采用高度项目制,成本很高,并且也会出现项目不可复制的情况,因此华为的重点最后才放在了面向行业的CV大模型上。”
正如相关专家所说的,盘古大模型中最为领先的,正是CV(机器视觉)大模型。
会上,田奇还谈到,在过去的2022年,华为盘古大模型主要是AI for Industry(AI赋能产业),为煤矿、水泥、电力、金融、农业等行业创造了更多产业价值,其中CV大模型早就有了许多用武之地。
比如在与能源公司合作的盘古矿山大模型中案例中,矿井现场是一个40米长的采掘机,宽度仅2米左右,传统相机很难一下子捕捉到全部画面,只能用图中的九宫格视频画面。而通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业。
盘古矿山大模型还用在了煤矿的主运输皮带作业监控。煤矿被采集下来以后,它会通过一个主运输皮带,从地下传输到地上。按传统方法是通过工人配合作业,华为提出通过视频对作业的安全规范进行巡检,主运场景的异物识别精度达98%,煤矿作业场景动作识别准确率达95%,助井下安全事故减少90%以上。这些都是CV大模型的落地应用。
此外,大模型还能进行轨道机车缺陷检测,比如掉链、脱落、裂痕等潜在不安全因素,人工检测成本较高,盘古大模型提供图像质量的自动评估、小样本的故障定位与识别等。
可以说,华为选择了一条与其他AI企业不一样的道路——暂时放弃以ChatGPT为代表的C端需求,专注B端工业需求的开发。不去纠结内耗于ChatGPT,才是华为真正的AI之路。