大型语言模型(LLM)技术精要——走向AGI的思考 | 盘古智库新大航海时代系列讲座

大型语言模型(LLM)技术精要——走向AGI的思考 | 盘古智库新大航海时代系列讲座
2024年04月30日 18:45 盘古智库

近年来,大型语言模型(LLM)及其在人工智能领域的应用已经成为科技研究的热点。

4月29日,盘古智库举办新大航海时代系列讲座“大型语言模型(LLM)技术精要——走向AGI的思考”,邀请盘古智库学术委员会副主任委员,识因智能董事长、创始人王春辉博士担任主讲嘉宾。

易鹏理事长在致辞中指出在新大航海时代,人工智能带来的技术变革将产生重大且深远的影响,我们应该积极拥抱新技术和新变革。希望通过今天的讲座,大家能对大型语言模型和通用人工智能形成更全面深入的认识。

讲座中,王春辉博士深入讲解了大型语言模型的前沿技术,探讨了其在人工智能领域中的重要性,以及对实现通用人工智能(AGI)的潜在影响。

在以Bert和GPT为代表的大型语言模型出现之前,自然语言处理(NLP)的主流技术是深度学习模型,即以LSTM模型与CNN模型作为典型的特征抽取器,以及以Sequence to Sequence + Attention作为各种具体任务典型的总体技术框架。但深度学习存在LSTM/CNN特征抽取器表达能力不够强和具体任务的训练数据总量有限等问题,阻碍了深度学习在NLP领域的成功突围。

Bert和GPT这两个预训练模型的出现,无论在学术研究角度看,还是工业应用角度来看,都代表了NLP领域的技术飞跃,并带来了整个领域研究范式的转换,包括范式转换1.0—从深度学习到两阶段训练模型,以及范式转换2.0—从预训练模型走向通用人工智能,这种范式转换推动了NLP不同子领域的技术方法和技术框架日趋统一。

大型语言模型从海量自由文本中学习大量知识,学习过程不需要借助人的介入,并且能灵活应用所学知识来解决实际问题。王春辉博士认为利用超大规模及足够多样性的数据、超大规模的模型,以及充分的训练过程能够训练出优秀的大型语言模型,这是揭开通用人工智能真正的钥匙。

在提问与讨论环节,与会嘉宾围绕大型语言模型的技术发展、应用场景等方面的问题进行了深入交流。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部