计算机学院举办“人工智能通用大模型理论与实践”主题讲座

作者: 时间:2023-05-04 点击数:

    2023426日下午,第三届乐创IT武汉晴川学院计算机学院科技节图灵论坛的第二场讲座在晴川剧场成功举办。武汉理工大学计算机与人工智能学院副教授、硕士生导师段鹏飞博士为全校400多名师生代表带来了“人工智能通用大模型理论与实践”主题讲座。学校向巍副校长出席讲座并致辞,他充分肯定了计算机学院师生在科技节上的共同努力和所取得的优异成绩,并对段鹏飞博士的到来表示热烈欢迎。科研与研究生工作处魏亚飞副处长、教务处柴仓义副处长及计算机学院院领导参加了该讲座,讲座由计算机学院教工党支部书记、院长助理叶丽萍老师主持。


微信图片_20230427130754

段鹏飞博士此次讲座围绕目前最热门的ChatGPT、文心一言等人工智能模型展开,从智能通用大模型、通用大模型理论技术分析、目前段鹏飞博士团队的研究进展和通用大模型未来的研究方向4个方面展开。段鹏飞博士梳理了数字化时代的发展变迁,讲解了人工智能的发展史,介绍了人工智能有哪些大模型及为什么要建大模型,通过中美技术对比,深入讲解了GPT4中的关键技术,并分享了其团队目前在该领域的实践研究,以及未来该技术的发展挑战与趋势,让在场师生进一步了解到人工智能技术给我们带来了前所未有的机遇与挑战。此次讲座全场座无虚席,掌声不断,为学生开拓专业视野,接轨热门技术提供了一次知识盛宴。

一、充分引入热点模型,激发学习兴趣

讲座第一部分,段博士分析了人工智能学科的形势,让师生对人工智能专业有了深入的了解,提到数字3.0时代是信息、物理和生物的时代,人工智能参数过万亿、数据20万亿,这么巨大的计算量是通过分布式训练算法来实现的,介绍了ChatGPT中的基础语言模型的特点,让师生更好地理解了GPT2GPT3GPT4语言模型的巨大变化。通过这些前沿技术的介绍,段博士极大地激发了师生学习人工智能的兴趣。

二、深入剖析建模原理,引导思维碰撞

为了让师生更好地理解大模型,段博士深入浅出地介绍了语言模型建模的基本原理,并介绍了大语言模型的架构Transformer呈现数据量大、训练成本高和复现难度大等特点,通过扑克牌、鸡尾酒会效应等实例讲解了人脑的主动注意力机制,让师生更好地了解到Transformer中的信息超载问题。同时他提到GPT4中的涌现、数据量、计算量、训练前的数据质量、对齐调优等技术,为在场师生带来了新的思维碰撞,指明了学习AI的方向和切入点。

三、细致讲解AI前景,鼓励勇攀高峰

接着,段博士提出了记忆与学习的区别,解答了学生心中的疑惑,如到底AI能不能替代程序员进行编程?程序员会不会因此失业等,他提到,使用AI技术的核心在于你是否愿意相信这种技术,AI优势更多在记忆方面而非学习和创新方面。对我们来说,要顺应时代的发展,更要加强自身的专业学习,让自己在未来的职场上更有竞争力。

在最后的互动环节,在场师生踊跃提问,段鹏飞博士一一耐心解答,其深厚的专业知识素养、丰富的实践经验及幽默风趣的语言风格赢得了学生的热烈掌声。通过这场学术讲座,在场师生充分了解了AI大模型发展的趋势,激发了学习兴趣、拓宽了专业视野。

Copyright © 2017-2020   武汉晴川学院   鄂ICP备10004916号   地址:湖北省武汉市东湖新技术开发区中华科技产业园玉屏大道9号   邮编:430204