【导读】2024年7月2日,由中国科学技术协会、广西壮族自治区人民政府主办,中国自动化学会承办的第二十六届中国科协年会通用大模型未来演进路线——数据、算力、算法论坛在广西南宁召开。会议特别邀请欧洲科学院院士、中国自动化学会副理事长、华南理工大学教授陈俊龙,作主题为“新型人工智能技术助力产业创新发展”的报告,报告聚焦新型人工智能技术前沿,探讨了人工智能算力的发展趋势,数据、算法的并行、分布特性和重要性,以及最近兴起的生成式人工智能的应用和平台,强调了数据、算力和算法对人工智能发展的重要性,并提出这些要素的持续进步将推动人工智能技术在各个领域的广泛应用,催生新技术、新产业、新业态和支撑经济高质量发展。
生成式人工智能(Generative AI)的概念自2014年生成对抗网络(GAN)提出以来,逐渐得到了广泛关注和发展。与传统的决策型人工智能模型不同,决策型模型通过数据的条件概率分布来进行分类决策,而生成式模型则基于数据的联合概率分布进行创作,两者对比如图1所示。这一创新不仅仅限于数据的决策,还包括数据的生成,从而兼具判别与生成的功能,开启了生成式人工智能的新纪元。
图1 决策式AI与生成式AI
一、生成式人工智能的起源与发展
自2022年12月ChatGPT的推出,生成式人工智能进入了爆发式增长期。生成式AI在智能驾驶、电商应用、人脸识别、情感智能、文本分类等领域展现出强大的替代潜力。这些是得力于2014生成对抗网络的诞生,在生成对抗网络的研究中,不同组合的GAN模型与扩散模型相结合,取得了诸多成果。例如,通过对一百个人脸进行组合,可以生成出全新且不存在于现实中的人脸图像,这一技术在六七年前就已存在并广泛应用于图像生成领域。
生成式人工智能在文本与图像生成方面取得了显著进展。除了传统的文本生成文本模型,还出现了文本生成图像的模型,如ChatGPT和文心一言等。此外,文本生成视频技术的发展也日新月异,未来可能会实现更复杂的任务和动作生成。通过描述场景生成视频,这种技术在设计、电玩场景创建等领域展现出广阔的应用前景。
生成对抗网络自2014年问世以来,在图像处理领域得到了广泛应用。利用生成式模型,可以实现图像的超分辨率、去噪、遮挡补全和风格迁移等功能。例如,将普通图像转换为油画风格,或者实现不同季节的图像转换,如图2所示。这些应用大大推动了生成对抗网络在图像处理中的发展,尽管视频生成的研究直到2023年才逐渐受到关注。
图2 人工智能的创作本领
随着生成式人工智能的发展,隐私保护和伦理问题变得尤为重要。例如,短片中显示诈骗集团利用生成式AI技术进行面部替换和声音生成。如何应对这些挑战成为我们需要关注的方向。
二、生成式人工智能在各领域的应用与挑战
ChatGPT的诞生标志着生成式人工智能的又一里程碑。ChatGPT的发展经历了从2018年GPT模型的演进,到2022年加入Chat功能,引发了生成式人工智能产品的爆发,其发展历程如图3所示。ChatGPT拥有1700多亿参数,基于45TB的公共数据,能够生成高质量的模型。国内企业也纷纷布局生成式人工智能,推出了诸如盘古大模型、紫东太初、文心一言、通义千问、星火等具有国际竞争力的模型。
图3 ChatGPT发展历史
生成式人工智能的出现也改变了市场生态模式。例如,传统互联网公司如Discord拥有650名员工,年营收1亿美元,而生成式人工智能公司Midjourney仅有11名员工,却同样实现了1亿美元的年营收。这表明未来的小型精简公司将逐渐崭露头角,并在市场中占据重要地位。
在国内,尽管企业如百度、科大讯飞和阿里还未完全开放API供开发者使用,但未来随着生成式人工智能技术的普及,相关企业将逐步开放API,促进行业发展。生成式人工智能在设计、绘画、剧本编写、特效生成和灯光等创意领域具有广泛应用,极大地降低了制作成本,提高了工作效率。
生成式人工智能不仅可以将输入内容转化为小说、电影和艺术品,还能通过图像关联生成不同的叙述。这在国外已经得到了广泛应用,而在国内,国家发布的大模型数量也在快速增加,显示出强大的竞争力,如图4所示。
图4 大语言模型树
生成式人工智能不仅在设计和创作领域发挥重要作用,还在工程领域展现出巨大的潜力。行业内开始探讨将大模型分解为小模型,利用行业数据生成行业专用的小模型。这种垂域大模型的应用将极大地推动AI for Engineering的发展,实现更高效的工程设计和应用。
在人才方面,人工智能领域的人才需求量巨大,人才的投入和培养至关重要。计算平台、算力平台、数据和算法是推动人工智能发展的三大支柱,而人才则是其中最为重要的一环。
文生任务和文生行动是生成式人工智能的未来应用方向之一。例如,英伟达在发布会上展示了利用生成式人工智能训练的机器人模型,这些机器人能够通过观察人类动作进行学习。迪士尼乐园的人工智能研究院也在进行类似的研究,未来我们有望看到机器人与人类、机器人与机器人以及机器人与数字人之间的交互。
三、生成式人工智能的未来发展与挑战
生成式人工智能的发展使得文生视频技术逐渐成熟。通过文本生成视频,用户可以用简单的文字描述生成高质量的视频内容,如图5所示。例如,一个女士走在东京街道上的情景可以通过文本描述生成相应的视频。尽管目前生成式人工智能在时间和空间问题上还存在一些挑战,但随着技术的进步,这些问题将逐步得到解决。
图5 文字描述生成视频内容
生成式人工智能将在面向消费者的应用领域发挥重要作用,辅助人类进行各种任务。这涉及到自动化和智能化的发展方向,通用人工智能将逐步走向消费者,优化用户体验,实现更广泛的应用。
未来,计算机和手机市场将逐渐嵌入生成式人工智能功能。例如,PC市场可能会加入AIGC功能,只需插入一张卡片即可支持大规模数据计算。手机市场同样将受益于生成式人工智能技术的发展,用户可以在手机上选择并应用通用大模型。这为国内手机厂商提供了巨大的商机,推动智能手机向更高水平发展。
AI for Engineering概念强调行业知识的重要性,如图6所示。头部企业的大模型将为中小型企业提供行业数据支持,生成行业专用的小模型,推动行业应用的发展。
图6 AI for Industry and Engineering
除了算法、算力和数据,人才是推动人工智能发展的关键因素。人工智能领域的人才培养和投入至关重要,各级政府和企业应高度重视人才培养,以满足快速发展的人工智能产业需求。人才是发展的第一资源,人工智能对人才的要求程度较高,需要对技术、商业有着深刻的理解。
总结而言,生成式人工智能的发展已经对各个领域产生了深远影响。从设计、创作到工程应用,生成式人工智能正在改变我们的工作方式和生活方式。随着技术的不断进步和应用的拓展,生成式人工智能将在未来发挥更加重要的作用。
(本文根据作者所作报告速记整理而成)