第2章 人工智能概述
2.1 什么是人工智能
人工智能(Artificial Intelligence,AI),顾名思义,是由“人工”设计创造出来的,模拟人大脑神经思维的“智能”化产品。它是一种让计算机模拟人类智能的技术,旨在让计算机能够自主地学习、推理、解决问题和做出决策,使其在现实世界中发挥更大的作用。AI技术可以处理大规模的数据和信息,并从中学习和提取知识和规律,让计算机能够自动化地执行复杂的任务,甚至超越人类的能力。
1943年,美国神经科学家麦卡洛克(Warren McCulloch)和逻辑学家皮茨(Water Pitts)合作提出了神经元模型。它模拟了生物神经元的基本功能和行为,并将神经元之间的连接和交互建模,被认为是现代人工智能学科的奠基石之一。1956年8月,约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)、克劳德·香农(Claude Shannon)、艾伦·纽厄尔(Allen Newell)与赫伯特·西蒙(Herbert Simon)在美国汉诺斯的达特茅斯学院人工智能夏季研讨会上正式使用了人工智能(AI)这一术语,标志着人工智能学科的诞生。
今天,在大数据、云计算、互联网、物联网等信息技术的发展推动下,深度神经网络飞速发展,涌现出卷积神经网络(Convolutional Neural Network,CNN)、生成对抗网络(Generative Adversarial Network,GAN)、循环神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(LSTM)和转换器(Transformer)等神经网络结构模型,尤其是从无监督学习的预训练语言模型(Pre-trained Language Model,PLM)过渡到使用大量数据预训练模型的大语言模型(Large Language Model),被应用于自然语言处理、计算机视觉、图像生成、音频生成等各个领域。它们的不断发展和创新将为人工智能的应用提供更加广阔的空间。