三、遍地开花的人工智能
2022年2月4日,伴随着精彩的开幕式表演,北京冬奥拉开帷幕,北京也成为奥运百年历史上的第一座“双奥之城”。“智慧奥运”的理念贯穿着这届冬奥会的始终,例如在开幕式节目“雪花”中,国家体育场铺设的LED大屏系统与演员之间能够进行实时的“互动”,地面上的雪花图案会时时刻刻追随每个小演员的脚步,就像拥有生命一样,造就了美轮美奂的表演效果。这场绚丽的表演里包含了最先进的人工智能技术,例如基于计算机视觉的实时人体检测和位置追踪,采用了深度神经网络模型,仅仅通过4台摄像机就覆盖了全场,同时捕捉500多个孩子的位置,让计算机拥有了比人类还高明的“视力”,将唯美艺术和奥林匹克精神传递给世界。
目前,人工智能技术可谓遍地开花,在生活中,最成功的应用集中在语音识别、自然语言处理、计算机视觉、机器人等领域。语音识别和自然语言处理最常见的应用就是手机里的智能助手了;计算机视觉最典型的应用是门禁中的人脸识别和手机上的人脸解锁;机器人领域的典型应用有生活中常见的扫地机器人。其实很多生活中的应用都是多种人工智能技术通力协作的结果,比如智能服务机器人,既使用了计算机视觉技术观察周围环境,也使用了自然语言处理和语音识别技术来接收或者反馈人类的指令,还使用了智能控制技术来决定行走的路线。
除了这些日常的人工智能应用外,我们生活中还有许多有趣的应用。下面来看看这些应用场景背后都包含了哪些人工智能技术。
很多手机应用中都有扫一扫功能,要知道除了扫二维码/条码外,有时候还能扫很多其他的对象。现在京东、淘宝等应用都有扫一扫识别物品功能,可以便捷地找到相同或相似在售的商品信息,如图1-1所示。其实无论是相对简单的二维码,还是稍复杂的物品扫一扫,背后都用到了图像识别这一典型人工智能技术。
图1-1 扫一扫识别物品
2020年年初,一段利用人工智能技术修复的100年前老北京视频在网络上热转,如图1-2所示,这些视频的作者网名叫“大谷”,是出生在北京的“90后”,他以加拿大摄影师1920-1929年间拍摄的老北京黑白影像为基础素材,应用人工智能技术相继完成上色、修复帧率、扩大分辨率等工作,生动再现了百年前的北京城。据估计,这段10分钟的视频如果是技术人员采用传统的手工逐帧修复技术,大概需要数十人持续工作几十天才能完成,但借助人工智能技术完成这段影像的修复仅用了一周时间。
图1-2 百年前的老北京影像修复前后画面对比
扫一扫看彩图
我们平时使用的导航软件中有时会听到明星真人语音导航的声音(见图1-3),其实真人配音的录制并不需要太长时间,一种方式是只需要演讲者将21个声母、37个韵母、5个声调组合的不超过3000个语音全部录一次就可以了,所有的句子都可以通过这些基础语音重新合成。有些导航软件还支持将自己的声音录制成语音包,只需要在应用软件的提示下录制若干段关键语音就可以制作自己语音的导航包,过程十分有趣。
图1-3 某导航软件中的语音包
许多智能手机都支持人脸解锁,车站、校园等场所也经常碰到识别人脸的机器人,一种典型的人脸识别方法是通过面部特征点来识别,特征点的排列体现了人脸中眼睛、鼻子和嘴等比较有辨识度的局部形状,理论上特征点越多识别越精准,但对机器的运算能力和算法的设计要求也越高,图1-4所示为76个特征点的人脸标注。
有时候我们会面临特殊的人脸识别问题,比如一旦佩戴了口罩,人脸上可识别的特征点会大幅度减少,从而使得传统的人脸识别技术失效,如图1-5所示。武汉大学的科研人员开发了一个精准戴口罩软件程序,通过给公开数据集中的人脸戴上口罩,构建了1万人、50万张人脸的模拟戴口罩人脸数据集,开发的口罩遮挡人脸识别模型,在测试数据上可达到95%的识别准确率,这就说明,识别戴口罩的人,机器可以做到比人类准得多。
图1-4 人脸识别中的特征点
图1-5 模拟戴口罩的人脸样本
随着人工智能技术的广泛应用,我们生活的各个领域也在发生着变化。借助于语音识别技术,近年各地的中考英语考试中纷纷加入机考环节,如人机对话、口头转述、朗读等,这些环节中的部分阅卷工作也是由人工智能完成的。这些“阅卷老师”由人工专家进行训练,并能够不断地通过学习来改善其阅卷能力。
2020年6月,北京新发地批发市场爆发新冠肺炎疫情,快速精准地寻找到特定时间段内到访过新发地的人员成为疫情防控的重点,利用大数据智能筛查技术,通过地理信息和人员接触关系,在很短的时间内就找出了30多万与疫情相关的接触人员,并在第一时间对他们进行了核酸检测,大数据筛查短信如图1-6所示,当时其中2430人已经离开了北京,通过通信大数据对人员行程轨迹进行深入分析,还能知道这些人曾到访了哪些地方,辅助决策人员根据对疫情的可能扩散情况做出决策和判断。在人工智能技术的帮助下,这一波疫情很快得到了有效控制。
2020年3月,工信部公示了《汽车驾驶自动化分级》推荐性国家标准,意味着我国拥有了自动驾驶标准,随后长安汽车发布了国内首个L3级别的自动驾驶量产车型UNI-T,该型号车俩搭载了地平线的征程二代国产芯片(见图1-7),具备行人、车辆、车道线、交通信号等目标或路况信息的自动检测功能;另外,为了防止司机在驾驶过程中分散注意力,还有读唇语、眼神唤醒屏幕等智能感知功能。随着人工智能技术的不断发展,越来越安全便捷的自动驾驶技术将逐步走进我们的生活。
图1-6 疫情大数据筛查发送的提示短信
图1-7 征程二代国产芯片图
随着人工智能应用的遍地开花,我国已将人工智能作为赢得全球科技竞争主动权的重要战略抓手,不断深入基础理论研究,支持科学家勇闯人工智能科技前沿的“无人区”,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破。美国斯坦福大学的一份报告显示,2020年,中国在学术期刊上有关AI的论文引用率占比为20.7%,美国为19.8%,这是中国首次高过美国。另据长期专注于数据分析的科睿唯安公司统计,自2012年以来,中国的AI论文数量为24万篇,美国则为15万篇,中国压倒性地多于美国,特别是在图像识别和生成方面,中国取得了极为优异的研究成果,这也成为我们国家科技飞速发展的一个重要标志。