人工智能行业25大趋势
1 、 开源框架( Open-Source Frameworks )
人工智能的进入门槛比以往任何时候都低,这要归功于开源软件。 2015 年谷歌开放了其机器学习库 TensorFlow ,越来越多的公司,包括 Coca-Cola 、 e Bay 等开始使用 TensorFlow 。 2017 年 Facebook 发布 caffe2 和 Py Torch ( Python 的开源机器学习平台) , 而 Theano 是蒙特利尔学习算法研究所 (Mila) 的另一个开源库 , 随着这些工具 的使用 越来越广泛, Mila 公司已经停止了对 Theano 的开发。
2、 胶囊网络 (Capsule Networks)
众所周知,深入学习( Deep Learning )推动了今天的大多数人工智能应用,而胶囊网络( capsule networks )的出现可能会使其改头换面。深入学习界领航人 Geoffrey Hinton 在其 2011 年发布的论文中提到“胶囊”这个概念,于 2017 年 -2018 年论文中提出“胶囊网络”概念。针对当今深度学习中最流行的神经网络结构之一:卷积神经网络 (CNN) , Hinton 指出其存在诸多不足 , CNN 在面对精确的空间关系方面就会暴露其缺陷。比如将人脸图像中嘴巴的位置放置在额头上面, CNN 仍会将其辨识为人脸。 CNN 的另一个主要问题是无法理解新的观点。黑客可以通过制造一些细微变化来混淆 CNN 的判断。经测试,胶囊网络可以对抗一些复杂的对抗性攻击,比如篡改图像以混淆算法,且优于 CNN 。胶囊网络的研究虽然目前还处于起步阶段,但可能会对目前最先进的图像识别方法提出挑战。
3、 生成式对抗网络 (Generative Adversarial Networks)
2014 年,谷歌研究员 Ian Goodfellow 提出“生成式对抗网络”( GAN )概念,利用“ AI VS AI ”概念,提出两个神经网络:生成器和鉴别器。谷歌 DeepMind 实习生 Andrew Brock 与其他研究人员一起合作,对 Gans 进行了大规模数据集的培训,以创建“ BigGANs ”。 GANs 面对的主要挑战就是计算能力,对于 AI 硬件来说必须是并行缩放。研究人员用 GANs 进行“面对面翻译”,还有利用 GANs 将视频变成漫画形式,或者直接进行绘画创作等 , 但 GANs 也被一些不怀好意的人利用,包括制作假的政治录像和变形的色情制品。
4 、 联合学习 (Federated Learnnig)
我们每天使用手机或平板会产生大量数据信息,使用我们的本地数据集来训练 AI 算法可以极大地提高它们的性能,但用户信息是非常私人和隐秘的。谷歌研发的联合学习( Federated Learning )方法旨在使用这个丰富的数据集,但同时保护敏感数据。谷歌正在其名为 Gboard 的 Android 键盘上测试联合学习。联合学习方法与其他算法的不同在于考虑了两个特征:非独立恒等分布( Non-IID )和不均衡性( Unbalanced )。联合学习已运用于搜索引擎 Firefox 、人工智能创业公司 OWKIN 等。
5 、 强化学习 (Reinforcement Learning)
当谷歌 DeepMind 研发的 AlphaGo 在中国围棋游戏中击败世界冠军后,强化学习( Reinforcement Learning )获得了广泛关注。基于强化学习, DeepMind 接着又研发了 AlphaGo Zero 。 UC Berkeley 研究人员利用计算机视觉和强化学习来教授 YouTube 视频中的算法杂技技能。尽管取得了进步,但强化学习与当今最流行的人工智能范式监督学习相比,还算不上成功 , 不过关于申请强化学习的研究越来越多,包括 Microsoft , Adobe , FANUC 等。
2025 年自动驾驶利润达 800 亿美元 物流率先应用
6 、 人工智能终端化
人工智能技术快速迭代,正经历从云端到终端的过程 , 人工智能终端化能够更好更快地帮助我们处理信息,解决问题 , 我们舍弃了使用云端控制的方法,而是将 AI 算法加载于终端设备上(如智能手机,汽车,甚至 衣服 上)。英伟达( NVIDIA ),高通( Qualcomm )还有苹果( Apple )等诸多公司加入了对终端侧人工智能领域的突破和探索, 2017 和 2018 年是众多科技公司在人工智能终端化进入快速发展期的两年,同时他们也在加紧对人工智能芯片的研发。但 AI 依然面临着储存和开发上的困境,亟需更丰富的混合模型连接终端设备与中央服务器。
7 、 人脸识别
从手机解锁到航班登机,人脸识别的应用范围愈发广泛 , 各国对于人脸识别的需求逐渐升高,不少创业公司开始关注这一领域 , 利用该技术, 可以 通过脸部特点从而还原蒙面嫌疑犯完整的人脸。但人脸识别仍有待改进 。 这一技术仍会对人脸真假存在误判 。 人脸识别中所包含的数据远比我们想象要多,其中的安全问题也应引起我们关注。
8 、 语言处理
自然语言处理( NLP )是人工智能的一个子领域,对于翻译技术而言, NLP 就像一个潘多拉魔盒——除了丰富的市场机会,还有巨大的挑战。机器翻译就是其中一个等待开发的宝库,从后台自动化,客户支持,到新闻媒体,其应用广泛。人机共生也是翻译领域未来的大方向,不少初创公司也期待从中分一杯羹 , 但要完成基于自然语言处理工作的翻译系统并不容易,单单中文里的各种方言和书面语就能把众多科技公司难住 , 据相关数据显示,除了热门的高资源语言,如中文,阿拉伯语,欧洲语言等,低资源语言和少数民族语言的开发和应用依然存在缺口。
9 、 车辆自动化驾驶
尽管自动化驾驶的汽车市场潜力巨大,但实现全自动的未来依然不明朗。自动化驾驶成为了科技公司和初创公司互相竞争的新领域,他们为此注入的不仅有新的活力,还有大量的投资。投资者对他们的决定十分乐观,数个自动驾驶汽车品牌所获得的投资总额已超百亿 , 预计 2025 年其市场利润能达 800 亿美元,物流等相关行业会成为首批应用全自动驾驶的行业,预计可缩减三分之一的成本。
10 、 AI 聊天机器人
尽管许多人把聊天机器人看成是 AI 的代名词,但两者依然存在差别。如今的 AI 聊天机器人已经进化得十分完善,与真人对话时甚至还会应用“嗯 ... ”这一类口头语和停顿,但人们担忧这些机器人的行为过于逼真,开始考虑在对话时对其聊天机器人的身份进行确认说明的需要。国外的科技巨头 FAMGA ( Facebook , Apple , Microsoft , Google 与 Amazon )以及国内的 BAT 都把目光投向了这一领域。AI 诊断前景巨大 制药巨头押注 AI 算法
11 、医学成像与诊断
美国食品与药物管理局 (FDA) 正加速推进“ AI 即医疗设备”趋势。 2018 年 4 月, FDA 批准了 AI 软件 IDx-DR ,它可以在不需要专家干预的情况下筛查糖尿病视网膜病变患者,准确率超过 87.4% 。 FDA 还批准了 Viz LVO (可用于分析 CT 扫描结果以预测患者患中风危险)和 Oncology AI 套件(专注于发现肺部和肝脏病变),监管机构的快速审批为 80 多家 AI 成像和诊断公司开辟了新的商业道路。自 2014 年以来,这些公司共融资 149 笔。
在消费者方面,智能手机的普及和图像识别技术的进步正在把手机变成强大的家庭诊断工具,名为 Dip.Io 的应用使用传统尿液检测试纸来监测各种尿路感染。用户可以用智能手机给试纸拍照,计算机视觉算法会根据不同的光照条件和摄像头质量对结果进行校正。除此之外,许多“ ML 即服务”平台正集成到 FDA 批准的家庭监控设备中,发现异常时即可向医生发出警报。
12 、下一代假肢
早期的研究正在兴起,结合生物学、物理学和机器学习来解决假肢面临的最困难问题之一,即灵活性。这是个十分复杂的问题,比如要让截肢者能够在假肢手臂上活动单个手指,需要解码其背后的大脑和肌肉信号,并将其转化为机器人控制指令,这些都需要多学科配合。最近,研究人员开始使用机器学习来解码来自人体传感器的信号,并将其转换成移动假肢设备指令。
还有些论文探讨了新媒介解决方案,比如使用肌电信号 ( 残肢附近肌肉的电活动 ) 来激活摄像头,以及运行计算机视觉算法来估计他们面前物体的抓取方式和大小。年度机器学习大会 NeurIPS ’ 18 已经发起“ AI 假肢挑战赛”,进一步突显了 AI 社区对该领域的兴趣, 2018 年的挑战是使用强化学习预测假肢的性能,有 442 名参与者试图教 AI 如何跑步,赞助商包括 AWS 、英伟达以及丰田等。
13 、临床试验患者招募
临床试验的最大瓶颈之一是招募合适的患者,苹果或许能够解决这个问题。尽管人们在努力将医疗记录数字化,但互操作性(在机构和软件系统之间共享信息的能力)仍是医疗保健领域最大的问题之一。理想的 AI 解决方案是从患者的病历中提取相关信息,并与正在进行的试验进行比较,为进行匹配研究的 AI 软件提供建议。
然而,像苹果这样的科技巨头已经成功地为他们的医疗保健计划引入了合作伙伴,苹果正在改变医疗数据的流动方式,并为 AI 开辟了新的可能性,尤其是围绕临床研究人员招募和监测患者的方式。自 2015 年以来,苹果推出了两个开源框架—— ResearchKit 和 CareKit ,以帮助临床试验招募患者,并远程监控他们的健康状况,消除了地理障碍,苹果还与 Cerner 和 Epic 等流行的 EHR 供应商合作,解决互操作性问题。
14 、先进医疗生物识别技术
利用神经网络,研究人员开始研究和测量以前难以量化的非典型危险因素,使用神经网络分析视网膜图像和语音模式可能有助于识别心脏病的风险。比如,谷歌的研究人员使用受过训练的视网膜图像神经网络来发现心血管疾病的危险因素,如年龄、性别和吸烟等,梅奥诊所通过分析声音中的声学特征,可以发现冠心病患者的不同语音特征。
不久的将来,医疗生物识别技术将被用于被动监控,比如谷歌的专利希望通过肤色或皮肤位移来分析心血管功能,这些传感器甚至可能被放置在病人浴室的 “感应环境”中,通过识别手腕和脸颊的皮肤颜色变化,用来确定心脏健康指标,如动脉僵硬或血压。亚马逊也申请了被动监测专利,将面部特征识别与心率分析结合起来。 AI 发现模式的能力将继续为新的诊断方法和识别以前未知的危险因素铺平道路。
15 、药物发现
随着 AI 生物技术初创企业的兴起,传统制药公司正寻求 AI SaaS 初创企业为漫长的药物研发周期提供创新解决方案。 2018 年 5 月,辉瑞与 XtalPi 建立了战略合作伙伴关系,预测小分子药物的性质,开发“基于计算的理性药物设计”。诺华 (Novartis) 、赛诺菲 (Sanofi) 、葛兰素史克 (GlaxoSmithKline) 、安进 (Amgen) 和默克 (Merck) 等顶级制药公司,最近几个月都宣布与 AI 初创企业建立合作关系,以发现肿瘤和心脏病等领域的新药。
虽然像递归制药 (Recursion Pharmaceuticals) 这样的生物技术 AI 公司正在投资 AI 和药物研发,传统制药公司正在与 AI SaaS 初创公司合作。尽管这些初创公司中有许多仍处于融资的早期阶段,但它们已经拥有自己的制药客户。在药物研发阶段,成功的衡量标准很少,但制药公司正把数百万美元押在 AI 算法上,以发现新的治疗方案,并改变旷日持久的药物研发过程。合成数据集用以解决 AI 的数据依赖
16 、预测性维护
从制造商到设备保险公司, AI-IIoT 可以在在故障损害发生之前,提出防范措施。现场和工厂设备会产生大量的数据,然而,未预料到的设备故障是制造业停机的主要原因之一。预测设备或单个部件何时失效将使资产保险公司和制造商受益。在预测性维护中,传感器和智能摄像机收集来自机器的连续数据,如温度、压力等。实时数据的数量和变化形式使机器学习成为 IIoT 不可分割的组成部分。随着时间的推移,算法可以在故障发生之前预测可能出现的隐患。随着工业传感器成本的降低、机器学习算法的进步,以及对边缘计算的推动,预测性维护会更加广泛。
17 、后台自动化
人工智能正在推动管理工作走向自动化,但数据的不同性质和格式使其成为一项具有挑战性的任务。根据行业和应用程序的不同,自动化 “后台任务”的挑战可能是独一无二的,例如,手写的临床笔记对自然语言处理算法来说就是一个独特的挑战。机器人过程自动化( RPA )一直是热门话题,虽然并非所有的机器人过程自动化都基于机器学习,但许多都开始将图像识别和语言处理集成到它们的解决方案中。
18 、综合训练数据
对于训练人工智能算法来说,访问大型的、标记的数据集是必要的,合成数据集可能会成为解决瓶颈问题的关键,人工智能算法依赖数据,当一些类型的现实世界数据不易被访问时,合成数据集的用武之地就体现出来,一个有趣的新兴趋势是使用 AI 本身来帮助生成更“逼真”的合成图像来训练 AI ,例如,英伟达使用生成对抗网络( GAN )来创建具有脑肿瘤的假 MRI 图像。 GAN 被用于“增强”现实世界数据,这意味着 AI 可以通过混合现实世界和模拟数据进行训练,以获得更大更多样化的数据集。此外,机器人技术是另一个可以从高质量合成数据中获益的领域。
19 、网络优化
人工智能正在开始改变电信,电信网络优化是一套改进延迟、带宽、设计或架构的技术 ——能以有利方式增加数据流的技术,对于通信服务提供商来说,优化可以直接转化为更好的客户体验,除了带宽限制之外,电信面临的最大挑战之一是网络延迟,像手机上的 AR / VR 等应用,只有极低的延迟时间才能达到最佳的功能。电信运营商也在准备将基于 AI 的解决方案集成到下一代无线技术中,即 5G ,三星收购了基于 AI 的网络和服务分析初创公司 Zhilabs ,为 5G 时代做准备,高通认为人工智能边缘计算是其 5G 计划的重要组成部分(边缘计算可减少带宽限制并与云进行频繁通信,这是 5G 的主要关注领域)。
20 、网络威胁狩猎
对网络攻击做出反应已经不够了,使用机器学习主动 “搜寻”威胁正在网络安全中获得动力。顾名思义,威胁搜寻是主动寻找恶意活动的做法,而不仅仅是在发生警报或违规后做出反应,狩猎开始于对网络中潜在弱点的假设,以及手动和自动化工具,以在连续的迭代过程中测试假设,网络安全中庞大的数据量使机器学习成为流程中不可分割的一部分,威胁狩猎很可能会获得更多的动力,然而它也面临着自身的一系列挑战,比如应对不断变化的动态环境和减少误报。训练算法 指纹追踪 人工智能防范假货
21 、电子商务搜索
对搜索词的上下文理解正在走出 “实验阶段”,但要广泛采用搜索词还有很长的路要走,当使用电子商务搜索来显示相关结果时,使用适当的元数据来描述产品是一个起点。但是仅仅描述和索引是不够的,许多用户用自然语言搜索产品 ( 比如“没有纽扣的洋红色衬衫” ) ,或者不知道如何描述他们在寻找的商品,这使得电子商务搜索的自然语言成为一个挑战。
22 、汽车索赔处理
保险公司和初创公司开始使用人工智能来计算车主的 “风险得分”,分析事故现场的图像,并监控驾驶员的行为, Ant Financial 在其“事故处理系统”中使用深度学习算法进行图像处理,过去,车主或司机会把他们的车送到“理算师”那里,理算师负责检查车辆的损坏情况,并记录下详细情况,然后将这些信息发送给汽车保险公司。如今,图像处理技术的进步使得人们可以拍下这辆车的照片并将其上传,神经网络对图像进行分析,实现损伤评估的自动化,另一种方法是对驾驶员进行风险分析,从而影响汽车保险的实际定价模型。
23 、防伪
假货越来越难被发现,网购使得购买假货比以往任何时候都容易。为了反击,品牌和典当商开始尝试人工智能,在网络世界和现实世界两条战线上与假货作战。不过,网上假冒伪劣产品的范围和规模庞大复杂,造假者使用与原始品牌列表非常相似的关键词和图片,在假冒网站上销售假货,在合法市场上销售假货,在社交媒体网站上推广假货,随着 “超级假货”或“ aaa 假货”的兴起,用肉眼分辨它们几乎变得不可能。现在,建立一个假冒伪劣商品的数据库,提取其特征,并训练人工智能算法来分辨真伪,虽是一个繁琐的过程,但对于奢侈品牌和其他高风险零售商来说非常有必要,下一步的解决方案还可能是在实体商品上识别或添加独特的“指纹”,并通过供应链对其进行跟踪。
24 、零售
走进一家商店,挑选你想要的东西,然后走出去,这几乎 “感觉”就像在行窃,人工智能可以杜绝真正的盗窃行为,并让免结账手续零售变得更加普遍。盗窃一直是美国零售商的一大痛点,然而,当你掌握进出商店的人,并自动向他们收费时,有人入店行窃的可能性就会降到最低。其余一些需要考虑的事情是如何利用建筑空间,特别是在拥挤的超市,确保摄像机被最佳地放置来追踪人和物品。在短期内,问题将归结为部署成本和由潜在技术故障造成的库存损失成本,以及零售商能够承担这些成本和风险的程度。
25 、农作物监测
无人机可以为农民绘制农田地图,利用热成像技术监测湿度,识别虫害作物并喷洒杀虫剂。
初创公司正专注于为第三方无人机捕获的数据添加分析。还有人使用计算机视觉使地面上的农业设备变得更智能,按照需要喷洒个别作物,就会减少对非选择性除草剂的需求,而非选择性除草剂会杀死附近的一切,精确喷洒意味着减少除草剂和杀虫剂的使用量。在实地调查之外,利用计算机视觉分析卫星图像提供了对农业实践的宏观理解,地理空间数据可以提供关于全球作物分布模式和气候变化对农业影响的信息。