采用人工智能面临的挑战
人们需要了解采用人工智能的挑战,例如数据、人员和业务。人工智能正在进入更多的行业,越来越多的公司已经体验到了实施人工智能的好处。尽管人工智能正在发展并越来越受欢迎,但许多...
人们需要了解采用人工智能的挑战,例如数据、人员和业务。
人工智能正在进入更多的行业,越来越多的公司已经体验到了实施人工智能的好处。尽管人工智能正在发展并越来越受欢迎,但许多企业仍然无法采用这种新技术改进业务。这是为什么?
企业可能担心人工智能实施的原因有很多。在2019年,O'Reilly公司出版了一本电子书,总结了对企业采用人工智能的调查结果,并列出了阻碍进一步实施人工智能的一些很常见因素。
23%的受访者表示,他们没有进一步采用人工智能的主要原因是他们的公司文化不认可对人工智能的需求。其他原因包括缺乏数据和缺乏技术人员,以及难以确定适当的商业案例等。
企业在实施人工智能时面临哪些挑战?
正如人们所见,一些常见问题主要包括与人员、数据或业务一致性相关的问题。虽然每家公司都不同,并且也会以不同的方式体验人工智能的采用过程,但也应该注意一些障碍。在本文中,将介绍人工智能实现中很常见的一些挑战,并尝试建议如何做好应对这些挑战的准备。
与数据相关的问题可能是大多数企业所面临的问题。众所周知,企业构建的系统只能与它给出的数据一样好。由于数据是人工智能解决方案的关键要素,因此在此过程中可能会出现许多问题。
1.数据质量和数量
如上所述,人工智能系统的质量在很大程度上依赖于输入的数据。人工智能系统需要大量的训练数据集,以类似于人类的方式从可用信息中学习,但为了识别模式,它需要更多的数据。
在任务上做得更好,执行任务的经验越多,这是有道理的。不同的是,人工智能能够以人类想像不到的速度分析数据,因此其学习速度很快。企业给它的数据越好,它将提供更好的结果。
那么企业怎么解决数据问题?首先,需要知道已有的数据,并将其与模型所需的数据进行比较。为此,企业需要知道其将要使用的模型,否则,将无法指定所需的数据。
列出企业拥有的数据的类型和类别问题:数据是结构化的还是非结构化的?是否收集有关客户人口统计数据,购买历史记录,现场互动等数据?当企业知道其已经拥有的东西时,会看到所缺少的东西。
缺少的部分可能是人工智能系统可以轻松访问的一些公开信息,或者企业可能必须从第三方购买数据。某些类型的数据可能仍然难以获得,例如临床数据可以更准确地预测治疗结果。不幸的是,在这一点上,企业须做好准备,不是所有类型的数据都容易获得。
在这种情况下,综合数据得以拯救。综合数据是基于实际数据或从头开始人工创建的。当没有足够的数据可用于训练模型时,可以使用它。获取数据的另一种方法是使用开放数据作为数据集的补充,或使用谷歌数据集搜索获取数据来训练模型。企业还可以使用RPA机器人来抓取公开可用的数据,例如维基百科网站上发布的信息。
当企业知道自己拥有哪些数据以及需要哪些数据时,将能够验证扩展数据集的哪种方式更适合自己。
2.数据标签
几年前,大多数数据都是结构化的或文本的格式。如今,随着物联网(IoT)的发展,大部分数据都是由图像和视频组成的。这没有什么不对,但问题是许多利用机器学习或深度学习的系统都是以监督的方式进行训练,所以他们需要对数据进行标记。
事实上,人们每天产生大量数据的事实,已经达到了没有足够人员来标记正在创建的所有数据的程度。有些数据库提供标记数据,包括ImageNet,这是一个拥有1400多万张图像的数据库。所有这些都是由ImageNet人工注释的。尽管在某些情况下其他地方可以获得更合适的数据,但许多计算机视觉专家仍然只使用ImageNet,因为他们的图像数据已被标记。
企业可以采用一些数据标注方法。可以在企业内部或外包工作,也可以使用合成标签或数据编程。所有这些方法各有利弊。
3.可解释性
对于许多“黑盒”模型,企业最终得出一个结论,例如预测但没有解释。如果人工智能系统提供的结论与企业已经知道的结果重叠并认为是正确的,那么就不会质疑它。但是如果不认同会发生什么?需要知道如何做出决定。在许多情况下,其决定本身是不够的。医生不能完全依赖系统提供的关于患者健康的建议。
LIME(本地可解释的模型不可知解释)等方法旨在提高模型的透明度。因此,如果人工智能判断患者患有流感,它还会显示导致此决定的数据:打喷嚏和头痛,而没有考虑患者的年龄或体重。
当企业获得决策背后的理由时,更容易评估人们可以信任模型的程度。
4.特定案例学习
人们能够利用从一个领域到另一个领域的经验。这就是所谓的学习转移,人类可以在一个环境中转移学习到另一个类似的环境中。人工智能却难以将其经验从一种情况转移到另一种情况。
一方面,人们知道人工智能是专业的,它意味着执行严格指定的任务。它的目的只是回答一个问题,为什么人们还希望它能回答另一个不同的问题呢?
另一方面,人工智能在一项任务中获得的“经验”对另一项相关任务可能是有价值的。有没有可能利用这种经验而不是从头开始开发新的模型?转移学习是一种使之成为可能的方法——人工智能模型被训练来执行某项任务,然后将该学习应用到类似(但不同)的活动中。这意味着为任务A开发的模型稍后将用作任务B的模型的起点。
5.偏见
偏见是许多人所担心的事情:人工智能系统对女性或有色人种“有偏见”的故事不时成为头条新闻。但这是怎么发生的呢?当然,人工智能不能有恶意。
那么如果人工智能可能具有恶意呢?像这样的假设也意味着人工智能有意识的并且可以做出自己的选择,而实际上人工智能只能根据可用数据做出决策。它没有意见,但它从别人的意见中学习。这就是偏见发生的地方。
偏差可能是由许多因素造成的,首先是收集数据的方式。如果数据是通过杂志上发表的一项调查收集的,人们须意识到,其答案(数据)只来自阅读上述杂志的人群,这是一个有限的社会群体。在这种情况下,不能说这个数据集代表了整体人群。
探测数据的方式是产生偏见的另一种方式:当一群人使用某种系统时,他们可能拥有喜欢的功能,而根本不使用(或很少使用)其他功能。在这种情况下,人工智能无法了解未使用的功能。
但是在偏见方面,人们还有另外一件事需要考虑:数据来自人类。人们如果说谎或者散布成见。这种情况发生在亚马逊公司的招聘时,他们的人工智能招聘人员被证明具有性别偏见。由于技术部门的工作人员中男性占主导地位,人工智能系统了解到男性申请者是有利的,并对包含“女性”一词的简历进行筛选。它还降低了女子学院毕业生的等级。人们可以在一些关于人工智能失败的文章中了解关于这个案例的内容。
6.如何处理模型错误
人工智能并不是没有错误的。人类的偏见(或谎言)渗透到其算法中,有时结果是有偏见的。如上所述,数据集存在偏差的原因有很多。任何类似的问题都可能导致人工智能产生不准确的结果,例如预测。
“糟糕的推理”是人工智能错误的另一个常见原因。随着人工智能系统越来越先进,人们也越来越难以理解网络中的流程。因此,当人工智能系统出错时,可能很难确定出问题的确切位置。如果决定是自动驾驶汽车急转弯还是撞倒行人呢?幸运的是,科学家为深度学习系统开发了白盒测试。它用大量的输入来测试神经网络,并告诉它的响应哪里是错误的,这样它们就可以被修正。
但是人工智能犯的错误总是那么危险吗?当然,不总是这样。这完全取决于人工智能系统的使用。如果人工智能被用于网络安全、军事用途、驾驶车辆,那么更多的问题就会更加危险。如果人工智能系统选择男性而不是同样技术熟练的女性员工,这是一个道德问题。但有时这些错误只是愚蠢的——正如2015年《连线》杂志上的一篇文章所说,他们描述的人工智能显示了一个黑色和黄色条纹的图像。人工智能却判断为是校车,但这是错误的。
为了确保人工智能产生的错误无关紧要,须确保高质量的输入和适当的测试。
7. 非技术人员对人工智能缺乏了解
人工智能的实现需要企业管理层对当前的人工智能技术、它们的可能性和局限性有更深入的了解。不幸的是,人们被一大堆关于人工智能的神话和误解所包围,从需要雇佣内部数据科学团队(人们应该知道,他们只为Facebook、亚马逊、谷歌工作,以及如何工作)到科幻幻想中的机器人,以及机器人最终终结人类。
人工智能技术的缺乏阻碍了人工智能在许多领域的应用。由于缺乏理解而导致的另一个常见错误是努力实现不可能实现的目标。
那么如何解决这个问题?从教育开始。这可能听起来令人沮丧,但并不是说技术人员必须成为一名数据科学家。只需浏览一下其行业,了解一些重要的参与者,看看他们部署了哪些用例,并了解人工智能的当前可能性。技术人员可以自己解决,也可以请求专家帮助。一旦掌握了一些知识,就可以更轻松地管理自己的期望,因为将了解人工智能能为企业做些什么,不能做什么。
8. 缺乏实地专家
为了开发一个成功的人工智能解决方案,需要技术知识和业务理解。不幸的是,这往往是其中之一。执行官和管理者缺乏采用人工智能所需的技术知识,而许多数据科学家对他们开发的模型如何在现实生活中使用并不十分感兴趣。
知道如何将这项技术应用于某一特定业务问题的人工智能专家数量很有限。总的来说,优秀数据科学家的数量也是如此。
FAMGA(Facebook、苹果、微软、谷歌、亚马逊)以外的公司正在努力吸引顶尖人才。即使他们试图建立一支内部团队,他们也不确定自己是否能找到合适的人才。如果缺乏技术知识,无法真正了解他们是否提供高质量的解决方案。由于预算有限,中小型企业可能无法采用人工智能。但是,外包数据团队现在也是一种选择。
9. 缺乏业务一致性
正如O'Reilly公司在图表中所示,企业文化不承认人工智能的需求以及识别业务用例的困难是人工智能实施的大障碍。识别人工智能业务案例需要管理人员深入了解人工智能技术、它们的可能性和局限性。缺乏人工智能技术可能会阻碍许多组织的采用。
但这里还有一个问题。一些企业抱着过于乐观的态度,没有明确的战略,进入了人工智能的潮流。人工智能的实现需要一种战略方法,设定目标,确定关键绩效指标,跟踪投资回报率。否则,企业将无法评估人工智能带来的结果,并将其与企业的假设进行比较,以衡量这项投资的成功(或失败)。
10.难以评估供应商
正如招聘数据科学家的情况一样,当企业缺乏技术知识时,很容易被愚弄。人工智能是一个新兴领域,它特别脆弱,因为很多企业夸大他们的经验,而在现实中,他们可能不知道如何使用人工智能来解决实际的商业问题。
这里的一个想法是使用像Clutch这样的网站来识别人工智能开发中的领导者。看看正在考虑的企业在他们的投资组合中有什么好处。另一种方法是迈出一小步,例如与人们认为具有前途的供应商的研讨会。通过这种方式,将了解他们是否了解业务,拥有合适的技能,以及是否解决问题。
11.整合挑战
将人工智能集成到现有系统中是一个比在浏览器中添加插件更复杂的过程。必须设置满足业务需求的接口和元素。有些规则是硬编码的。人们需要考虑数据基础设施需求、数据存储、标记,以及将数据输入系统。
然后,进行模型培训,测试开发的人工智能的有效性,创建一个反馈循环,根据人们的行为不断改进模型,并进行数据采样,以减少存储的数据量,更快地运行模型,同时仍能产生准确的结果。怎么知道它有效?怎么知道具有价值?
为了克服可能的集成挑战,企业必须与供应商共同努力,以确保每个人都清楚地了解流程。它还要求供应商拥有更广泛的专业知识,而不仅限于建立模型。当人工智能以战略方式实施并逐步实施时,可以减轻失败的风险。
在企业成功地将人工智能集成到其系统中之后,仍然需要训练人们使用这个模型。他们如何接受模型产生的结果?他们如何解释结果?企业的供应商应该建议每天使用其模型,并建议如何进一步发展人工智能。
12.法律问题
一些文章描述了企业实施人工智能之前需要考虑的一些法律问题。法律规章跟不上技术的进步,将会出现问题。如果人工智能造成损害怎么办?如果由于人工智能的原因,某些东西被损坏或有人受伤,谁将对此承担责任?订购方还是开发人工智能的公司?
目前没有规则明确说明在这种情况下须采取的措施。另一个问题是采用GDPR法规,数据已成为须谨慎处理的商品,这可能是数据收集方面的挑战:可以收集哪些数据以及以何种方式收集数据?如何以符合GDPR法规的方式处理大数据?
敏感数据也存在明显不敏感的问题。虽然它可能不会构成法律问题,但它仍然是一个可能会伤害企业的问题。一般而言,任何泄漏威胁到企业的地位或其形象的信息都应被视为敏感信息。
想象一下,当企业员工培训和课程数据泄漏时,就会出现这种情况。这些信息可能被误解并传播,将会损害企业的业务。
如何应对人工智能采用的挑战?
人们须记住,自己无法处理所有问题。首先要做的是熟悉人工智能——这样,就更容易理解这个过程。然后,当企业创建人工智能策略时,就须认识到需要注意的问题。
通过战略性和循序渐进的方法,企业将能够更顺利地完成人工智能实施过程。没有错误是否可以实现?没有什么是百分之百完美的,但企业需要为今后可能发生的问题做好准备。
(来源:企业网D1Net)
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)