您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 开发技术 > 正文

人工智能和机器学习项目的五大常见错误

发表于:2023-02-07 作者:Harris编译 来源:机房360

由于各种各样的原因,各种规模和各个垂直行业的公司都在继续拥抱人工智能(AI)和机器学习(ML)。他们渴望利用人工智能进行大数据分析,以识别商业趋势,变得更有创新精神,同时改善服务和产品。公司也在利用人工智能自动化销售流程、营销计划和客户服务计划,共同的目标是增加收入。

但不幸的现实是,85%的人工智能和机器学习项目都无法交付,只有53%的项目能从原型到生产。尽管如此,根据最近的IDC支出指南,到2025年,美国在人工智能方面的支出将增长到1200亿美元,增幅将达到20%甚至更多。

因此,避免五个经常导致人工智能和机器学习项目失败的常见错误是很重要的。

1.了解训练机器学习算法所需的资源

虽然说你正在利用人工智能和机器学习革新公司的流程听起来很不错,但事实是80%的公司发现这些项目比预期的更难。

为了使这些项目获得成功,您需要清楚地了解在资源和人员方面需要什么。最常见的错误之一是不了解如何获得正确的培训数据——这不仅对此类计划的成功至关重要,而且还需要大量的努力和专业知识才能成功完成。大多数希望承担AI/ML项目的公司无法获得确保高质量、公正结果所需的参与者数量或群体多样性。

然而,如果做不到这一点,往往会给成功带来巨大的障碍,导致项目成本飙升,项目信心暴跌。

2.不要依赖数据代理获取一刀切的训练数据

可供企业购买的培训数据并不匮乏。问题在于,一家公司可以轻松地以低廉的价格购买大量数据并不意味着它就是高质量的训练数据,而这正是成功的人工智能和机器学习项目所需要的。公司需要的不是简单地购买一刀切的数据,而是特定于项目的数据。

因此,为了减少偏见,确保数据能够代表广泛而多样的受众是很重要的。数据还需要针对您的算法进行很好的注释,并且应该始终检查数据是否符合数据标准、数据隐私法和安全措施的要求。

3.不要误解人工智能发展的曲折之路

机器学习算法的训练不是一个奇异的过程。一旦培训开始并且更好地理解了数据模型,就必须不断地对所收集的数据进行更改。然而,在算法训练过程开始之前,要知道您实际需要什么数据并不容易。例如,您可能会意识到训练集或数据收集方式存在问题。

这是许多公司在使用数据代理时遇到的另一个问题:它们通常严格限制修改策略或根本不允许修改。唯一的办法是购买额外的训练集,以满足新的要求。然而,这样一来,一个恶性循环就开始了,它会使预算不堪重负,工期延误,效率降低。

4.始终集成质量保证(QA)测试

通常,QA测试被认为是确保产品正确工作的附加项或形式,而不是被视为在所有迭代中优化产品的必备工具。事实上,QA测试是成功人工智能开发的重要组成部分。结果验证应该整合到人工智能开发过程的每个阶段,以降低成本,加快开发时间表,并确保资源的有效分配。

5.安排频繁的评论

尽管想象起来可能令人气馁,但现实是,人工智能项目永远不会真正完成。即使项目超出了准确性和性能预期,用于这样做的数据也反映了过去的一个点。此外,算法学会根据不断变化的事物(观点、对话、图像等)做出决策。为了让人工智能体验在现在和未来都获得成功,它必须在滚动的基础上进行再培训,以适应新的社会态度、技术发展和其他影响数据的变化。

最终,失败是由这样一个事实驱动的:公司低估了确保顶级资源、最佳实践和项目开始时最高质量所需的努力和规划方法。事实上,从人工智能的采用中看到最积极影响的公司遵循核心和人工智能最佳实践,在人工智能上的投入比同行更高效和有效。这包括在部署前测试人工智能模型的性能、跟踪性能以查看结果是否随着时间的推移而改善,以及制定良好的协议以确保数据质量。

通过开发一个强大的开发人工智能的程序方法,企业可以避免这些常见的错误,并确保他们的人工智能和机器学习计划的长期成功。