首页 > 工业机器人

零基础学AI:开启机器学习项目的 3 个步骤

来源:控制工程网2021.09.26阅读 2557

  仿佛就在不久前,机器学习(ML)和人工智能(AI)对于制造业中的许多人来说还只是相当新的概念。许多公司正在加快步伐,缓慢而系统地采用这些技术。幸运的是,这一领域的产品近年来有了很大的改进。不过,基本概念是相同的。
  人工智能(AI)是一个包罗万象的术语,它涵盖了让计算机或系统看起来更智能的任何技术。从图像识别到飞机自动驾驶系统,这一切最早可以追溯到1914年。机器学习(ML)是AI的一个子集,专注于机器提取数据洞察力的能力。过去,机器学习的研究通常是关于普通的ML算法,这些算法被用来开发关于数据的见解。

机器学习和人工智能的目标和算法

有许多算法可以与机器学习和人工智能的目标相匹配,上面这些应该提供了一个很好的起点。

  机器学习为制造商带来的好处
  近年来,人们的关注点已经从ML算法本身转向ML应用成果。以下是今天很多企业正在寻求的ML应用成果:
  1. 预测性故障和警报可能是企业节省成本的最重要领域之一。如果一条生产线将要停产,那么尽早关闭它并进行维护要比中途停产更具成本效益。根据算法预测故障并生成警报可以帮助企业节省大量资金。
  2. 过程优化是另一个受欢迎的领域。通常采取的形式是让系统为调整系统的设定点和变量提供建议。有两种主要的过程优化类型:开环和闭环。开环优化涉及用户互动,系统可能建议改变以优化一个过程,工程师或其他专家审查建议并选择是否应用它们。闭环优化将任何人工干预完全排除在流程之外,调整建议会自动应用。
  通常,企业会先以开环方式运行优化算法,对结果感到满意后,便会切换到闭环。尽管闭环优化通常需要每隔几分钟、几小时或几天才执行一次,但是在某些情况下,运行速度更快可能很有用。这将提供恒定的过程调整,而使用传统方法(例如PID回路)进行调整可能非常困难或不可能实现。大多数执行高速ML过程调整的人最终都会在PLC旁边的嵌入式PC或类似硬件上运行ML算法以进行调整。
  3. 异常检测可以发现偏离正常操作条件的情况。这可以让人了解过程何时处于次优状态下运行,或者及时预测不良生产运行或设备的错误。这些系统通常提供一组数字,表明一个过程有多接近正常运行条件。结果可以被认为是额外的“传感器”,并且异常检测算法的结果可以用于从警报异常状态到关闭进程的任何事情。尽管与预测性故障和警报类似,但异常检测可提供有关当前过程运行情况的信息,而不是预测将来的运行情况。
  4. 缺陷分析通常是通过图像识别算法完成的,对于零件分类和检测异常非常有用。
  开启机器学习项目的3个步骤
  虽然上面这些好处听起来都很棒,但是到底如何开启一个机器学习项目呢?以下是适用于每个ML项目的一些初始步骤:
  1. 确定一个可以从上述结果之一中受益的系统。
  2. 明确要使用该系统进行分析的内容以及要实现的结果。
  3. 验证你是否有为该系统收集的大量历史数据。大多数ML算法需要大量的数据才能从中 "学习"。如果你的系统没有这些数据,可以添加历史记录,并在几周或几个月后重新访问。
  如何建立机器学习模型?
  接下来是生成机器学习模型。模型是为获得所需结果而执行的程序。建立一个ML模型通常需要如下3个步骤:
  1. 准备数据。所有的ML模型都需要数据来生成。大多数从历史数据库导出的数据并不完美,需要进行清理。这通常意味着识别来自坏的传感器的数据并将其排除,并确保数据看起来合理。熟悉系统的过程工程师可以查看数据并帮助确定它是否是一个干净的数据集。
  2. 训练该模型。这是通过向其提供清洁的数据并选择一些训练选项来完成的。
  3. 对模型进行评分,以查看其效果如何。通过训练总是会产生一个模型,但这个模型可能在预测方面非常糟糕。查看分数以检测模型的性能,并确保模型得分良好。
  3种类型的AI / ML软件
  尽管用户可能知道如何准备数据,但他们可能不知道如何训练模型或对其进行评分。如果是这样的情况,是时候选择适合的AI / ML软件了。
  1. AI软件供应商 
  在这一领域有许多AI软件公司涌现出来,其中一些供应商可以为某些类型的设备构建模型或提供预构建的模型。
  2.低代码或无代码ML平台 
  越来越多的平台可以帮助人们创建自己的ML模型。例如Google Cloud AutoML,AWS ML和Microsoft Azure机器学习工作室等。通常会建议您有一定的机器学习算法的基本知识,但是入门并不是那么棘手。对聚类、回归和分类算法的基本了解对于初学者来说是一个很好的起点。
  3.编码ML平台 
  这些平台是最常见的。如果您已经有数据科学家或信息技术(IT)部门正在执行ML项目,则可以依靠他们为您指出正确的方向。Google、AWS和Azure都提供相关产品。此外,TensorFlow和Scikit-learn等许多免费选项都可以在本地运行。
  考虑从低代码的ML平台开始,然后再过渡到完整的编码平台,这种想法并没有什么错。编码平台使用起来更复杂,通常由数据科学家使用,但增加的灵活性往往导致更高的得分模型。模型越好,结果越好,就越有可能实现既定目标。
  在最初的探索之后,许多企业聘请了数据科学家来帮助进行机器学习工作,但这并不是必须的。想要尝试这项新技术并追求其带来成果的任何人都可以使用和访问这些技术。
  毫无疑问,AI和ML在未来将继续成为控制和自动化领域的一个重要组成部分。寻求运营成本或效率优势的公司可能会发现,对可能的选择进行一点研究是非常值得他们花时间的。(作者:Kevin McClusky)