带你从0到1开发AI图像分类应用

摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用 。
本文分享自华为云社区《AI Gallery:从0到1开发AI图像分类应用》 , 作者: yd_269359708。
现如今,人工智能(AI)技术在计算机领域内,得到了越来越广泛的重视,并在各行各业中得到应用 。然而无论是AI开发的初学者 , 还是资深的AI开发专家,在AI 应用开发工程中,都会面临着不小的麻烦 。我们今天要介绍的AI Gallery,就是一个开放的开发者生态社区,提供了数据集、算法、模型等AI数字资产的共享 , 帮助开发者加速AI产品的开发与落地 , 保障AI开发生态链上各参与方高效地实现各自的商业价值 。
背景知识AI 开发基本流程在介绍AI Gallery之前,我们先来看看一个AI应用开发的基本流程,方面后面更好的说明AI Gallery在AI 应用开发流程中能够提供的帮助 。大神请直接跳过此章 。
AI开发的基本流程通常可以归纳为几个步骤:确定目的、准备数据、训练模型、评估模型、部署模型 。
带你从0到1开发AI图像分类应用

文章插图
  1. 确定目的在开始AI开发之前,必须明确要分析什么?要解决什么问题?商业目的是什么?基于商业的理解 , 整理AI开发框架和思路 。例如 , 图像分类、物体检测等等 。不同的项目对数据的要求,使用的AI开发手段也是不一样的 。
  2. 准备数据数据准备主要是指收集和预处理数据的过程 。按照确定的分析目的,有目的性的收集、整合相关数据,数据准备是AI开发的一个基础 。此时最重要的是保证获取数据的真实可靠性 。而事实上,不能一次性将所有数据都采集全 , 因此 , 在数据标注阶段你可能会发现还缺少某一部分数据源 , 反复调整优化 。
  3. 训练模型俗称“建模” , 指通过分析手段、方法和技巧对准备好的数据进行探索分析 , 从中发现因果关系、内部联系和业务规律 , 为商业目的提供决策参考 。训练模型的结果通常是一个或多个机器学习或深度学习模型 , 模型可以应用到新的数据中,得到预测、评价等结果 。业界主流的AI引擎有TensorFlow、Spark_MLlib、MXNet、Caffe、PyTorch、XGBoost-Sklearn、MindSpore等,大量的开发者基于主流AI引擎,开发并训练其业务所需的模型 。
  4. 评估模型训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察 。往往不能一次性获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型 。一些常用的指标,如准确率、召回率、AUC等,能帮助您有效的评估,最终获得一个满意的模型 。
  5. 部署模型
模型的开发训练,是基于之前的已有数据(有可能是测试数据),而在得到一个满意的模型之后,需要将其应用到正式的实际数据或新产生数据中,进行预测、评价、或以可视化和报表的形式把数据中的高价值信息以精辟易懂的形式提供给决策人员,帮助其制定更加正确的商业策略 。
ModelArts明白了AI 应用开发的流程,我们就可以在本地搭建环境来进行AI应用开发了 。但是俗话说“工欲利其事必先利其器”,借助成熟的AI 开发平台,能够极大地提高我们的开发效率,缩短我们的开发周期,减少我们的开发成本 。在这里,我推荐的是华为云的ModelArts 一站式AI开发平台 。
ModelArts作为一个一站式的开发平台,能够支撑开发者从数据到AI应用的全流程开发过程 。包含数据处理、模型训练、模型管理、模型部署等操作,并且提供分享功能,能够在AI Gallery上与其他开发者分享模型 。
ModelArts支持图像分类、物体检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景 。
带你从0到1开发AI图像分类应用

文章插图
AI Gallery现在开始进入我们的主题:AI Gallery 。
有AI应用开发经历的同学,应该都有类似的感悟 。纵观AI应用的整个开发流程,从数据采集、标注,到算法模型的构建,每个环节都会产生许多可以复用的AI资产,而AI Gallery的目的之一就是充分发挥这些资产的效用,提高AI开发效率 。
AI Gallery是在ModelArts的基础上构建的开发者生态社区,提供了Notebook代码样例、数据集、算法、模型、Workflow等AI数字资产的共享 , 为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体 , 提供安全、开放的共享及交易环节,加速AI资产的开发与落地,保障AI开发生态链上各参与方高效地实现各自的商业价值 。

推荐阅读