作者:Yingwu Gao

Yingwu Gao
是产品工程和 AI 实践副总裁,负责企业产品工程与创新,包括 AI、数据科学和云计算。她所带领的团队在定义和打造全新市场相关产品和服务方面(例如企业 AI、云 AI 解决方案和 Pact.AI 平台创新)扮演着至关重要的角色。

 

AI 如何将数据转化为资产:价值实现之旅

对您的企业而言,最宝贵的资产是什么?根据公司性质的不同,您的答案可能包括销售(如销售人员和支持软件)、供应链(如库存、仓库和运输)等。  

如今,越来越多的企业认为数据本身就是一种资产。实际上,数据本身并不是资产,但它可以成为资产。数据无疑会将您的所有资产结合在一起,并通过卓越的软件为其提供支持。但是,随着来自各种来源(如机器、人员和数字进程)的数据以前所未有的速度爆炸式增长,激增的数据呈现出一种未知状态——原封未动、未经处理,远未实现其作为资产的潜力。  

矛盾的是数据越来越普遍,但无处不在的数据并不等同于有用数据。要使海量数据本身成为资产,并像所有其他资产一样发挥业务价值,企业必须部署人工智能 (AI) 技术。 

价值实现之旅

最大限度地挖掘数据价值对企业而言至关重要。在瞬息万变的市场中,组织需要不断寻找促进增长的驱动力。他们处于持续的压力之下,必须最大限度地改善运营效果并提高生产效率,以期实现投资回报的最大化。可以说,他们害怕错失消费者行为转变或新兴创新推动技术所带来的机会。为了抓住这些机会,企业需要不断分析大量数据的含义。能够洞察数据者,便是未来的赢家。但这一切的前提是——将数据转化为资产。 

这一过程谈何容易?数据具有多种格式,包括结构化数据和非结构化数据。正是这种复杂的性质为数据价值的实现带来了挑战。例如,您的数据可视化软件可以从运营数据中获取见解,但前提是数据采用 CSV 文件等结构化格式。然而,现代数据很少采用结构化格式,因为标准商业智能软件无法按原样使用它们。如今,物流公司会通过其车队的智能传感器收集各种数据(包括 GPS 定位、车辆状况、图像、环境声音,以及来自其他系统的交通和天气数据),并使用这些数据以不同方式运营现有业务,甚至拓展全新业务。 

在与数据科学家交谈时,他们向我讲述了耗费大量时间对数据进行工程处理(清理、组织和转换)以提高预测模型准确性的艰难时光。由于他们经常需要处理 PB 级的结构化及非结构化数据,这一过程的难度进一步加剧。这项任务对任何一个人或一组人来说都过于艰巨。将数据开发成真正的资产是一项任重而道远的任务,就像黄金精炼过程一样。AI 可以在这一旅程中大展身手,实现流程的自动化和智能化,并从数据中获取见解,从而实现业务成果。 

搭载 AI 技术的数据管道

在人们的印象中,AI 往往是指播放音乐的数字助理或为下次购买提供建议的推荐引擎。机器学习可以在帮助公司管理数据管道方面发挥日益重要的作用。搭载 AI 技术的数据管道可以减轻数据科学家的压力,代替他们对数据进行工程处理,使他们能够专注于自己的本职工作——对数据进行复杂建模。

以下是价值实现之旅的模式:

数据提取:首先,从不同的来源获取和导入数据(通常为原始数据),并实时进行流式传输或分批提取。然后,使用 ML 嵌入式安全性和合规性方法,通过自动或混合流程从机器、系统、环境、人员以及介质等处收集和检索所选数据,并将其存储在数据湖或数据仓库等目标位置。最后,按需捕获正确的数据,开始价值实现之旅。

数据准备:要将数据集转换为可用形式,数据预处理或“数据整理”至关重要。在开始处理和分析之前,需要对数据进行清理和转换,然后再进行重新格式化、筛选、聚合、标准化和扩充。这一过程可通过 ML AI 自动实现并且必不可少,能够为数据提供上下文信息以获得见解并消除由于数据质量低下而导致的偏差。在进行特征工程之后,需要进一步处理数据,以便提取域相关字符,然后再针对数据进行算法培训。

建模与评分:使用学习算法(ML DL)根据所准备的数据对模型进行培训,该数据通常是要学习的培训数据集。学习算法会在培训数据中寻找数据模式,并输出捕获了这些模式的模型。培训完成后,将对生成的模型进行评分、验证并测试其准确性。随后,根据评分结果调整超参数,以获得更全面、更准确的结果。该模型可用于新数据集,以便从业务问题中获取切实可行的见解,从而进行预测、推荐和决策等。

数据提供:部署到生产环境中后,便可以提供和交付数据输出和模型,然后用于加深数据理解、优化业务运营并提高管理能力。通过模型对未来结果进行预测是数据价值实现的最佳示例。

该数据管道是一个正反馈环。随着新数据的流入,搭载 AI 技术的数据管道将不断提高馈送到 AI 模型中的数据质量。当然,这时必须谨慎处理。如果未能妥善处理来自结构化和非结构化数据源的数据流,则有偏差甚至受污染的数据就会进入 AI 模型,将您的潜在业务资产转变为业务风险。

数据价值实现既是科学又是艺术,必须不断进行投入和学习,才能提取数据的真正价值并将其转化为真知灼见。要使数据真正成为一种资产,人工智能和人类创造力需要相辅相成,以便衡量所获得的见解、发现数据模式并预测未知结果。凭借这种系统思维以及将 AI 应用到整个数据流程的方法,您的数据流将发挥价值,数据湖将保持健康状态,使得数据生态系统实现可持续的蓬勃发展。这样一来,数据可能会成为您最宝贵的资产。

Pact.AI

文思海辉的 Pact.AI 可提供完整的端到端产品组合,包括数据科学和数据工程服务、智能数据管道管理、预测和认知分析、AI 应用支持和解决方案加速器以及 AI 转换,助您实现自己的 AI 产品愿景。使用 Pact.AI,您可以将数据转化为最宝贵的资产。联系我们,详细了解 Pact.AI 如何助您将数据转化为 AI 资产。