有没有思考过,当我们在大谈特谈释放企业数据价值的时候,这个价值到底有多少?它是如何计算的?有没有可能企业的数据压根就没价值?


在数据要素流通的大背景下,这个问题显然是一道必答题。


价值是事物本身的成本和从中获得收入的差额。对于固定资产,价值是很容易计算的,而作为虚拟资产的数据,其价值就没有统一标准,计算方法就会变得更为复杂。但是,我们可以站在企业数据管理的角度,从企业数据的成本和收入,定向的去分析下。


数据的成本



数据的收入



这里面有一些是显而易见、有明码标价的,比如数据的存储成本和数据的售卖价格。



假如要为100T数据搭建数据平台,一次性投入的沉默成本要2000万。那数据转卖的价格要高于2000万才能保证这100T数据有正向价值。


当然,这只是一个简单粗暴的计算,不仅是实际的商业环境中,数据很难直接售出,而且成本和收入是同时扩大且可变的,比如说数据挖掘的成本和数据应用创新的预期收入。



假设,我是一个电商平台,想要通过大数据客户标签项目,通过提高1%用户的购买率,让预期业务毛利提升1000万。那么,需要组建一个项目团队(分析师、数据开发等),项目总成本是400万。项目结束后,实际购买率近提升0.5%,业务毛利增加了500万,那么这些数据的价值就是500-400=100万。



以上这种情况是一个非常常见的场景,甚至是比实际状况更乐观的假设,多数情况企业大费周章,得到的分析报告质量和决策支撑可能会很糟,以至于数据分析项目无法产生额外收入,无法形成正向价值。假如你是企业管理层,就必然会对数据分析项目和数据价值有更高期待,如何让数据产生更大的价值?


在这里我们使用收入和成本构建一个价值边际效益模型。


还是以大数据分析为例,通常分析师和数据开发工程师在日常工作的主要难点在于,取数需求量大不得不排队,同时业务需求变更又很频繁。


为了能破解这个难题,当前企业的做法是,投入更多的数据开发资源。这就导致了一个问题,随着数据开发资源的投入,数据分析产生的数据价值不在显著提升,过高的资源投入只会导致总价值收益(也就是边际效益),达到最大后开始逐渐递减为负。



所以,数据资产的边际效益跟开采任何一个资产类似,比如石油矿藏,有些油田虽然探明储量巨大,但由于是深水深层油田,或者是致密油、页岩油,导致开采难度巨大,开采成本远高于原油市场价格,于是该油田也就失去了价值。


因此,面对数据资产的开发和价值变现这个现实议题,我们关注的不是追加传统技术资源的投入,而需要考虑如何用更加高效和经济的挖掘数据价值。在AI火爆的当下,我们很自然将求解的注意力投入到AI大语言模型上。


结合企业本地数据资产,构建适合企业数据价值挖掘的大语言模型,让企业在降低数据挖掘的成本同时,提升数据应用创新的预期收入。


我们将传统数据开发资源从人力投入替换成AI建设之后,这个曲线模型发生了重大改变。横轴的投入基本上是恒定的(AI作为一次性的投入,后期需要追加的人力和技术都投入较少),也就是说一次投入,长期受益。


尤其是业务侧的长尾需求,通过AI处理可以说是零成本带来业务受益。当然,我们通过数据应用创新带来的新增受益是有限的,但是目前多数的企业在数据资产的利用上,还远没有达到天花板。



接下来,我们需要思考的,就是如何借助AI爆发之势,打造企业自己数据分析应用大模型。作为长期在数据领域实践的厂商,我们给出的关注重点在:模型准确可信赖、模型可以整合指标及BI、交互简单易上手、模型应用时效和性能保障。



可信赖是大模型在数据分析领域的关键,也是在任何行业和领域都不能回避的问题,否则用户无法完全信赖,就仍然要投入人工进行核验,对于减少成本初衷就难以实现。


整合指标和BI等门户,既然用户侧使用体验提升,又能对数据查询分析的准确率进一步提升。


大语言模型带来的交互方式的革命性改变,让包括数据分析在内的所有产品的交互都朝着更加简单易用的方向演进,对于企业而言,能让更多的业务用户、更快的、更活跃的用起来,是产品企业内落地的重要表现。


模型在准确率和易用性上的提升,不能被现有数据底座的低时效更新所拖累。实时、按需、交互式的分析将才能更好的匹配大模型的先进应用,同时全员在线使用,以及在并发使用下的极速响应也是性能的体现。


当然,通过AI释放数据价值不止这几方面,还有很多难点值得我们关注。更多的关于大模型应用的消息、产品和案例,可以关注未来几期推送的内容。