数据分析平台的发展已有20多年,其间的产品起落、技术迭代、应用模式等都在不断变化,就在2024年,一些企业用户已经开始用上了对话式数据分析平台。


什么是对话式数据分析平台?


对话式数据分析平台是一种利用人工智能技术,特别是大语言模型技术,来简化数据分析过程的工具。用户可以通过日常语言与系统进行交互,提出数据分析需求,系统则自动执行相应的数据分析任务,并以易于理解的方式呈现结果。


对话式数据分析平台与以往传统数据分析平台有什么不同?


这要从前几代数据平台的产生和发展说起。数据平台发展至今,可以分为三个阶段:固定报表、敏捷自助分析、对话式数据分析。


固定报表阶段实现了基础的数据分析和报表的静态可视化,典型产品有Cognos/OBIEE/BO,主要面向IT团队用户,门槛较高,灵活性差;敏捷自助分析实现了数据分析敏捷和自助化,部分场景BI可复用,初步形成企业级指标概念,典型产品有Tableau,主要面向分析师,门槛相对降低,灵活性一般;对话式数据分析阶段实现了数据分析智能化,BI、指标与AI融合,统一企业指标,典型产品有Kepler,面向业务用户,门槛极低,灵活性高。



什么是对话式数据分析平台?


对话式数据分析平台是一种利用人工智能技术,特别是大语言模型技术,来简化数据分析过程的工具。用户可以通过日常语言与系统进行交互,提出数据分析需求,系统则自动执行相应的数据分析任务,并以易于理解的方式呈现结果。


对话式数据分析平台与以往传统数据分析平台有什么不同?


这要从前几代数据平台的产生和发展说起。数据平台发展至今,可以分为三个阶段:固定报表、敏捷自助分析、对话式数据分析。


固定报表阶段实现了基础的数据分析和报表的静态可视化,典型产品有Cognos/OBIEE/BO,主要面向IT团队用户,门槛较高,灵活性差;敏捷自助分析实现了数据分析敏捷和自助化,部分场景BI可复用,初步形成企业级指标概念,典型产品有Tableau,主要面向分析师,门槛相对降低,灵活性一般;对话式数据分析阶段实现了数据分析智能化,BI、指标与AI融合,统一企业指标,典型产品有Kepler,面向业务用户,门槛极低,灵活性高。



对话式数据分析的价值是什么?


对于用户而言,对话式数据分析的价值是显而易见的:

易用:使用自然语言进行查询,无需复杂的编程知识,学习成本极低。

高效:取数便捷,快速获取数据分析结果,加速决策过程。

洞察:深入分析数据,揭示潜在的业务洞察和趋势。

交互:多轮人机对话能力,引导用户深入探索问题。


对话式数据分析发展的什么阶段了?


从数据分析的能力水平看,对话是数据分析开始更高层次的演进。从下面的数据分析能力层次来看,固定报表和敏捷自助分析阶段分别达到了描述性分析和诊断性分析,对话式数据分析则已经基本满足预测性分析,并在AI加持下逐渐形成预案性分析能力。

层次

类型

说明

I

描述性分析(Descriptive Analytics)

描述了已经发生的事件的一些问题

II

诊断性分析(Diagnostic Analytics)

寻找产生现象的原因和影响因素

III

预测性分析(Predictive Analytics)

根据过去的事件建立模型,用于对未来的预测

IV

预案性分析(Prescriptive Analytics)

在对未来的基础上选择应该采取的行动以及为什么采取它

分析能力演进


如何构建对话式数据分析平台?


从技术能力的角度,对话式数据分析有着完全不一样的构建理念。


智能化


智能化是对话式数据分析平台的首要特征,平台应在应用架构的基础层面基于大模型进行重构,提供基于CUI的交互界面,并围绕自动洞察这一主线为最终用户提供智能增强的各类分析功能。


一站式


一站式是对话式数据分析平台的基础特征,平台需要覆盖数据获取、数据预处理、数据治理、指标/标签加工、分析建模、分析管理等全谱系的支撑能力,同时基于可视化、智能化等手段提升相关能力的自助式与易用性。


服务化


服务化是对话式数据分析平台的必要特征,一个方面,数据(指标/标签、湖仓交付层数据)与应用功能之间将以API为主要交互方式;而另一方面,平台的应用功能之间及平台与周边系统之间也将以服务调用为主要交互方式。


强实时


强实时是对话式数据分析平台的延伸特征,由于大模型+智能体的加持,预案性分析(Prescriptive Analysis)将获得更大的发展空间,从而促进了从自动洞察向自动决策的演化,而决策的实时性、分析的实时性、数据的实时性这一正向闭环将会得到极大的强化。


因此我们可以看出,对话式数据分析不仅仅是一个新概念,同时也是由前沿技术构成的新型数据分析平台设计模式。因此,对话式数据分析平台是存在着技术壁垒的,需要企业真正理解和实践才能在AI浪潮之下站稳脚跟。


用户案例


偶数科技基于自研大模型,不仅率先开发出对话式数据分析平台Kepler,同时很早就开始了行业实践和应用。下面这个是偶数服务某大型跨国集团公司的投资部门的案例。


该投资部门为集团公司的核心战略部门之一并主导集团投资相关业务,专注于全球范围内消费互联网和产业互联网相关投资,业务类型涉及股权投资、可转债融资、借款、并购、重组、上市公司业务、FOF基金等,投资项目众多且投资金额巨大。


此客户建有数个IT系统以支持投资业务的信息化,其中主要包括面向投资决策流程的业务管理系统与面向投资财务核算的财务管理系统。而由于历史发展原因以及投资业务本身及其管理的专业性与复杂性,相关系统及相应的业务流程分散在不同的业务部门,由此也造成了可能的数据断裂与数据冲突。另一方面,随着投资业务规模的快速发展,投资业务管理部门面临高管决策、信息披露、法律合规、外部监管等诸多方面的分析统计要求,统计数据及业务指标的不一致、不及时、不准确、不完整等现象时有发生,对业务人员日常工作带来巨大负荷及压力。


业务管理层决定启动以业务指标管理为核心的对话式数据分析平台建设项目,解决困扰已久的业务指标统计问题和业务用户使用门槛问题,同时为进一步接入非结构化数据(行业和客户研究等外部数据)与实时数据(二级市场数据)做好准备。


由此,相应项目目标主要包括:

● 拉通并集成投资业务相关所有业务系统数据,形成统一的并着眼于未来发展的数据底座,实现数据同源、数据共享;

● 整合现有业务指标并形成统一的指标体系,实现公共指标数据的定义一致、口径一致、输出一致;

● 对指标加工过程进行多方面的治理管控,包括核心业务数据(如公司、项目、交易等)的主数据管理、基础数据的数据质量管理、指标数据的血缘管理等,保障指标计算的过程可控、结果可溯、原因可查;

● 基于偶数自研大模型,结合客户本地数据资产进行大模型调优,通过客户企业元数据和指标库,更深入地理解数据的结构和业务背景,从而为客户提供超高的AI对话准确率。

● 指标数据对外提供各种分析服务,除了仪表盘、报表、自助分析、交换共享等之外,指标库也需即时响应业务管理系统的调用而提供特定指标集的实时计算结果。


通过该项目的实施和成功上线,客户不但成功解决了历史原因造成的指标数据不一致、不准确、不及时、不全面等问题,缓解了业务人员的日常指标统计分析压力,还通过大模型降低了业务用户的学习成本和取数成本。


按照传统BI培训2周10工作日,使用偶数Kepler的学习时间不足20分钟,培训时间减少了200倍。在取数效率方面,传统数据开发至少3个自然日,Kepler自助取数3分钟,效率提升上千倍。Kepler让用户通过自然语言完成取数分析,实现“全员取数用数”的企业数据文化。


偶数科技在对话式数据分析领域的实践,已经让企业的更多用户更活跃的进行数据分析,这对很多企业而言都颇具借鉴意义。相信今年将是对话式数据分析的元年,会有更多企业利用对话式数据分析为自身赋能,降本增效,抓住AI和数字化转型的红利。



对话式数据分析的价值是什么?


对于用户而言,对话式数据分析的价值是显而易见的:

易用:使用自然语言进行查询,无需复杂的编程知识,学习成本极低。

高效:取数便捷,快速获取数据分析结果,加速决策过程。

洞察:深入分析数据,揭示潜在的业务洞察和趋势。

交互:多轮人机对话能力,引导用户深入探索问题。


对话式数据分析发展的什么阶段了?


从数据分析的能力水平看,对话是数据分析开始更高层次的演进。从下面的数据分析能力层次来看,固定报表和敏捷自助分析阶段分别达到了描述性分析和诊断性分析,对话式数据分析则已经基本满足预测性分析,并在AI加持下逐渐形成预案性分析能力。

层次

类型

说明

I

描述性分析(Descriptive Analytics)

描述了已经发生的事件的一些问题

II

诊断性分析(Diagnostic Analytics)

寻找产生现象的原因和影响因素

III

预测性分析(Predictive Analytics)

根据过去的事件建立模型,用于对未来的预测

IV

预案性分析(Prescriptive Analytics)

在对未来的基础上选择应该采取的行动以及为什么采取它

分析能力演进


如何构建对话式数据分析平台?


从技术能力的角度,对话式数据分析有着完全不一样的构建理念。


智能化


智能化是对话式数据分析平台的首要特征,平台应在应用架构的基础层面基于大模型进行重构,提供基于CUI的交互界面,并围绕自动洞察这一主线为最终用户提供智能增强的各类分析功能。


一站式


一站式是对话式数据分析平台的基础特征,平台需要覆盖数据获取、数据预处理、数据治理、指标/标签加工、分析建模、分析管理等全谱系的支撑能力,同时基于可视化、智能化等手段提升相关能力的自助式与易用性。


服务化


服务化是对话式数据分析平台的必要特征,一个方面,数据(指标/标签、湖仓交付层数据)与应用功能之间将以API为主要交互方式;而另一方面,平台的应用功能之间及平台与周边系统之间也将以服务调用为主要交互方式。


强实时


强实时是对话式数据分析平台的延伸特征,由于大模型+智能体的加持,预案性分析(Prescriptive Analysis)将获得更大的发展空间,从而促进了从自动洞察向自动决策的演化,而决策的实时性、分析的实时性、数据的实时性这一正向闭环将会得到极大的强化。


因此我们可以看出,对话式数据分析不仅仅是一个新概念,同时也是由前沿技术构成的新型数据分析平台设计模式。因此,对话式数据分析平台是存在着技术壁垒的,需要企业真正理解和实践才能在AI浪潮之下站稳脚跟。


用户案例


偶数科技基于自研大模型,不仅率先开发出对话式数据分析平台Kepler,同时很早就开始了行业实践和应用。下面这个是偶数服务某大型跨国集团公司的投资部门的案例。


该投资部门为集团公司的核心战略部门之一并主导集团投资相关业务,专注于全球范围内消费互联网和产业互联网相关投资,业务类型涉及股权投资、可转债融资、借款、并购、重组、上市公司业务、FOF基金等,投资项目众多且投资金额巨大。


此客户建有数个IT系统以支持投资业务的信息化,其中主要包括面向投资决策流程的业务管理系统与面向投资财务核算的财务管理系统。而由于历史发展原因以及投资业务本身及其管理的专业性与复杂性,相关系统及相应的业务流程分散在不同的业务部门,由此也造成了可能的数据断裂与数据冲突。另一方面,随着投资业务规模的快速发展,投资业务管理部门面临高管决策、信息披露、法律合规、外部监管等诸多方面的分析统计要求,统计数据及业务指标的不一致、不及时、不准确、不完整等现象时有发生,对业务人员日常工作带来巨大负荷及压力。


业务管理层决定启动以业务指标管理为核心的对话式数据分析平台建设项目,解决困扰已久的业务指标统计问题和业务用户使用门槛问题,同时为进一步接入非结构化数据(行业和客户研究等外部数据)与实时数据(二级市场数据)做好准备。


由此,相应项目目标主要包括:

● 拉通并集成投资业务相关所有业务系统数据,形成统一的并着眼于未来发展的数据底座,实现数据同源、数据共享;

● 整合现有业务指标并形成统一的指标体系,实现公共指标数据的定义一致、口径一致、输出一致;

● 对指标加工过程进行多方面的治理管控,包括核心业务数据(如公司、项目、交易等)的主数据管理、基础数据的数据质量管理、指标数据的血缘管理等,保障指标计算的过程可控、结果可溯、原因可查;

● 基于偶数自研大模型,结合客户本地数据资产进行大模型调优,通过客户企业元数据和指标库,更深入地理解数据的结构和业务背景,从而为客户提供超高的AI对话准确率。

● 指标数据对外提供各种分析服务,除了仪表盘、报表、自助分析、交换共享等之外,指标库也需即时响应业务管理系统的调用而提供特定指标集的实时计算结果。


通过该项目的实施和成功上线,客户不但成功解决了历史原因造成的指标数据不一致、不准确、不及时、不全面等问题,缓解了业务人员的日常指标统计分析压力,还通过大模型降低了业务用户的学习成本和取数成本。


按照传统BI培训2周10工作日,使用偶数Kepler的学习时间不足20分钟,培训时间减少了200倍。在取数效率方面,传统数据开发至少3个自然日,Kepler自助取数3分钟,效率提升上千倍。Kepler让用户通过自然语言完成取数分析,实现“全员取数用数”的企业数据文化。


偶数科技在对话式数据分析领域的实践,已经让企业的更多用户更活跃的进行数据分析,这对很多企业而言都颇具借鉴意义。相信今年将是对话式数据分析的元年,会有更多企业利用对话式数据分析为自身赋能,降本增效,抓住AI和数字化转型的红利。