Sora效果炸裂,大模型应用还有哪些?
2024年2月,OpenAI 发布文生视频大模型 Sora 已经过去快两周,但全网讨论依旧热烈。如果说2023年是大语言模型的元年,那么2024年可能就是大模型应用落地的前夜。
随着硬件技术的进步和大数据时代的到来,生成式人工智能得到了迅猛发展。从最早的符号主义智能,到基于规则的专家系统,再到现在的机器学习、深度学习、强化学习等技术,生成式人工智能已经取得了显著的成果,产生了自主学习与原始创造能力。
基于这样的发展进程,当下的科技公司,一方面在AGI领域探索更高级的认知能力和技术集成,另一方面则将更多的资源放在当下即将爆发的大模型应用上。在AI热点频发的背景下,本篇文章尝试从行业和场景等不同维度,盘点当下大语言模型应用的主要方向和最新进展。
大模型垂直应用行业
根据全球知名咨询公司埃森哲的调研,自然语言任务占到了企业人员工作总时长的62%,其中65%的时间可以借助人员强化和自动化技术来提升工作生产力。
将这两个数字相乘,就能得到一个简单而又直接的结论——40%的工作时间都能通过大语言模型的落地应用实现业务的降本增效。这个数字看起来或许有些夸张,我们不妨从法律、金融、消费零售和医疗等特定的产业管中窥豹,发现一些潜在的趋势。
法律
在法律领域,大模型的应用可以提高效率、辅助决策和改善法律服务。
①法律文书起草: 大模型可以帮助律师和法务专业人员撰写合同、法律文件。通过理解法律术语和结构,模型可以生成符合法律要求的文本,提高文书的起草效率。
②法律文献综述: 大模型能够处理大量法律文献,帮助律师快速检索相关法规和案例,加速法律研究的进程。
③智能法律助手: 大模型可以被集成到法律助手应用中,回答用户的法律问题、解释法规、提供基本法律建议和援助,有助于提高普通百姓对法律知识的可获得性。
④合规性检查: 大模型可以用于检查文本内容是否符合特定法规和法律标准。这在企业合规性审查和法律文件审核方面有实际应用。
金融
在金融领域,大模型应用可以用于风险管理、客户服务和创新金融产品。
①信用风险评估: 大模型可以用于解析财务报告、贷款申请和信用报告,更准确地评估企业的信用风险,加速信用分析、贷款决策和审计过程。
②投资决策辅助: 除了能够分析传统的公司报告和经济数据,大模型还能够分析新闻、社交媒体和市场评论,了解投资者情绪和市场趋势,为机构投资者提供投资决策。
③财务咨询和规划: 大模型可以根据个人的财务信息和目标,提供个性化的财务规划建议,帮助个人客户制定理财计划。
④智能客服: 大模型可以用于构建智能客服系统,处理客户的企业查询、交易记录解释、账户管理等问题,提供更高效的客户服务。
消费零售
在消费零售领域,大模型的应用涉及到提升购物体验、改进营销策略、加强客户互动等多个方面。
①商品文案生成: 大模型可以帮助用户自动生成商品描述、促销文案,提高产品页面的吸引力,促进销售。
②社交媒体营销: 大模型可以分析社交媒体上的用户评论、趋势和品牌提及,了解用户的真实意图和情绪,同时可以根据线上内容的变化趋势监测热点事件,动态调整营销策略。
③品牌和运营改进: 通过监测社交媒体和在线评论,大模型可以帮助零售商及时发现问题并改善,小到改进网站、App和实体店的购物体验,大到处理负面舆情,保护品牌声誉。
④智能客服: 大模型可以用于构建智能客服系统,处理消费者的在线咨询、问题解答和订单跟踪,提供更及时和个性化的客户服务。
医疗
在医疗领域,大模型的应用涵盖了多个方面,可以提供智能化的解决方案,改善临床实践、科学研究和医疗管理。
①疾病诊断和预测: 大模型可以分析患者的临床数据、病历和影像学资料,辅助医生进行疾病的诊断和预测,提高医学决策的准确性。
②医学文献挖掘: 大模型能够阅读和理解大量的医学文献,帮助研究人员挖掘科学研究的关键信息、趋势和新发现,加速知识的积累和传播。
③医学文档处理: 大模型可以用于自动化处理医学文档,包括病历、医学报告等,提高数据的提取、归纳和组织效率,从而减轻医护人员的工作负担。
④医学科普和患者教育: 利用大模型的自然语言生成能力,可以创建患者友好型的教育和交流平台,能够理解医生和患者的自然语言输入,提供实时的医学信息和建议。
大模型通用应用场景
除了从不同行业观察大模型应用的落地方式,还可以从跨行业的通用场景角度来考虑大模型应用。
智慧办公
在企业的日常办公方面,大模型可以①用于自动化文书处理,包括合同、报告、邮件的生成、编辑和比对,提高文件处理效率;②还可用于会议纪要的实时生成、录音视频资料等非文本格式的内容翻译及摘要生成;③帮助企业内部利用大模型构建智能知识库,帮助员工更快速地检索和获取公司内部的信息。
线上营销
通过分析数据,大模型可以根据客户行为和已知偏好生成个性化营销内容并进行调度。在不同营销渠道和社交媒体中(如公众号、图文博客、电子邮件),无论是进行主题优化、内容分段、A/B测试,还是正文内容,大模型都可以有针对性地生成信息,进而产生最佳的文案结构和创意元素,使内容生产过程更加简单。
智能助理
智能助理几乎可以在各个行业部署应用,扮演数字代理角色,进而在法律、医学的科普和援助、金融产品规划、电商零售营销等方面,深度改变企业与客户的互动方式。具体以查询服务和个性化服务为主要应用。
①查询服务:企业通常会遇到大量的线上服务查询, 可以将大模型集成到其客户服务系统中,以提供实时帮助,从而减少等待时间并改善客户体验,并为人工坐席留出更多时间来回答更有难度的咨询。
②个性化服务:大模型可以根据用户行为习惯、留言评论、对话内容等维度分析用户偏好,帮助企业为用户提供个性化的产品和服务引导。
产品研发
在产品研发领域,尤其是代码生成方面,大模型可以为软件工程师和开发团队提供有力的支持。
①自动代码生成: 大模型可以用于自动生成代码片段、函数、甚至整个模块。开发人员可以通过简要的描述或需求,由大模型生成符合规范和需求的代码,加速开发过程。
②代码文档生成: 大模型可以生成代码文档,包括函数注释、类说明和整体代码结构的文档。这有助于提高代码的可读性和维护性。
③代码检测和修复: 大模型可以分析代码,帮助识别潜在的错误和漏洞,并提供修复建议,支持开发人员尽早进行错误检测和修复。
数据分析
大模型的能力天然的与数据分析的发展趋势相契合,这意味着数据分析是大型模型落地应用至关重要的场景之一。
传统BI和静态报表基本上都是面向IT部门的,业务部门提出需求之后,由IT根据报表工具开发出固定的报表;敏捷BI强调的是自助式分析,服务对象变成了数据部门,也就是数据分析师;而大模型阶段的数据分析,将直接面向业务人员推进落地。大模型在数据分析的落地和应用,将降低用户的交互门槛,让业务部门更容易、更主动、更活跃地使用分析工具。
大模型在企业内部的用户落地过程中,可以分为如下几类:
①对话式数据分析:即通过自然语言取代原来拖拉拽的交互方式,并自动完成整个数据分析和相关指标、报表的生成,这也是大模型数据分析应用最核心的场景。
②SQL自动生成:这项应用在数据分析中非常重要,其中之一是编写SQL查询语句以查看底层宽表的数据,让业务用户取数更方便快捷。
③归因分析:大模型对指标的变化进行自动分析,给出变化或者异常出现的原因。例如,企业利润率发生了异动,那么大模型可以从营收、成本、时间维度等帮助用户抽丝剥茧,找出成因。
④辅助决策:基于返回的数据结果进行分析和预警。假如【增长率】这个指标有异常变化,它会进行提示和执行一些简单的数据分析,基于增长率的变化进行分析。
大模型个人应用场景
大模型针对个人的应用场景,其实比企业应用来的更加迅猛和激烈。2024年初,GPT Store上线以来,已有上百万个自定义助手。乍一看,还真有一种在逛 App Store 的感觉。
针对个人的应用场景有不少,我们重点讨论以下五个主要的应用场景。
视频创作
今年2月16日,OpenAI发布文生视频大模型Sora。这意味着,人类基于大模型进行的创作已经不拘泥于文字和图片,而是逐步升级为动态视频。
功能上,Sora能生成长达 60 秒的视频内容,远超其他文生视频工具几秒至十几秒的限制;它还能进行自我编辑和扩展,将两个不相关的内容过渡在一起,能转换主角周围的风格和环境等。前景上,Sora不仅是视频生成工具,更被视为世界模拟器。
以目前 Sora 生成视频的长度来看,会最先冲击到短视频领域。一旦大范围推广,Sora 将大大降低短视频创作门槛,丰富短视频平台的内容供给,创作者和抖音快手们可能都已开始瑟瑟发抖了。
搜索
早在2014年,百度和谷歌这些传统搜索引擎巨头就开始将深度学习、知识图谱等AI技术融入搜索当中。ChatGPT爆火之后,微软率先将其能力融入到Bing搜索中,有与谷歌一争高下之势。大模型+搜索,几乎是第一个被资本和大厂关注到的应用领域。
尽管许多刚开始接触大模型的用户,对AI反馈的见解和“事实”并非完全满意,仅会尝试将AIGC作为替代搜索的工具,但是在可见的未来,大模型将不仅仅增强信息检索,更可能是重塑搜索。
情感陪伴
就在最近这几个月,AI女友AI男友如雨后春笋席卷了国内外应用市场。据Quartz的一份报告,在GPT商店中搜索“女朋友”字眼,至少有八个AI女友会跳出来。在GPT商店的聊天机器人趋势榜单上,前五名分别为电影助手、ChatGPT、男朋友Chris、女朋友Scarlett和聊天GPT4-女朋友版。
情感陪伴是基于角色扮演的大模型,构建出了一个个有知识、有个性、有风格的数字人。在Z世代以兴趣为原点聚合的各类圈层的背景下,AI女友男友们专治当代年轻人的“孤独病”。
翻译
大模型最简单的实际应用之一就是翻译书面文本。大模型可以根据不同的语境和文本内容进行自适应,从而可以更好地处理复杂的语言表达。与市面上的已有商业翻译产品相比,GPT-4 等 LLM 的表现具有更强的竞争力,突如其来的大模型应用在翻译市场上不费吹灰之力就让传统翻译软件破大防。
同时,大模型不仅可以应用于传统的文本翻译,还可以应用于语音翻译、实时翻译等更多的应用场景。
不过,大模型在翻译一些小众、“冷门”语言时可能并不那么准确。这也跟大模型的技术特点有关,因为它需要大量的训练数据来进行模型训练。
创意文案
大模型的另一个非常擅长的就是是文本内容的创造。各种大模型都具备可以按照用户想法,生成文案、故事、摘要、脚本、问卷、调查等一系列书面内容的能力,甚至包括中国本土的小红书、微博文案内容。相比医学、法律、编程,越是天(hú)马(biān)行(luàn)空(zào)的创意领域,大模型的创意灵感表现得就越为突出。
硬件与大模型应用
AI应用不仅在软件层面呈现出百花齐放的景象,在硬件层面,也成了传统硬件厂家的新赛道。
比如前不久,2024年的电子“春晚”CES刚刚落幕,展会吸引了超过13万观众的参与,恢复了疫情前的繁华。那些吸引最多人流的展台往往都贴有明显的标签——AI。电脑厂商从联想到ROG,家电厂商从三星到海信,汽车厂商从奔驰到大众,几乎每家大企业的展台中都有一个AI专区。
目前硬件层面的应用和结合主要在AIPC、手机端AI、AI上车、家电AI化和机器人这几个领域。但从实际体验来看,AI化的程度存在着不小的差异,相对于大语言模型在全球的流行度而言,几乎所有的硬件产品都浅尝辄止,很难说大模型和产品已经有了比较成功的融合。
应用落地倒逼企业重塑数字底座
造成企业大模型应用落地困难的原因有两个关键词:涉及面太广、数字底座不健全。
①波及面甚广:相比过往数次技术革命,大模型影响力和范围更大,渗透到企业运转、经营的多个环节,并与人类工作流程相互交织;
②数字底座不健全:大模型在运行逻辑上不同于互联网时代,且需要企业有相当坚实的数字底座。如果企业自身数字化基础不足,前期准备和调整环节将非常有挑战。
大模型应用落地从具体步骤来看其实不复杂,但实际每个步骤操作中,都会依赖很多项目实战经验。
在互联网和移动互联网时代,虽然每家厂商的整体技术架构有所不同,但是其技术原理和能力大多是相同的。而现如今的大模型能力,都是通过神经网络实现知识的输入和输出,但是不同厂商大模型的最终结果有所差别,因此如何选定合适企业场景的大模型并以此为基础构建可持续的AIGC能力,成为了一个关键因素。
另一个因素潜藏在整合企业的数据资产这个环节,其背后是数据管理和数据安全问题,AI大模型在完成自然语言预训练的基础上,需要进一步结合应用场景的特定数据,才能够实现能力的差异化。在企业应用视角中,需要大量的企业真实数据,其中往往会存在涉及商业机密的内容。
当下,很多企业禁止员工使用公开的大模型,也是担心他们在处理公司任务的过程中,将企业的数据泄露出去。如何在大模型的推广过程中,确保企业自身的数据安全,是一个必须要解决的难题。因此现阶段很多企业都选择本地部署或私有云的形式,公有云上搭建大模型仍有很长一段路要走。