欢迎进入漳州风云电气设备有限公司

漳州风云

11年工业自动化配件供应商

只要您有任何找不到的型号,都可以找我们

二维码

全国免费咨询热线:

+86 153 5902 9662

联系邮箱:

geabbamy@gmail.com

当前位置: 漳州风云 > 新闻资讯 > 行业新闻

​OpenAI通过网友“恶搞”建立生态,国内大模型却选择不同······

文章作者:作者 人气:发表时间:2023-11-14 11:16:55

OpenAI首届全球开发者大会上,Sam Altman再次给AI行业扔了一系列重磅炸弹。GPT-4 Turbo、GPT Store和定制化的GPT在大会上发布,OpenAI的生态体系初具雏形。

GPT模型刚升级了不到24小时,高能网友就开始用它的定制化功能创造了各种有趣的应用。

有人创建了能微调X帖子的专用模型,精确定位全平台用户发帖的高峰时间;有人用GPT做了一个AI解说员,不仅能看懂足球赛,还会解说英雄联盟......

一系列新功能直接吸引了大量用户涌入,从ChatGPT到API,全线崩溃了近两个小时。

​OpenAI通过网友“恶搞”建立生态,国内大模型却选择不同······

OpenAI已然看到了群众的智慧,干脆上线了GPT Store:既然你们喜欢改造GPT,那就把你们改造过的GPT上线商店吧,你赚了钱,我建了生态。

OpenAI的开发者大会再次撼动了人工智能大模型行业,尽管GPT因算力、算据的客观技术限制很难向第五代升级,但GPT-4足够让OpenAI构建自己的AI帝国。

开发者在狂欢,那些借GPT模型另起炉灶搞大模型的创业公司们,面对的是OpenAI的降维打击,他们又该何去何从?

当GPTs开始有了Store

GPT-5没有来,但这并不妨碍OpenAI持续升级GPT-4。

这家AI独角兽也学着各种互联网及硬件公司们,开启了自己的首届全球开发者大会,创始人Sam Altman在短短45分钟的发布会上,先后扔出了GPT-4 Turbo、GPT Store、GPTs、Assistants API等多个围绕GPT模型的升级产品。

GPT-4 Turbo更像是GPT-4向GPT-5过渡的模型,它将上下文长度扩充至128K的内容。什么概念呢?有了它,ChatGPT几秒钟就能读完一本300页的书。这意味着,用户可以利用GPT-4 Turbo处理更长的文本了。

文本只是一方面,GPT-4 Turbo还增加了自身的多模态能力,集成了视觉模型DALL-E3以及文本生语音的语音模型TTS(text-to-speech)。开发者通过API可直接调用,实现图生图、语音输入等形式。这为多模态应用程序的开发铺平了道路。

​OpenAI通过网友“恶搞”建立生态,国内大模型却选择不同······

当OpenAI告诉用户“你们可以创建一个理解语音并能够分析图像内容的机器人”时,更具象的应用在高能网友创造力中出现了。

网友 @geepytee 将足球比赛视频的每一帧画面传给了GPT-4 Turbo,通过提示要求生成旁白后,一个AI足球解说员诞生了,不仅能理解球赛,比赛的高光时刻出现时,它的语气还“激动”起来。很快,大家就不满足于让GPT当足球解说了,电竞解说、电影解说都来了。

除了GPT-4 Turbo外,OpenAI还给AI模型的开发者们来了个三件套:GPTs、GPT Store和Assistants API。

首先是GPTs,即定制版本的GPT,相当于OpenAI放开了基于GPT的中小模型创建,让用户自行开发,以处理特定场景下的特定任务。而且,开放过程也在AI能力的帮助下变得更简单了,用户直接可以用自然语言与GPT Builder对话,去训练一个自定义的GPT。

于是,一个在社交平台X上拥有34万粉丝网友Rowan Cheung ,为自己打造了一个“X Optimizer GPT”,它可以对X上的帖子进行微调,并定位流量高峰的发布时间。

OpenAI的大会开完还不到24小时,网友们就开始利用GPT的各种新升级行创造之举。这其实是GPT-4模型发布一年来的一个缩影。

当OpenAI通过GPT-4将人工智能的能力从高阁上拿下,放到普罗大众的眼前后,一大批围绕这个模型的创新就出现了,不仅是各种应用,还有各种在GPT模型基础上改造的、垂直于某个场景的模型。

索性,OpenAI给这些GPTs造了一个商业化的场地“GPT Store”:把你们基于GPT改造的专属模型上传到这里吧,一旦上架,就可以变现。

这个做法不免让人想起苹果的App Store,不同的是,即使一个不会编程的人,也可以通过GPT Builder来创建自己的GPT模型。利用Assistants API,开发基于GPT的应用程序的过程也将变得简单智能,开发者可以在自己的应用程序中构建类似ChatGPT的聊天机器人或者类似AI Agent的智能体,把复杂的问题交给它去做。

OpenAI的一系列举动几乎昭示了它的用意:构建一个围绕GPT的人工智能生态。这家公司也不再仅仅是一家人工智能大模型的研发公司,而转变为集模型(GPT)、产品(ChatGPT)和工具(各种API、组件)为一体的AI全链,试图一统GPT的江山。

如今在中国的土壤里,大模型的落地进展究竟如何?

国内:金融、能源先行落地

“请帮我查一下我今年8月份的用电量,以及哪天用电最多?”“帮我检测一下这张图片有什么缺陷”……在南方人工智能创新平台上,通过语言交互,一项项数据清晰的被展现在眼前。

在这个平台上,电力行业工作人员可以向电力大模型发布指令,让其自动生成数据处理结果,准确识别缺陷场景的图像细节,帮助工作人员检索处理电力巡检过程中的数据。

目前,在南方电网客户服务领域,60%的高频问题都可通过电力大模型解决,在识别客户情绪波动方面,电力大模型的效果甚至优于人工。

此外,在输配电领域,电力大模型已具备每分钟处理100张问题图片的能力,还能同时识别20类缺陷,识别效率是传统AI算法的10倍。

而在电力调度领域,电力大模型能够协助调度部门针对电网异常情况快速自动化生成处置预案,及时响应电力市场调节要求,使预案更加安全、高效,成本更低。

这是大模型在能源领域落地的一个缩影。

据了解,部分能源头部厂商已经开启了与科技公司在大模型应用方面的合作,尤其在电网与矿山领域,形成了一些初步试点示范,如电网调度、缺陷/故障查询、煤矿作业监测等场景。

​OpenAI通过网友“恶搞”建立生态,国内大模型却选择不同······

除了能源领域,金融领域也是目前大模型最大落地场景之一。

一份来自爱分析的报告中,也将能源、银行列为了大模型落地进展最快的两大行业。

在金融领域的落地之广,从大模型的数量和企业动态也可见一斑。一组数据显示,截止8月,国内参数在10亿规模以上的大模型数量高达116个,其中金融行业大模型约18个。

此外,在半年报中,工商银行、农业银行、中国银行、交通银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行等9家银行明确提出在探索大模型的应用。

在大模型厂商侧,一些密集的行业模型发布也反映出金融场景落地的火热程度。

例如5月下旬,度小满发布了千亿级中文大模型「轩辕」;6月份,腾讯云携手神州信息开展金融大模型的合作,中国农业银行推出类ChatGPT的大模型应用ChatABC,中国工商银行发布了基于昇腾AI的金融行业通用模型。

7-8月,随着《生成式人工智能服务管理暂行办法》正式实施,包括腾讯、百度、科大讯飞、华为、字节跳动等多家公司,又相继释放了最新的大模型进展;9月,蚂蚁集团也正式发布了金融大模型,并开源生成式AI编程平台CodeFuse。

金融领域,无疑是大模型落地的最多场景之一。

无论是能源领域还是金融领域,之所以能够实现大模型的领先落地,都源于这两个行业的一些共性。

首先,能源和银行业都是高度数据化的行业,具有较好的数据基础和数字化环境,这为大模型的训练和应用提供了有利条件。

其次,两大行业均有大量的数据处理和决策需求,而大模型的机器学习和深度学习技术可以帮助行业解决这些难题,提高决策效率和准确度。

再有,能源和银行业的业务模式相对比较成熟,具有较高的商业价值,因此这些行业对大模型技术的需求也比较大,从而推动了大模型的落地应用。

可见,能源和银行两大行业在大模型落地进展中相对较快,主要是由于其数据基础好、技术需求大、商业价值高等多方面因素的综合作用。

值得注意的是,即使在金融、能源这两个落地场景中,大模型仍有一些目前难以跨越的难题。

行业大模型是商用的重要方式,但不要忘了前提条件

诚然,行业大模型的出现似乎为各个垂直领域带来了巨大的机会。它们可以更好地满足特定行业的需求,提供更加定制化的服务,帮助企业提升业务效率,提供更高品质的客户体验。

然而,一切的基石依然是一个强大的通用大模型。只有当通用模型具备强大的能力时,行业大模型的微调才能真正发挥价值。

值得深思的是,中国在AI领域已取得了许多值得骄傲的成果,但与国际顶尖的通用大模型,如GPT-4相比,国内仍存在一定的差距。这对于中国的技术界来说是一个挑战,也是一个机会。挑战在于如何在短时间内弥补这一差距,机会则在于一旦做到,国内的行业大模型将能够站在一个更高的起点。

而现在的现象是,部分企业在通用模型的基础还不够稳固的前提下,急于推出一系列的行业大模型。这种策略显然有其商业逻辑——尽早进入市场,尝试尽快实现商业变现。但这种策略忽视了一个核心问题,那就是技术的根本价值。

企业应用AI技术的根本目的是为了解决实际业务问题,提高运营效率和客户满意度。而如果一个行业大模型在语言理解、逻辑推理、数理计算或内容生成等核心能力上都表现不佳,那么它所带来的实际商业价值就会大打折扣。客户不会因为一个产品声称自己是某个行业的大模型就选择购买,他们更关心的是这个模型能为他们的业务带来什么实际效益。

因此,对于企业和技术研发者来说,关键不在于急于推出各种行业大模型,而是要认识到,强大的通用大模型是所有行业应用的基石。只有在这个基石稳固的基础上,行业大模型才能真正发挥出其应有的价值。

换言之,现在的首要任务是加强通用大模型的研发,尽快追赶国际水平,然后再以此为基础,推出真正有价值的行业大模型。这样的战略布局,既能保障技术的长远发展,也更能真正满足市场和客户的需求。

真正的创新,应该始终以实际需求为导向,而不是盲目追求短期的商业利益。