龙头三天两板!ChatGPT是如何获得理解力的?前景又如何?

时间:2022-12-17 14:56 来源:金融界   阅读量:12936   

广义来说,ChatGPT是文本模式的AIGC应用,负责生成自然语言,可以和用户进行问答对话。

能够理解输入信息和输出内容的含义,这种AI模型,在一定程度上,具有和人脑一样的能力——创造力。

最近的AIGC和ChatGPT就属于这种模型,也就是生成性AI广义来说,ChatGPT是文本模式的AIGC应用,负责生成自然语言,可以和用户进行问答对话

其中,ChatGPT被称为AI的里程碑式应用,是明星公司Open AI于2020年推出的自然语言生成模型GPT3的衍生产品之前也不是没有这样的应用AI客服,聊天机器人,语音工作助手,小说衍生品等都属于这一类

但ChatGPT的智能远超这些前辈。与之前的模型相比,ChatGPT的亮点主要包括:

增加了理解和生成代码的能力,对输入有很高的理解和容忍度,可以在大部分知识领域给出专业的解答。

加上道德原则即ChatGPT可以识别恶意信息,识别后拒绝给出有效答案

支持持续对话ChatGPT具有记忆能力,提高了模型的交互体验

上线5天后,ChatGPT的用户突破100万就连特斯拉创始人马斯克也说:很多人都陷入了该死的疯狂ChatGPT循环

那么,作为生成式AI的代表,ChatGPT是如何获得理解的呢。

这个过程离不开大模型,大数据,大计算能力在整体技术路线上,ChatGPT在强大的GPT 3.5大规模语言模型的基础上,引入了数据的人工标注+强化学习来不断训练语言模型主要目的是让GPT模型学会理解人类命令和指令的含义

简单来说,基于优秀的机器学习算法和强大的计算能力,AI可以通过海量数据训练学会思考自2020年从微软获得GPT 3的独家授权以来,Open AI一直在Azure AI超级计算基础设施上训练这种模型主要使用的公共爬虫数据集拥有超过一万亿字的人类语言数据集

国证券进一步认为,生成算法,NLP和计算能力决定了AIGC能不能跑,而高质量的数据集决定了AIGC的质量和商业模式。相关公司包括:

汉王科技的自由写作稿件识别技术是基于海量数据训练的从周一开始,该股三天内收获了两个涨停板

汉王科技k线图

a股公司中,海天盛瑞,四维图新等从事数据培训业务在a股公司的互动交流上,投资者纷纷询问AI训练数据提供商海天盛瑞,ChatGPT的应用方向是什么是人工智能+训练数据服务吗

但海天盛瑞的回复中并未提及ChatGPT,仅表示将持续关注大模型领域的新动向,并根据客户需求的变化及时推进公司的产品创新和技术创新,以满足更多客户的需求,更新该领域的AI训练数据。

▌的下一个目标:大规模商业化

对于这些AI工具的创造者来说,下一步就是考虑大规模商业化。

从GPT到GPT 3的进化花费了大量的金钱——参数数量从1.17亿增加到1750亿,训练前的数据量从5GB增加到45TB,其中GPT 3训练一次的花费是460万美元,总训练费用达到1200万美元高投入使得实现B端更具可行性

现在很多C端应用都是免费版本国泰君安表示,目前ai画的用户不愿意付费,60%的用户从未为AI画付费在C端支付低刺激的情况下,B端将成为未来AI画图软件的核心客户

没有愿意付费的消费者ChatGPT不局限于普通聊天,还可以解决具体问题,比如辅助写代码一些用户在社交媒体上表示愿意为ChatGPT付费10月1日AI绘画小程序梦贼商业化后,已经有不少用户付费了该产品负责人表示,目前次日留存率在40%左右,七日留存率接近30%

另外,版权问题是生成式AI绕不过去的一道坎大部分原创作品的版权人都会介意AI提取自己作品的一些元素

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。