全部
资料库
会员库
搜 索
AI 会淘汰刘思毅吗,没有的事儿。
群响刘思毅
2025-01-04

这是刘思毅宝宝总的 AI 专业访谈,这次访谈的嘉宾是是国内 AI 创业者顶尖前沿的创业者武彬第二期,他的公司是用人工智能来做电商营销素材的,就是帮助所有的品牌跟电商卖家来做内容,公司现在市值几十个亿了。


武彬非常牛逼,清华本硕,计算机本科, NLP 人工智能实验室的硕士,今天这篇文章核心探讨一个问题,刘思毅到底要投入多少钱才能完成刘思毅孪生 AI ,以及能否由此开启新的搞钱项目。


一、 AI 对于我们这种创始人、创作者来说,到底能帮助我们什么?


刘思毅:我 10 月份去了一趟硅谷,和那些 AI 的创始人聊了,但我觉得他没有解决我的一个核心问题,我并不知道作为一个 IP ,AI 能够帮助我带来什么。


我现在最显性的需求叫做刘思毅已经生产了 6 年的短视频文字,有几百万字的资料,我想要让我的用户可以看到一个数字孪生版的 641,


但是 OpenAI 哪怕读了我几百万字的文字资料,好像没有办法对我出任何的有效帮助。


他不能吃掉这个 PDF以后就成为刘思毅,我缺了什么?


武彬:我觉得可能还是数据样本不够,我之前看到一个视频说你让一个 AI 学你的东西,学完之后出来的文字都是骂人的。


刘思毅:是真的,我找了一个国内 10 家 AI 公司,他只能学口吻。但是他要模仿一个刘思毅的思想,他学不到。


武彬:你如果真让他学到,可能还需要更多的数据,比如某些事情是怎么想的。


刘思毅:什么叫做缺数据?我已经有这些几百万字的数据,但是它没有办法一次性的咀嚼完成。


武彬:可以的,那就可能是你们缺了一个专门来给他做训练的人。这个训练不是说一股脑给他一个 PDF 就叫做训练。


一般来说你要像我们这种专业人士,内部有一个东西叫做 Finetune,就是优化的意思,像 GPT,文心一言是拿海量的通用文本训练的。


他知道整个世界的这个语言什么样子的,但是你如果到垂直行业,比如我们做电商的,你就要告诉他这个垂直电商很多数据,比如说这是一个怡宝是什么的瓶子,你要给他很多垂直的这个数据。


你要训练你的样本,你要告诉他,比如你面对特朗普上台这个事情你的一些想法,你给他一个文字,你告诉他你这个文字里面是怎么一步一步的思考的。


如果只给他一个长的 PDF,是无效的。


刘思毅:请问我告诉他这个告诉本身是怎么执行的?


武彬:就好像 GPT 的对话逻辑一样,告诉他。一种是完全我们这种做程序员的,我们就会给他标好的数据,比如这是猫,这是狗,这是书,这是花,第二就是完全用对话的逻辑,一句一句拆解,对话。


二、刘思毅有几百万字的资料,我希望它变成一个刘思毅版的 GPT,如何实现?


刘思毅:用户可能问题是我这个情况是这样的,关于小红书,你觉得应该怎么操盘我,我就希望他能够结合我喂给他的东西,给用户一个较为刘思毅版的回答。


因此我需要做啥呢?


武彬:第一,你把几百万字的 PDF 先拆成一段一段的。


就比如我们前面说的这个对话,就是你为什么说这句话?它是什么样的问题,导致你说这句话,比如几百万字是我的 3, 000 篇文章,每篇文章都有标题和中心一群,我可能是一篇文章,一篇文章的告诉他你写这篇文章的目的是什么?


这个文章可能是别人问你如何来操盘小红书,比如这篇文章是当今这个时代你如何看待中美竞争,你把这个标题给他,这是你的回答,这是标题。


刘思毅:为什么是一篇一篇带着它吃,而不是 PDF 直接混杂的给它吃?这叫数据的人肉结构化吗?


武彬:按理来说大模型不太需要做结构化了,但是你给它结构化之后,能理解的更好。


比如说你把所有的从小学到高中的书全部背给他,中间要梳理这些逻辑很复杂。你告诉他这是语文,这是数学,这是物理,这是化学,这是物理里的电,


这是声,这是光,是运动,他就学得更好,你如果不帮他拆解,他只能像你说的模仿文风。


他就回避关键问题,他就不理解底层东西样。


刘思毅:因此我用中文对话式可以手把手带教 3, 000 篇文章,每篇文章主题让他吃进去之后,它就变成了一个吃进 3, 000 篇文章的一个 AI。这和 QA 机器人的区别是什么?


武彬:就是你给他的目的,这个目的叫做你来学习我的内容,以后你来模仿服务我的客户,所以我们的目的就是要让他深度学习,举一反三。


如果不用 train 的方式,你只能让他来模仿。有一个程序员告诉他如何来 train,这个就是我们做的事。


三、如果要有一个刘思毅的开源模型,要花多少钱?


武彬:我们之前部署服务器,不贵,大几十万,但是要标数据比较费钱。我们那个数据会更复杂,不只要学习文风,要理解什么是电商好的内容。


什么是上衣、裤子、鞋包、帽子、配饰,上衣的领型、纹理、花纹怎么样的?


应该如何包装?所以我们那个结构化的复杂程度要更多。


我们标数据又花了几百万,买服务器可能一两百万。


刘思毅:标数据贵在哪里?工程师生产力吗。


武彬:不是工程师。你要先来制定规则。


刘思毅:为什么规则贵?这个成本在哪里?


武彬:你准备一大堆的图片、一大堆的视频,让人来先告诉他这是猫,只是狗,这是上衣、裤子、鞋。


刘思毅:为什么要高校老师来做?


lock
登录后查看完整文章
点击登录
流量圈
06-12
推一个简历。 REAGAN ,山东烟台人,统招本科,1995年生,目前居住杭州滨江。 会抖音运营、销售、话术优化等。本人学习能力强,共情能力强、在业余学习声播(男中青音)可录音频。 想找AI应用相关公司的工作,可以从事课程顾问或者销售岗,如果有合适岗位能利用上之前的经验能力更好。 看中发展,薪资期望到手1w起
06-11
#资源对接 产品:本团队为国内TOP2的硕博团队,专注于中高端、硬科技类的青少年研学营。 目前暑期有科学研学项目,主题为:人工智能和生命科学。课程体系化,均为硕博主讲。在北京TOP2校内吃住学,体验名校氛围,拿研学证书和推荐信。 需求:中高客单价渠道、区域合作伙伴、高净值家庭渠道等;教育类、科普类IP,私域合作 本着长期主义和财散人聚的理念,项目稳、返点高,期待合作。
06-11
资源:快手新闻类主播,清仓主播 需求: 1、目标345线北方市场的低价服饰供应链,首要需求是夏季爆品,特价福利品 2、乡镇中老年保健品,仪器类产品,爆品逻辑,具体来聊。 3、品牌清仓折扣品,清仓临期 合作模式:抖音快手有店,高佣。或一件代发。 这事儿吧,供应链朋友,懂得就懂。
06-10
求小红书头部达人机构 需求: 达人类别:小红书头腰部达人(不用母婴账号!),行业内大拿,有一定名气这种,硬性条件达人需在孕期或者有3岁下的宝宝。国产奶粉合作。 单账号预算在3-8万,总费用50w。
06-10
资源:创始人IP,全网千万级粉丝体量 私域养生赛道 toC业务 供应链成熟 需求:想启动私域,需要有操盘ip私域经验 并有成功案例的操盘手 合作模式:合作不错的话,可深度合作分润
群响活动
群响 · 女性赛道变现大课(大女主、大美业、疗愈情感)
火热报名中
群响 · IP 变现实操大课(视频号丨小红书丨抖音)
火热报名中
群响 · 刘思毅IP操盘手直播课「回放」
火热报名中
直播专享· 存量时代的 IP 新策略
火热报名中
群响·视频号直播全案操盘课
火热报名中
群响·刘思毅私域5年大复盘
火热报名中
走向新个体时代·直播回放
火热报名中
年轻人的第一桶金·创业成长录播课
火热报名中
群响·视频号直播操盘课
火热报名中
群响 · IP私域班
火热报名中
群响·公转私偷流量课
火热报名中
2023 群响流量大课 · 挖掘利润点(广州)
火热报名中
2023 群响流量大课 · 挖掘利润点(杭州)
火热报名中
2023 群响流量大课 · 全域抢利润(杭州)
火热报名中
群响四周年·12h直播大会(回放)
火热报名中
新个体搞钱成长系列课
火热报名中