本帖用于记录我对不断发展的AI的理解和认知。
注意,我的理解和认知可能是错的;我不是想教你、说服你,而是想留给时间来判断。
同时欢迎讨论、拍砖!
-
为什么要记录?
因为AI发展太快,在我跟进AI的过程中,好记性不如烂笔头。 -
为什么放在这里,而不只是微博、即刻等?
大模型发展的早期阶段,博采众长、大家智慧很重要。为了避免信息茧房,我倾向放在公域上,这样搜索引擎可以爬取到。
本帖用于记录我对不断发展的AI的理解和认知。
注意,我的理解和认知可能是错的;我不是想教你、说服你,而是想留给时间来判断。
同时欢迎讨论、拍砖!
为什么要记录?
因为AI发展太快,在我跟进AI的过程中,好记性不如烂笔头。
为什么放在这里,而不只是微博、即刻等?
大模型发展的早期阶段,博采众长、大家智慧很重要。为了避免信息茧房,我倾向放在公域上,这样搜索引擎可以爬取到。
其实就是一本说明书、教程、文档。它的核心要求很简单,也很难:
看过《iOS应用逆向工程》的朋友,会发现完全符合1、2、3的要求。所以写过说明书、教程、文档的朋友写prompt,会非常得心应手
就是小程序/app的进化,我统称传统软件。
传统软件的特点是可以穷举。如伪代码:
if ...
else if...
else if...
而AI Agent比传统软件复杂,它无法穷举。如伪prompt:
你是一名心理学家。我给你一段话,你判断它是积极的还是消极的:……
AI Agent的进化路线是更复杂、更完整,直至人:
传统软件 → 好奇数眸(微信小程序里搜) → 小爱同学 → 铁大(小米仿生机器人) → 人
其中好奇数眸、小爱同学和铁大就是已经存在的AI Agent。
OpenAI定义了文生文的AI范式:以对话(chat)的形式工作,输入prompt,输出completion。
ChatGPT-3.5发布爆火后,所有其他的文生文大模型都遵循了这个范式。
OpenAI是闭源的,它相当于文生文大模型里的iPhone。
与之对应的,文生文大模型里的Android,就是ChatGLM、baichuan、Qwen、Llama等开源大模型
大多数工程师没有研发基础大模型的能力,这个是博士、研究员、科学家才能干的事。
类比起来,基础大模型是操作系统或内核,应用就是软件、网站、app、小程序等。
其实在互联网和移动互联网时代,做操作系统和内核开发也是少数人,大多数人还是在做应用。
到了AI时代,这条路径不会改变,一定还是少部分人做基础大模型,绝大部分人做应用
感谢分享
最常用的就是ChatGPT-4、Claude 3和智谱清言
2024年两会首提“人工智能+”,看上去很美好,但实际落地时可能很骨感。举个例子:
如果某传统行业没有经历过数字化阶段,那么它要么提供不了足够多的数据,要么提供不了高质量的数据,导致你无法训练/微调AI,只能prompt engineering,而无法使用更高阶的fine-tuning和RAG功能,导致大模型能力有限。
而传统公司因为不懂技术,加上营销号的夸张描述,容易高估AI的能力。有了这个预期落差后,工作就会难一个量级。
前几天看到一个访谈,有句话,值得了解:
不要高估短期内的AI水平,不要低估长期的AI的水平
理想确实丰满 但是3-5年 ai没有盈利 资本就舍弃这玩意了,就像以前的ar vr
chatgpt这种国民级应用都已经出来了,世界级别的事件
延伸上面的话题:
目标是成为阿里P7级别的AI应用专家,能够一杆到底,提供解决方案,。
2023年一整年,我接触过一些有“AI+”需求的传统公司。他们的特点是:
他们的需求是:把看上去高大上的AIGC落地到本行业中,实现降本增效。
如何“把看上去高大上的AIGC落地到本行业中”?其实就一句话:为业务从0到1打通AI工作流。
为了能“为业务从0到1打通AI工作流”,你必须能够成为阿里P7级别的AI应用专家,能够一杆到底,提供解决方案。
业务方是业务专家,对AI一知半解,他不一定分得清产品经理、提示词工程师(prompt engineer)、软件工程师等岗位的区别;他可能会说“就差一个程序员”,而且他没跟你开玩笑。他对你的期望就是“AI+业务”里,“+”的左边你全都可以撑起来。
而“一杆到底”要求你能身兼产品经理、提示词工程师、软件工程师等数职,“一肩挑”;先作为产品经理跟业务方沟通,把他的“一句话需求”扩充成PRD,然后作为提示词工程师实现业务方的需求,最后作为软件工程师将其标准化、工程化,最终提供解决方案。
为了能够一杆到底,在技术层面,你还要对主流文生文大模型、主流文生图大模型、音频、视频、gradio、flask……的日常使用、API调用、部署……都有所涉猎。这个要求……如果不难,人家找你干嘛?
在移动互联网的混沌时期,所有人都在摸索,远没有现在的互联网这么清晰。iPhone出现了,没人会开发app,怎么办?那么会C++的软件工程师,只好吭哧吭哧学Objective-C,成为了初代客户端工程师;不喜欢写代码但头脑比较灵活的图书编辑,天天体验各种app,就变成了初代产品经理;朋友的淘宝店铺里销量持续走高,忙不过来,拉你帮忙,你不小心就成了初代运营……“世上本没有路,走的人多了,也就成了路。”
AI大模型的混沌时期,所有人都在摸索。你很容易就可以入门,成为初代AI产品经理,初代提示词工程师,初代AI软件工程师,也可以成为初代AI产品经理 + 初代提示词工程师 + 初代AI软件工程师,成为一个初代AI应用专家。
混沌时期,想成为初代,门槛真的不高;很多人是把现在的移动互联网高标准给代入到了当下的AI大模型,自己把自己吓跑了。赶紧调整思路,提桶速来!
大佬有什么好的落地方向,现在大家都在做这个赛道,感觉AI作为赋能能做很多有趣的事
现在AI大模型最成熟的就是文生文和文生图,所以好的落地方向就是离文或图最近的方向