序:从学习谈起

想一下我们是如何学习的:
1、感官感知,便于快速理解,例如声光、重力、嗅觉、温度感知、材质感知、力的感知等
2、形象化的类比,对已知事物理解的方式理解新事物
3、词汇抽象化的理解,无法类比的事物的理解(AI学习的本质,下面细讲
4、强化,死记硬背,但是做不到学以致用或者说举一反三!!!
AI同样具有这些特点,因为它就是人造脑

1. AI的原理就是人类大脑

AI形成的过程(架构,或者说底层技术原理)就是模仿的人脑
An image to describe post
神经突触

为什么说AI的学习都是抽象化的?因为它没有任何感官,视觉、听觉、更没有触觉味觉嗅觉等等,所有“知识”的来源都是文字。
也就是语言,如何理解语言的?想一下小孩是如何学会说话的!听(看)的多了自然就会说话了,因为它大脑的神经突触数量够了,这是很自然的事情。AI也是因为所谓的数据层数达到了!
注意:目前仅仅是会说人话,本质上还没有理解
在胚胎和胎儿期,神经元的生成是主要事件。然后,在婴儿期和幼儿期,神经元之间的连接通过突触的形成得到加强。这个过程在儿童期和青少年期也会继续,但突触的"剪枝"也开始发生,不必要的连接会被减少,以优化大脑的功能。

机器通过不断读、看、思考,从而理解并记住世界
人每天说话,小孩子可以学会模仿,即使不知道什么意思。但是只要听的看的足够多,它自然就理解了含义。基础的原理就是猜测下一个字应该是什么,就像人类的“脱口而出”,例如小孩子表达会从“妈妈,喝”逐渐变成“妈妈,我渴了,想喝水”,从这种变化中,人类告诉他这么说更正确,叫做“激励”,这叫做基础大模型训练。AI就是这么出来的。
那么AI具体的定义是什么?Artificial Intelligence,其实它是一个个的看起来能听明白人话的东西,通常叫做模型,模型的能力是固定的,但是可以变的更强(考试成绩更好),因为它本质是一堆协作的数据,可以复制,所以它可以变成很多个……从而去做不同的事情,或者同时服务很多人。
重点:但是本质上它是鹦鹉学舌,没有复杂的逻辑,只是猜测下一个字怎么说……

在胚胎和胎儿期,神经元的生成是主要事件。然后,在婴儿期和幼儿期,神经元之间的连接通过突触的形成得到加强。这个过程在儿童期和青少年期也会继续,但突触的"剪枝"也开始发生,不必要的连接会被减少,以优化大脑的功能。

An image to describe post

【扩展阅读】即名词对照,不想了解对照直接略过...
神经网络(Transformer)

神经网络"包含的内容是:神经网络是一种模拟人脑神经元之间相互作用方式的数学模型,它被广泛应用于各种机器学习和人工智能任务中,包括图像识别、语音识别、自然语言处理等。用于自然语言处理任务,如文本分类、命名实体识别等,全称是BERT(Bidirectional Encoder Representations from Transformers),著名的openAI就是用的这种架构,不同的点是他提前把基础语料现给大模型学习,可以理解为字典,像维基百科,互联网上的基础文本含义等,这有利于机器快速学到通识的知识,所以它“什么都懂”。

2. 大力出奇迹,强大算力引起的质变

AI通过大量阅读和学习,博学多才,出口成章
AI在大量阅读和学习的过程中,展现出博学多才的一面,能够出口成章,娴熟地表达各种知识。正如之前所述,AI的神经层数越多,记住的字数越多,前后关联性越大。这就好比小孩子的大脑发育成熟,能够处理更为复杂的事务,而在不成熟的阶段,可能连玩具都会弄得一团糟,因为大脑无法处理那么多信息。AI通过足够大的计算能力,实现了对大量信息的处理和理解。

知识需要被记住,技能需要被忘掉,知识转化为技能
AI的学习过程中,知识的积累起着关键作用。随着记忆的不断积累,AI能够更深刻地理解各种信息,逐渐将知识转化为技能。这种转化过程类似于人类学习的过程,看过的东西被记住了原因、过程和结果,最终形成了实际运用的技能:说人话(人能听懂)。
在这一过程中,AI通过大模型的基础训练,获取了丰富的知识库。然后,通过模仿人类学习的方式,将这些知识逐步转化为能够应对实际问题回答的技能。这就是AI在解决复杂任务时,如何发挥“大力出奇迹”的魔力。

3. AI与编程的区别

• 能自然沟通就可以自动完成一些任务
AI在对话方面与传统编程有着显著的区别。它适应了人类的自然沟通方式,能够理解并回应自然对话,会显得人性化。与此不同,传统软件通常需要明确的条件判断和指令以及固定格式的内容才能处理事情。
更进一步,AI不仅能够理解语言,还能够自动完成一系列处理过程。因为它就是模拟人类的思维去处理一些事情,所以人会感觉很智能。但是人类语言的缺点就是模棱两可的地方太多,尤其我们博大精深的汉语,同样的一句话,在不同的语境下的意思可能好多个,例如:喜欢上一个人,可以有5种含义。而编程绝对不会存在这种状况,有就是BUG。
• AI的缺陷是没有感知世界的能力,需要输入信息才能工作
所有对话都需要人类发起,没有提前预设,它是不会先主动工作的,因为它没有收到信息,也就无法自己主动发起做什么事情。这是目前它和人类本质区别,所以觉得它作恶之类的想法,是完全不理解AI的表现,没有意图即没有动作,一切作恶都是以人为始,所以这本质并不算缺陷。对于初学者而言,熟悉和理解AI的应用场景和使用限制是非常重要的。

【扩展阅读】
人工智能觉醒
目前虽然看AI已经无敌,什么都会,貌似可以超过人类,就像毁灭人类,其实它没有欲望,即没有意图,就不可能有主动动作,那些觉得AI要控制人类的想法,纯粹是人类自己的被害妄想症而已。所有AI可以主动发起的事情,绝对是认为提前设置好的过程。

4. 如何与AI沟通

与AI沟通需要把话说清楚,明确任务和期望效果
与AI进行沟通时,可以将其视为一个陌生的大学生,尽管他具备丰富的知识和强大的能力,但不了解我们的具体需求,也是不会产生好的结果的。因此,我们需要使用与人类交流类似的方式,清晰地描述我们的意图和需求,以便AI理解并提供所需的结果。
人类沟通过程中也是存在问题的,人类表达事情和理解事情的时候,最关键的问题是背景知识的省略。尤其以职场来说,聪明的领导们或者自以为聪明的领导们下发命令的时候,通常都是忽略很多背景信息的,他们会觉得很多信息都是“这还用说么?”,所以职业素养比较高的人会追问清楚这些信息,以弥补这些领导们错失的信息,胆子小的或者经验不足的就会回复一个收到就去执行了,结果可想而知会出现很多偏差。导致了另一个规则的产生:及时汇报,其实如果问题表达清楚,正常智商的理解力足以清楚事情原委,顶多是执行力差距了。沟通这门必修课,优先就是表达,所以用好AI可能是很多老板们的短板哦,但是我们普通小白,如果学好如何和AI沟通,将来是可以做个优秀的领导的。
那么如何把话说明白呢?

Prompt(提示词)成为了一门学问,其实就是沟通中表达任务的基本功
正确的提示词可以帮助AI理解我们意图,从而产生我们所期望的结果。清晰或者说固定的模版描述我们的意图、角色和任务,包括期望的效果,它就能产生更好的结果。这一系列信息指导语即为“提示词”,而设计有效的提示已经成为一门学科。还好,AI基本都差不多,并非形形色色不同背景的职场小白,学会基本的提示词,可以让AI瞬间完成我们本该完成的任务。

【扩展阅读】
生成式AI
AI的沟通方式与人类类似,它在生成句子时也需要考虑每个字的上下文和语法。其思考过程就是进行算力输出,输出的速度取决于其掌握的知识和技能。这些技能的提高可以加速其输出的速度,但背后需要强大的计算机硬件作为支撑。在进行计算的过程中,系统会逐个生成每个字。每生成第一个字,它就会继续计算第二个字,以此类推,系统依次计算出每个字或词,最终输出我们所需的结果。这个过程基于从我们提出的问题出发,通过推断来决定应回复的内容。理解了这些原理后,与系统的交互方式就变得简单明了。
模型和产品

举例说明:
openai是公司;GPT3.5/GPT4是模型,也就是AI本身;chatGPT,GPTs是产品,是对话聊天的工具。
阿里是公司;通义是模型;通义千问、通义听悟、通义万象是产品,可以聊天,绘画等。
百度是公司;文心4.0是模型;文心一言,文心一格是产品。

5. 看未来

目前AI的知识体系大概这么几类,理解了可以知道自己的长处,应该在哪部分入局
1、 提示词,prompt,就像和刚毕业的大学生对话,表达清楚。
2、 AI编程,输入注释表达清楚接下来的代码要做什么,就能根据前边代码,自动联想生成代码。
3、 让大学生知道找人帮忙,因为模型是死的,需要给它很多实时或辅助的能力,确切的告诉它如何做事,以便过程中它主动去找帮手(function calling)来完成目标任务。agent智能体作为终极形态,类似让AI自动化指挥人做事。
4、 RAG,给大学生一本私房菜秘籍,一做菜先看菜谱,做专业事但是速度不够,Embeddings数据向量化。
5、 fine-tuning,微调,强化记忆,尽量把菜谱都记住,让大学生去做厨子,提高厨艺,速度更快。
6、 多模态,除了文字之外,声音(耳朵)、图像视频(眼睛)等相互协调的发展。
7、 产品:这个大学生既然能改变这么多方向,给他配个职业名称吧,好让人能用起来。
8、 大学生的生活服务,吃喝拉撒,吃啥(算力)住哪(部署)还是时刻从天而降(云调用)等等。
除了1和7之外都是程序员做的,AI编程助力编程效率,程序员最先受益。
👋优先自学RAG > 再找人帮忙function calling > 不得不再去微调fine-tuning
PS:所有改变大模型能力的都叫调试应用,【训练】是openAI这样的公司里的人做的,说错了会让专业人感到困惑产生偏差理解,语意的一致性在沟通中重要性的体现。一切的调试改变,都需要优质的数据,精准的资料,哪怕是优秀的客服对话,数据是决定结果的关键

和谐相处心法:
1、 尝试把AI看成一个学习很快的优秀人才,掌握代替优秀的人去辅导其他人。
2、 从各自熟悉的领域寻找有价值的用法。
3、 放弃完全自动化的幻想,一个个小问题解决,最终形成可控、安全的“自动化”。
4、 只要能高于成本的价值,都是真价值。

共识(共识即“事实”)总结:
1、 AI时代确定到来,必将重构世界,是否包括秩序,阶层各位各自判断,毕竟它是实实在在的生产力,生产力是可以改变生产关系的。
2、 人人都要懂,谁先懂谁就先获得红利,可以理解现在遍地都是AI培训,任何行业第一波都是培训,就像当年的计算机培训、设计培训、编程培训……现在都已销声匿迹。
3、 还不知道怎么用,目前AI的能力真的是每日更新,已经非常强大,现在缺乏的是想象力。而想象力之后是执行力,那才是技术怎么实现,产品策略是什么等,确定性还很低。谁先吃到螃蟹,谁就会吃撑。
目前openAI依然是遥遥领先,不要看各种分数数据,根据大力出奇迹的原理,看到算力差距就知道差生某一科考的好,肯定是有作弊嫌疑的。当然对企业B端数据私密性来说,开源AI即使能力没那么强,也依然是必选之路。

PS:如果大家喜欢这门课程,下节课我就专门讲解提示词。

by 视频号 AI连说