我们很少会遇到一个机会,既新,又能把大家的起跑线拉到一个水平
大模型时代就是这样的一个机会
基础知识
熟悉一下 Transformer 和 Diffusion 的架构,了解大致框架,建立一些感性的认识
实践
-
Prompt Engineering,做一个小的plugin,调用一些公开的接口,写一个不少于500字的prompt,
并且要建立一些datasets,懂得测试和评估它是否在绝大情况下是好用的,检测出在哪些场景下做的不好
-
RAG:建立一个调用Grok API 接口的 RAG System,看看是否会比 pplx 好用一点
-
SFT\RLHF:暂时没有配置条件
-
试用一下多模态的模型:文生图,图生视频,了解大概应用
-
AI Agent:搭建两个能够互相调用的 Agents, 观察是否有推理能力的提升,Memory 是否可持续和更新,同时试用一些多模态的功能,从目前用人单位的角度来看,搭建 Agent 的能力是越来越重要的
也许每天花一个多小时学习和尝试,一两个月的时间就能做出很多有意思的事情
AI Agent会发展到什么程度我们都不知道,也许当年面对iPhone的塞班工程师也是同样的感觉…
最起码我们可以先从个人的 project 做起