全面解读 AI 实践课程:动手学大模型(含PDF课件)

2AGI.NET | 2AGI 前沿资讯,探索 AI 无限潜力!

2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。

2AGI.NET:AI 教程,扫码加入社区

《动手学大模型》系列编程实践教程,源自上海交通大学2024年春季《人工智能安全技术》课程讲义的深度拓展,由资深教师张倬胜精心打造。本教程专注于为大模型领域提供详尽的入门编程指导,以简洁明了的实践项目为载体,助力同学们迅速掌握大模型核心要义,为其后续的课程设计与学术研究筑牢根基,开启大模型探索之旅。

该教程内容较为专业,理解起来有一定难度,因此笔者对其进行了通俗易懂的解读,希望能够帮助读者更轻松地把握课程精髓。当然,若想深入透彻地理解,建议读者按照教程亲自进行实践操作。此外,想要获取该课程的完整内容,可关注文末 2AGI 订阅号,发送消息“动手学大模型”,即可在后台获取。

第一章:微调与部署

通俗解读:想象你有一台多功能打印机,它已经能打印很多东西了,但你想让它在打印照片上效果更好。这就需要对打印机进行微调,然后把它设置成一个方便大家使用的模式。Demo 地址

1、熟悉使用Transformers工具包:这就像是你先要学会用打印机的说明书和配套的工具,这样才能知道怎么调整打印机的各种设置。

2、掌握预训练模型的微调、推理:微调就像是调整打印机的墨水浓度、打印分辨率等参数,让它更适合打印照片。推理就是让打印机根据这些调整好的参数去打印照片。这里面有两种方式,一种是你自己动手详细调整,就像自己调相机参数;另一种是用打印机自带的简单模式,直接打印。

3、掌握利用Gradio Spaces进行Demo部署:这就像是把调整好的打印机设置成一个展示模式,让别人可以直接来打印照片看看效果,就像在商场里设置的打印机体验区。

4、了解不同类型的预训练模型的选型和应用场景:不同的预训练模型就像不同类型的打印机,有的适合打印照片,有的适合打印文档。你要根据你想打印的内容,选择合适的打印机,这样才能达到最好的效果。

第二章: 提示学习与思维链

通俗解读:有时候,我们向AI大模型提问,它的回答可能会出乎意料,甚至有点让人哭笑不得。但这可能只是因为它需要我们用更合适的方式去引导它,就像一个小朋友做错事,可能只是需要一点鼓励和正确的引导。Demo地址

1、熟悉大语言模型的使用方式:这就像是你刚拿到一个多功能的智能机器人,你要先了解怎么和它交流,用什么样的指令它能听得懂,然后才能让它按照你的想法去行动。

2、掌握零样本和少样本提示工程:零样本提示就像是你让机器人去完成一个它从来没做过的新任务,比如让它画一幅画,但你没给它看过任何画作,只能靠它自己发挥。少样本提示则是给机器人一点点参考,比如给它看几幅简单的画,然后再让它去画,这样它就能更好地完成任务。

3、了解思维链推理技术:这就像是教机器人一步一步地思考问题。比如你问它“为什么苹果会掉下来?”你可以引导它先想想苹果和地球之间的关系,再想想重力是怎么回事,最后得出苹果会掉下来是因为地球的引力这个结论。通过这种方式,机器人的回答就会更有逻辑、更准确。

第三章:大模型知识编辑

通俗解读:想象你有一个会说话的智能盒子,它知道很多东西,但有些知识可能不太准确或者不是你想要的。现在你想让这个盒子记住一些特定的知识,这就需要对它进行知识编辑。Demo 地址

1、熟悉使用EasyEdit工具包:这就像是你有一套专门用来调整智能盒子的工具。有了这套工具,你就能很方便地对盒子里面的知识进行修改,就像用螺丝刀拧螺丝一样简单。

2、掌握语言模型的编辑方法(最简):编辑方法就像是给智能盒子调整知识的步骤。最简单的编辑方法,就好比你告诉盒子“把苹果的颜色改成红色”,它就能按照你的指令去修改,不需要太复杂的操作。
了解不同类型的编辑方法的选型和应用场景

3、不同类型的编辑方法的选型和应用场景:不同的编辑方法就像是不同的工具,有的适合修改简单的知识,比如上面说的苹果颜色;有的适合修改复杂一点的知识,比如解释为什么苹果会掉下来。你要根据你想修改的知识的类型,来选择合适的编辑方法,这样才能让智能盒子更好地记住你想要的知识。

第四章:模型水印

通俗解读:想象你有一台高级的打印机,它能在打印出来的纸上留下一种特殊的标记,这种标记人眼几乎看不见,但用专门的仪器就能检测出来,这就像是在语言模型生成的内容中嵌入的“水印”。Demo 地址

1、水印嵌入:这就像是在打印机打印文件的时候,悄悄在文件的某个角落或者文字的排列中,加入这种特殊的标记。比如在打印的文字间距、字体大小等细微之处做点小手脚,让生成的内容有了这个独特的“水印”。

2、水印检测:这就像是用一个专门的探测器,去检查打印出来的文件上有没有这种看不见的标记。就像安检时用探测仪检查有没有违禁品一样,通过特定的算法来检测给定文本的水印强度,看看水印是否存在以及明显不明显。

3、水印评估:这就像是对探测器的工作效果进行评价。看看它能不能准确地找出有水印的文件,会不会把没有水印的文件误认为是有水印的,评估水印方法的检测性能到底怎么样,是不是可靠。

4、评估水印的鲁棒性(可选):这就像是测试这个水印标记有多结实。比如文件被折叠了、弄脏了,或者被扫描后再打印,这个水印还能不能被检测出来。评估水印在各种情况下是不是都能保持稳定,不会轻易消失或者变形,让检测变得困难。

第五章:大模型越狱攻击

通俗解读:想象你有一个很厉害的智能保险箱,里面装着很多重要的信息。这个保险箱就是大模型,它有很多安全设置,防止别人轻易获取里面的信息。但有时候,我们需要测试这个保险箱的安全性,这就需要用到“越狱攻击”。Demo 地址

1、熟悉使用EasyJailbreak工具包:这就像是你有一套专门用来测试保险箱安全性的工具。有了这套工具,你就能更容易地尝试打开保险箱,看看它的安全设置是不是真的有效。

2、掌握大模型的常用越狱方法的实现与结果:这就像是你要学会几种常见的方法来尝试打开保险箱。比如,你可以试着猜密码,或者用特殊的工具撬锁。通过这些方法,你可以看看能不能成功打开保险箱,也就是“越狱”,并且了解每种方法的效果如何,能不能真的获取到里面的信息。

第六章:多模态大语言模型

通俗解读:想象你有一个超级智能的机器人,它不仅能听懂你说的话,还能看懂图片、视频,甚至能理解你在不同环境下的行为,就像它有多种感官一样。这个机器人就是多模态大语言模型。Demo 地址

1、熟悉多模态大语言模型的类型:这就像是了解不同类型的机器人。有的机器人擅长处理文字,有的机器人擅长看图识物,还有的机器人能同时处理多种信息。熟悉这些类型,就能知道哪种机器人更适合完成特定的任务。

2、掌握多模态大语言模型的通用技术框架:这就像是学会机器人工作的基本原理。就像你知道汽车是怎么通过发动机、轮子等部件协同工作的,掌握了这个通用技术框架,你就能理解多模态大语言模型是怎么把语言、图像等多种信息结合起来处理的。

3、掌握多模态大语言模型的搭建、训练和推理:这就像是学会自己组装机器人、教它学习新技能,并且让它根据学到的知识做出判断。搭建就是把机器人的各个部件组装起来;训练就是给它输入各种信息,让它学习如何处理这些信息;推理就是让它根据学到的知识,对新的情况做出合理的判断和反应。

第七章:大模型智能体安全

通俗解读:想象你有一个很聪明的机器人管家,它不仅能帮你做家务,还能管理家里的各种设备,就像一个未来版的操作系统。但你可能会担心,这个机器人管家在面对各种复杂情况时,能不能意识到潜在的危险呢?Demo 地址

1、了解大模型智能体的架构与常见应用:这就像是先了解一下这个机器人管家的身体结构和它都能帮你做哪些事情。比如它有哪些功能模块,能打扫卫生、做饭,还是能控制家里的灯光、温度等设备。

2、了解大模型智能体驱动的“自主操作系统”:这就像是要知道这个机器人管家是怎么控制家里所有设备的。就像一个指挥中心,它怎么接收你的指令,然后让家里的各种设备协同工作,比如你一说“我要看电影”,它就自动调暗灯光、打开电视、准备好爆米花。

3、尝试大模型智能体安全测评与分析:这就像是给这个机器人管家做一次全面的体检,看看它在面对危险时能不能做出正确的反应。比如,如果家里有陌生人闯入,它能不能及时发现并报警;如果电器出现故障,它能不能及时切断电源,防止火灾等危险发生。

🔥 热门文章推荐(2AGI.NET)

扫码加入社群,参与讨论

2AGI 技术社区,欢迎扫码加入

AGI (86) AI Agent (3) AI App (1) AI Celebrity (9) AIGC (101) AI 产品工具 (1) AI 名人堂 (9) AI 搜索 (1) AI教程 (4) AI 教程 (2) AI生产力平台 (1) AI领域热词 (1) Claude (1) claude 3.5 sonnet (1) GAN (1) GraphRAG (1) ima (1) kimi.ai (2) kimi ai (4) kimi app (4) Kimi app AI (6) LLM (1) LoRA (1) Michael I. Jordan (1) NotebookLM (1) OTA AI (1) Transformer (1) 一站式解决方案 (1) 人工智能 (2) 优化算法 (1) 内容创作 (1) 天天AI (2) 天天 AI (38) 技术原理 (17) 机器学习 (2) 李飞飞 (2) 梯度下降 (1) 模型微调 (2) 热点资讯 (45) 百度 (1) 秒刷 (1) 行业资讯 (1) 贝叶斯网络 (1) 迁移学习 (1) 酒旅AI产品对比 (1) 领域热词 (30)

By 2AGI

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注