类别:人工智能 / 日期:2023-05-29 / 浏览:721 / 评论:0
这是OpenAI联合吴恩达老师做的一个免费的如何写提示词的官方课程,时长大概一个半小时,在听完后我总结了笔记跟大家分享。
课程链接:点击打开
一、两种大型语言模型(LLM)
Base LLM (基础LLM)
基于大数据训练,预测下一个词
Instruction Tnued LLM(指令微调LLM)
基于指令去训练
微调可以更好的适应
通过RLHF(人类反馈强化学习),使得更好的理解人类的语言
二、编写的两个原则
明确且具体提示(明确≠简短)
使用分隔符清晰的分割提示和指令部分(避免提示注入)
要求结构化输出的格式(HTML,json)
要求模型检测条件是否符合(假设符合A条件,则执行B任务)
少样本提示(给示例,按照示例回答)
给模型留下”思考“时间
指定完成任务所需要的步骤
指示模型在给出答案之前,做充分的思考
注意模型回答的幻觉(基于文章内容回答)
三、对提示词进行迭代
迭代过程类似软件开发:
初次尝试命令
分析结果,发现不符合预期的地方
根据结果,修改提示词或者命令
四、常见应用场景
1、总结:
评价文本的感情色彩(积极,消极)
从文本中提取特定类似的词语或者内容
判断文本的内容是否满足某个条件
识别文本中的某些内容
总结文本的主题,判断主题是否满足某些词语
2、推理:
对文本按照指定条件推测是否符合结果
关注某一个细节进行推理
提取具体方面的信息
对成百上千的评论进行总结,并在仪表盘山展示
3、转换:
翻译成不同国家的语言
判断输入的那种国家的语言
翻译的时候可以指定不同的场合(正式,非正式)
可以转换不同的语气
不同格式数据之间的转换(html→json)
检查语法错误
显示原始文本和经过修改后的文本的不同
4、扩展:
根据文本的感情内容去生成对应的回复
参数temperature:
高的temperature可以增加回复的随机度:
五、聊天机器人
可以看下我上篇文章写的如何在Django下做一个简单的AI聊天机器人:链接
发表评论 /