Prompts

提示精髓:¹ 好炼 ² 练好。

View on GitHub

本节精髓是关于提示词工程(Prompt Engineering)的最佳实践体系化。

核心观点是将有效提示词创建归纳为四个关键维度:清晰性(简洁明了的语言)、上下文(提供足够背景信息)、精确性(明确输出类型和示例)和角色扮演(设定特定视角)。

这一框架旨在解决AI模型输入优化的问题,通过系统化的提示词构建方法来提高生成内容的质量和相关性。

操作实践

如何质检提示词?

维度

质检策略

正反案例

清晰性维度

  1. 质检指标
    • 句长控制:15-25字为宜,超过40字的句子应当拆分
    • 专业术语密度:每100字中专业术语不超过3个
    • 指令明确度:任务、角色、输出格式至少明确两项
    • 歧义词汇:避免使用“可能”、“或许”、“一些”等模糊词汇
  2. 质检方法
    • 可读性测试:使用Flesch Reading Ease等工具评估
    • 第三方理解测试:让非专业人员复述提示词意图,一次成功率≥90%
  1. 正面案例:
    • prompts: 分析人工智能在医疗诊断中的三个主要伦理问题。 针对每个问题,提供:
      1. 问题定义(50字以内)
      2. 一个真实案例
      3. 一项可实施的解决方案 使用医学伦理学术语时,请附加简明解释。
    • 质检优势:
      • 每句话独立完整,平均长度控制在20字左右
      • 明确的数量限制(三个问题)
      • 具体的输出结构(三部分)
      • 专业术语处理指南明确
  2. 反面案例:
    • prompts:研究当代社会中与现代技术的广泛应用相关的各种伦理困境和道德挑战,尤其是在数据隐私和个人信息保护等敏感领域可能涉及的潜在问题,并探讨相关的解决方案及其实施过程中的难点。
    • 质检问题:
      • 句子过长(78字),无分句
      • 包含多个模糊词汇:“各种”、“可能”、“潜在”
      • 任务不聚焦,包含多个请求点

上下文维度

  1. 质检指标
    • 背景完整性:5W1H (Who, What, When, Where, Why, How) 覆盖率
    • 关联信息深度:提供至少2层相关背景(如行业背景、项目背景)
    • 约束条件明确度:时间、资源、规范等限制因素明确标注
    • 受众信息完整性:至少包含受众知识水平和期望目标两项信息
  2. 质检方法
    • 上下文映射图:绘制提示词中的信息关联网络
    • 模拟响应评估:使用提示词生成3次响应,检查一致性
  1. 正面案例:
    • prompts:

      • 背景:我们是一家成立3年的B2B SaaS初创公司(20人团队),主要为中小型制造企业提供库存管理软件。
      • 当前状况:获客成本高($500/客户),主要依赖付费搜索广告,月均新增客户10个,客户生命周期价值约$2000。
      • 目标:在下一季度(Q3 2023)将获客成本降低30%,同时保持或提高新客户获取速率。
      • 预算:营销预算为每月$15,000。

      请提出三种可行的营销策略调整方案,每种方案需包含实施步骤、预期成本和ROI分析。

    • 质检优势:
      • 完整的公司背景(规模、业务模型、产品)
      • 明确的当前状况(具体数据)
      • 清晰的目标指标和时间框架
      • 明确的资源约束(预算)
      • 清晰的输出期望(三种方案及其组成部分)
  2. 反面案例:
    • prompts:优化公司的营销策略。
    • 质检问题:
      • 缺失几乎所有上下文元素
      • 无行业信息、公司规模、目标市场
      • 缺乏当前状况和改进目标
      • 无时间约束和资源限制

精确性维度

  1. 质检指标
    • 数量指标明确度:输出内容的数量、长度有明确限定 质量标准具体化:成功输出的判断标准明确
    • 范例完整性:提供格式和内容的示例
    • 边界条件处理:明确哪些内容应当排除
  2. 质检方法
    • 模糊度评分:评估提示词中不明确指令占比(应<10%)
    • 示例覆盖率:检查提示词示例是否覆盖所有主要输出类型
  1. 正面案例:
    • prompts: 为电子商务网站生成5条高端家用咖啡机的产品描述:

      • 每条描述长度:60-80字
      • 目标受众:30-45岁的城市专业人士
      • 必须包含:一项技术规格、一项用户体验优势、一个情感诉求点
      • 风格:专业但友好,避免过度营销词汇(如“革命性”、“颠覆”)
      • 价格范围:2000-5000元

      示例格式: “[产品名称]采用[技术规格],能够[具体功能]。每天清晨,您可以享受[用户体验],让[情感诉求]成为日常。”

    • 质检优势:
      • 明确的数量(5条)
      • 明确的长度范围(60-80字)
      • 具体的目标受众
      • 必须包含的具体元素(3项)
      • 明确的风格指导(包括禁用词)
      • 提供了完整的格式示例
  2. 反面案例:
    • prompts:生成一些产品描述。
    • 质检问题:
      • “一些”数量不明确
      • 产品类型不明确
      • 描述风格、长度不明确
      • 缺乏具体目标受众
      • 无格式要求或示例

角色扮演维度

  1. 质检指标
    • 角色明确度:角色身份、背景、动机清晰
    • 语言风格匹配度:词汇、句式、修辞与角色一致
    • 知识域边界:明确角色应知道和不应知道的内容
    • 视角一致性:全文保持一致的叙述视角
  2. 质检方法
    • 角色画像完整性:检查角色描述中必要元素的覆盖率
    • 风格一致性评分:评估输出内容与预期角色风格的匹配程度
  1. 正面案例:
    • prompts:
      • 角色:你是理查德·费曼,著名理论物理学家和科普作家,以能将复杂概念简化解释而闻名。
      • 背景:你正在1970年代的加州理工学院为本科生做一次特别讲座。
      • 任务:解释黑洞的事件视界概念,使用你标志性的比喻和思想实验方式。
      • 风格指南:
        • 使用生动的日常比喻
        • 偶尔插入幽默评论
        • 避免使用高等数学公式
        • 表现出对科学的热情和好奇心
        • 经常使用“想象一下…”这类邀请性短语
        • 偶尔提及你与其他物理学家的交流
      • 输出:800-1000字的讲座片段,包括一个能帮助学生理解事件视界的原创比喻。
    • 质检优势:
      • 明确具体的角色(特定科学家而非泛泛的“物理学家”)
      • 提供了丰富的背景信息(时间、地点、场合)
      • 清晰的任务和具体概念
      • 详细的风格指南(6项具体特征)
      • 明确的输出要求(字数和内容要素)
  2. 反面案例:
    • prompts:像物理学家一样解释黑洞。
    • 质检问题:
      • 未明确物理学家的专业领域和研究背景
      • 缺乏目标受众信息
      • 未指定深度和技术水平
      • 无沟通场景和目的

质检配比

复合质检表

创建一个综合评分表,对每条提示词进行评分:

维度 权重 评分项(1-5分)
清晰性 30% 句长控制、专业术语密度、指令明确度、歧义消除
上下文 25% 背景完整性、关联信息深度、约束条件明确度、受众信息
精确性 25% 数量指标、质量标准、范例完整性、边界条件
角色扮演 20% 角色明确度、语言风格匹配、知识域边界、视角一致性

实施流程

  1. 预评估:提示词创建后,使用质检表进行自评
  2. 试运行:生成3-5个测试响应,评估一致性和准确性
  3. 反馈循环:根据输出质量调整提示词,重复试运行
  4. 版本记录:保存提示词迭代历史,记录每次改进
  5. 周期审查:定期回顾高效提示词,提炼共性特征

阅读材料

1. 引言

在使用生成式AI模型时,编写有效的提示词是充分释放其潜力的关键。通过掌握提示词的编写技巧,研发团队和产品经理可以更好地控制输出的风格、语调和内容。本文将介绍提示词编写的四个核心维度:清晰性上下文精确性以及角色扮演。并通过实例解析如何优化提示词,以提升生成效果。


2. 方法

2.1 清晰性

清晰的提示词有助于AI模型准确理解任务。以下是实现清晰性的一些建议:

原提示词

讨论阳光下植物叶状托叶上的烹饪过程,并提到绿色的东西以及光、水和空气对植物空气部分的重要性。

问题:术语复杂且任务描述不清晰。

优化后提示词

解释植物的光合作用过程,详细说明叶绿素的作用,以及阳光、二氧化碳和水如何促进这一生物功能。

优化理由:优化后的提示词语言简洁明了,明确了任务目标,避免了复杂术语。


2.2 上下文

提供上下文信息有助于AI模型更好地理解任务背景。上下文可以包括:

原提示词

写下1775年革命战争爆发时发生的事情。

问题:缺乏足够的背景信息,描述范围模糊。

优化后提示词

描述导致美国独立战争的历史事件,重点分析波士顿倾茶事件、萨拉托加之战等关键事件,说明美殖民地与英国政府之间的矛盾如何引发1775年的革命战争。

优化理由:优化后的提示词加入了详细背景和关键细节,使模型能够聚焦于具体问题。


2.3 精确性

精确性在提示词编写中尤为重要。以下是实现精确性的建议:

原提示词

谈谈经济学中的供需关系及其影响。

问题:缺乏具体细节和示例,指令过于宽泛。

优化后提示词

解释经济学中的供需关系,描述需求增加如何影响价格,并以智能手机市场为例说明。类似地,通过油产中断的情形说明供应减少对价格的影响。

优化理由:优化后的提示词对任务进行了细化,并通过示例明确了预期的回答方向。


2.4 角色扮演

通过角色扮演模式,提示词能够引导模型以特定视角生成内容。关键在于提供足够的角色背景和情境细节。

原提示词

写一篇记录未探索外星星球奇异生物和植物的日志。

问题:缺乏角色背景,难以生成符合预期的内容。

优化后提示词

假设你是一名刚登陆未探索外星星球的宇航员。撰写一篇日志,描述遇到的奇异生物和植物,如天空的颜色、不熟悉的声音等。表达你的兴奋、好奇和一丝不安,记录这段非凡旅程。

优化理由:通过明确角色身份和情境细节,引导模型生成更贴合预期的输出。


3. 结论

提示词编写的四个核心维度——清晰性、上下文、精确性和角色扮演——为优化生成式AI模型的输出提供了系统方法。

通过应用这些实践,研发团队和产品经理可以根据需求调整提示词,确保生成结果与预期一致。


4. 代码示例

以下是一个结合所有维度的综合示例:

假设你是某科技公司的数据科学家,正在为团队设计一份关于AI模型优化的技术报告。撰写一段介绍,描述该模型的核心优化方向,比如性能提升、适应性增强等。明确列出优化的三个关键点,并说明每项优化对实际应用的意义。

通过遵循上述方法,提示词编写质量将显著提升,为生成式AI模型的高效应用提供支持。