生成式AI技术
摘要:“利用训练技巧提高GPT的回应水平,并将大量超限制信息文本压缩为最重要的事实信息。”
一ChatGPT的技术水平
通过为ChatGPT提供足够的上下文和信息,可以帮助它了解给定聊天期间数据集中的内容之外的内容。ChatGPT受到其数据集年龄的限制,因此它不会向使用者提供答案或执行依赖于更新信息的任务。但是,使用者可以手动更新它所知道的信息。
(一)ChatGPT的默认知识限制
ChatGPT是基于GPT-3.5架构开发的语言模型,它能够利用庞大的知识库为各种问题提供答案。然而,与任何工具一样,ChatGPT也有其局限性。
首先,ChatGPT的训练数据仅持续到2021年9月。因此,该时间之后的任何信息或事件都不在其知识库内。其次,虽然ChatGPT可以提供有关广泛主题的丰富信息,但它仍然只是一个机器学习模型,它对复杂概念的理解并无法与特定领域的人类专家相媲美。
另外,ChatGPT响应的准确性和有用性在很大程度上取决于使用者所提出问题的性质和特殊性。如果问题过于笼统或具体信息不清楚,ChatGPT可能无法提供有用的答案。同样,如果一个问题需要深厚的专业知识或精准的数据、论证等,ChatGPT也无法给出符合该领域专家标准的解决方案。
但是通过使用正确的指令表达技巧,可以保证起码在一定程度上解决其中一些限制,使用者也应该尽可能掌握可以暂时提高ChatGPT“IQ”的一些方法。
(二)放弃简略化
从某种意义上来讲,ChatGPT就像一个古老的神谕或神灵,知道所有使用者想要、或需要知道的事情,但它只会回答使用者提出的具体问题。人们常说,世界上并不存在愚蠢的问题,但事实上,有些问题如果使用了不正确的方法向ChatGPT提出,那么将很难从其中得到真正可靠、所需的信息。
向ChatGPT提供需要它做什么的详细介绍,可以让它变得更有洞察力、收集信息时更细致入微,更甚者会回答出让人意想不到的超预期信息。通常情况下,使用者的本能行为是尽可能简略地操作工具,对于ChatGPT则是仅仅写出一两句话长度的指令,这必将造成其无法充分搜集解答。如果想从这个人工智能中获得任何更丰富的答案、或满足更复杂的行为,就需要改掉这个简略的习惯。
二ChatGPT的训练方法
我将在这里使用一个虚构的示例来为各位说明使用操作,各位在使用时直接用真实的元素替换虚构的元素(这对ChatGPT没有区别)就可以获得类似的结果。
(一)利用知识生成知识
当使用者也无法向ChatGPT提供足够多有用的信息时,就需要借助GPT自身的信息库来学习使用者给出的零碎信息先检索获得相关知识,再根据相关知识延展成更丰富可靠的知识内容。主要的逻辑流程是:
1.要求ChatGPT帮助起草目标内容的简报或大纲,即提供我们所需要得到的目标结果的主体信息,借助我们提供的信息并利用它去搜索和整理它所知道的一般信息,ChatGPT可以得出一个相当不错的轮廓框架。
(图源:ChatGPT)
当然,如果使用者已经有了执行某个特定任务的简报或大纲,可以省去这一步骤,直接将整个简报或大纲提供给ChatGPT,以便它考虑给定聊天线程中的任何进一步提示。
2.接着,使用者可以要求ChatGPT扩充编写以上大纲的各个部分,这一步只需要对他发出指令“请将这份简报/大纲的各部分扩编完整”即可,也可以用它上一步生成的大纲中的标题分别进行提示。
(图源:ChatGPT)
ChatGPT会记住给定线程中所说的一切内容,以便使用者可以继续添加上下文。它从使用者处获得的背景和信息越多,它在帮助完成某个特定任务方面就越智能、越有用。
3.这一步需要将获得的源材料重新完整输入ChatGPT,正如文章开头提到的,在撰写本文时,ChatGPT不知道2021年9月之后发生的任何事情。因此,当使用者希望它执行任何涉及更新信息的操作,就必须告知ChatGPT信息的更新。
但使用者们不必手动输入所有内容,可以直接将文章、书籍或其他任何内容中的文本复制并粘贴到ChatGPT中,以便它在其余聊天中了解此信息。使用者应该给它一些背景信息,解释为什么突然给它提供整篇文章。
例如,可以使用“请阅读以下文本并在对话的其余部分中记住它:”之类的提示,然后将完整的信息文本粘贴到冒号后面。这里的示例所使用的完整信息文本即是通过以上步骤从ChatGPT处获得的。
(图源:ChatGPT)
4.这时ChatGPT就已经根据自身的知识库掌握了可供使用的足够信息,可以向它直接提出指令“请根据以上的内容为我创建一篇报告”。这个指令可以根据自身的不同要求进行调整与优化,例如增添一些风格、文风以及篇幅和文本类别等的要求。
(图源:ChatGPT)
(二)绕过ChatGPT输入限制
GPT-3.5 Turbo是在撰写本文时ChatGPT的默认模型,可以一次处理大约3000个单词,这其中包括使用者提供的问题和ChatGPT给出的答案。这意味着,如果使用者的提示超出此限制范围,则可能会出现错误,或者解决方案可能会因为没有剩余的单词空间而中断响应。
虽然ChatGPT拥有“重新生成响应”的功能,但其实如果ChatGPT的响应因为字符数限制而被中断,只需将下一个提示设置为“继续”或“请续写完整”等,它就会从中断的地方继续生成余下内容。
(图源:ChatGPT)
而当使用者想要向ChatGPT提供大量信息时,也有多种方法来解决此问题,最显而易见的方法是将文本分成更小的块依次输入。通过这种方式,使用者可以逐步添加信息,直到ChatGPT了该次线程中需要的所有信息,以完成使用者需要的工作。
还可以使用ChatGPT将输入文本处理为更简洁的格式,即将背景信息长文本放入ChatGPT,并要求它总结、提炼出最重要的事实信息。然后将这些摘要复制到文本文档中。重复此操作,直到汇总完所有主要信息。然后,开始新的聊天并输入总结的所有主要事实信息,经过压缩的信息文本占用的空间将会比一开始少得多,但仍然传达了ChatGPT出于使用者的目的需要了解的最重要的事情。