ChatGPT比其前身 GPT-3 有显著的提升,比起同源的InstructGPT也有着独到的优势,甚至可以说ChatGPT是站在InstructGPT及GPT-3的肩膀上完成的一项伟大的工作。与InstructGPT类似,ChatGPT 能以不同的方式生成文本,并使用监督学习和强化学习的组合来进行迭代优化,但是ChatGPT 在泛用性、准确性、细节性及连贯性等方面比InstructGPT等大数据模型更强,其关键优势来源于强大的基座大模型能力(InstructGPT)、高质量的真实数据(干净且丰富)、强化学习(PPO算法)三个部分。