实际上通俗来讲就是成语接龙,已知前 n 个词,预测后边几个词的原理
Zero shot: 零样本 One/Few Shot: 少量样本
Encoder
双向解码,每一一个词都知道他之前的和后边的词 你 好 呀 你好呀 【你好呀】 【你好呀】
Decoder
单向解码 One by One 你好呀 你->好->呀
通过大量的句式的关键词预测出语言的类型:比如情感
通过 Decoder 输出语言向量->Transformer->Linear->预测语言是哪一类
openai->Decoder(GPT)->Decoder Zero-shot->Decoder Few-shot(GPT3)->GPT-3(InstrucGPT)->GPT3.5(ChatGPT)
google:Transformer(Encoder+ Decoder)->Encoder+ 微调
搜推模型升级为序列模型 Few-shot 是规则还是经验的匹配