融合RL与LLM思想，探寻世界模型以迈向AGI「中·下篇」（ret基因融合突变只能化疗m）

原标题：融合RL与LLM思想，探寻世界模型

以迈向AGI「中·下篇」

关键字：模型,报告,知乎,人类,数据

文章来源：JioNLP

内容字数：111785字

本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一，同时与最近OpenAI

暴露出的project Q*可能的关于细粒度过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考，以展望并探索当下面向未来的AGI->ASI的路径可行性。正如前几日AI一姐李飞飞所说，人工智能即将迎来它的「牛顿时刻」

本篇文章拟分为「上篇」「中篇」「下篇」

作者：吕明，坐标西二旗，技术探索方向LLM/RL/AGI/AI4S..

想回顾「上篇」的小伙伴请参考如下链接：融合RL与LLM思想，探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」 (qq.com)「中篇」

「系统一 · 快思考与系统二 · 慢思考」的本质&阐释：

细心的读者可能会在上篇的内容预告与中篇内容的更新中对比发现，将「系统一 · 快思考与系统二 · 慢思考的本质&阐释」与「LLM×RL本质&阐释」做了先后调换（相信大家从这里也能推断出「中篇」和「下篇」的撰写是在

原文链接：融合RL与LLM思想，探寻世界模型以迈向AGI「中·下篇」

文章来源：JioNLP

作者微信：jionlp

作者简介：AI、自然语言处理、计算机视觉、数据挖掘、数据分析、C、C++。当然，也聊关于程序员的方方面面。