融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」(ret基因融合突变只能化疗m)

AIGC动态欢迎阅读

原标题:融合RL与LLM思想,探寻世界模型

以迈向AGI「中·下篇」

关键字:模型,报告,知乎,人类,数据

文章来源:JioNLP

内容字数:111785字

内容摘要:

本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI

暴露出的project Q*可能的关于细粒度过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考,以展望并探索当下面向未来的AGI->ASI的路径可行性。正如前几日AI一姐李飞飞所说,人工智能即将迎来它的「牛顿时刻」

本篇文章拟分为「上篇」「中篇」「下篇」

作者:吕明,坐标西二旗,技术探索方向LLM/RL/AGI/AI4S..

想回顾「上篇」的小伙伴请参考如下链接:融合RL与LLM思想,探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」 (qq.com)「中篇」

「系统一 · 快思考与系统二 · 慢思考」的本质&阐释:

细心的读者可能会在上篇的内容预告与中篇内容的更新中对比发现,将「系统一 · 快思考与系统二 · 慢思考的本质&阐释」与「LLM×RL本质&阐释」做了先后调换(相信大家从这里也能推断出「中篇」和「下篇」的撰写是在

原文链接:融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」

联系作者

文章来源:JioNLP

作者微信:jionlp

作者简介:AI、自然语言处理、计算机视觉、数据挖掘、数据分析、C、C++。当然,也聊关于程序员的方方面面。

0
分享到:
没有账号? 忘记密码?