Intro⚓︎
约 361 个字 预计阅读时间 2 分钟
理智决策(rational decision):
- “理智”:最大化实现预期(因为世界是不确定的)的目标(即结果的实际效用(utility))
- 实际上,这门课讨论的是可计算的理智 (computational rationality)
对智能 (intelligence) 的不同看法:
- 基于技术 (skill-based) 的观点
- 实体 (embodiment) 观点
- 心理测量学 (psychometrics) 观点
- 与人类和睦共处 (human-compatible) 的观点
关于大脑:
- 大脑善于进行理智决策,但并非完美
- 大脑不像软件那样模块化,因此难以逆向工程
- AI 在某些方面做得比大脑好
- 目前 AI 的规模远不如大脑(人脑有 100T 的突触,但 GPT4 只有 1.8T 的权重)
理智代理(rational agents):
- 代理:能够感知(利用传感器 (sensors))和行动(利用制动器 (actuators))的实体
- 感知:包括认知(percepts)、环境和行动空间
- 理智代理能够选择最大化自己(预期)效用的行动
- 分类:
- 反射代理 (reflex agent):不考虑行动后果,仅根据当前环境的状态选择如何行动
- 规划代理 (planning agent):使用模型 (model) 来模拟执行不同的行动,根据这些假设的行动结果选择最佳的行动
-
理智代理的抽象模型:
-
理智代理的核心部件(同时也是这门课程的主题
) :- 搜索和规划 (search & planning)
- 概率和推断 (probability & inference)
- 监督学习 (supervised learning)
- 强化学习 (reinforcement learning)
评论区
如果大家有什么问题或想法,欢迎在下方留言~