跳转至

Intro⚓︎

361 个字 预计阅读时间 2 分钟

理智决策(rational decision):

  • “理智”:最大化实现预期(因为世界是不确定的)的目标(即结果的实际效用(utility))
  • 实际上,这门课讨论的是可计算的理智 (computational rationality)

对智能 (intelligence) 的不同看法:

  • 基于技术 (skill-based) 的观点
  • 实体 (embodiment) 观点
  • 心理测量学 (psychometrics) 观点
  • 与人类和睦共处 (human-compatible) 的观点

关于大脑:

  • 大脑善于进行理智决策,但并非完美
  • 大脑不像软件那样模块化,因此难以逆向工程
  • AI 在某些方面做得比大脑好
  • 目前 AI 的规模远不如大脑(人脑有 100T 的突触,但 GPT4 只有 1.8T 的权重)

理智代理(rational agents):

  • 代理:能够感知(利用传感器 (sensors))和行动(利用制动器 (actuators))的实体
    • 感知:包括认知(percepts)、环境行动空间
  • 理智代理能够选择最大化自己(预期)效用的行动
  • 分类:
    • 反射代理 (reflex agent):不考虑行动后果,仅根据当前环境的状态选择如何行动
    • 规划代理 (planning agent):使用模型 (model) 来模拟执行不同的行动,根据这些假设的行动结果选择最佳的行动
  • 理智代理的抽象模型:

  • 理智代理的核心部件(同时也是这门课程的主题

    • 搜索和规划 (search & planning)
    • 概率和推断 (probability & inference)
    • 监督学习 (supervised learning)
    • 强化学习 (reinforcement learning)

评论区

如果大家有什么问题或想法,欢迎在下方留言~