如何用 AI
搞定几乎任何事
MIT 媒体实验室 Paul Liang 教授的研究生课。视频是英文的——这门交互课会用中文把每个知识点讲透,并按大脑记忆规律,一步一步带你走。
学完这一讲,
你将能回答:
先把这几个问题装进脑子,带着它们往下走——大脑「带着疑问学」比「被动看」留存高得多。
- 这门课到底教什么?为什么说它教「原则」而不是「方法」?
- 「模态 / 多模态」是什么意思?
- 整门课分哪四大模块?成绩怎么算?
一块芯片,
怎么能「闻」出花生?
视频里有这样一幕:一块小芯片,凑近蛋糕、花生酱,就能报警「有花生」——对花生过敏的人,这是救命功能。
机器人被「模拟地震」乱晃,
为什么还能完成任务?
机械臂能感觉抓的是硬物还是软物。研究者故意乱晃它「模拟地震」、用挡板遮住摄像头「模拟下雨大雾」——它照样把事做完。
「帮我买副 4.5 星以上的耳机」
——AI 真的自己下单了
它会搜索、按评分排序、按你偏好选颜色、加购物车、结账。这不再是「回答一个问题」,而是连续做一串动作替你办事。
这三件事,
就是这门课的全部
闻花生、触觉机器人、网购 AI——它们指向同一个主题:让 AI 能接收并处理世界上几乎任何一种信号。
多感官智能Multi-Sensory Intelligence
世界本就是多感官的:语言、视觉、声音、气味、触觉……这门课教你怎么让 AI 接收这些「新感官」,而且是去帮助人类,不只是替代人类。
记住一个词:模态(modality) = 一种信息通道。这是全课最高频的词。
AI 能做的事,分三层
刚才三个例子,恰好对应 AI 的三种能力。把它们记成一条线:
预测一步
造出另一种
替你办事
那块「闻花生」的芯片,
展示了哪个核心理念?
它教「原则」,
不教「方法」
传统 AI 课是 15 周、一周一个算法,盯着模型本身。这门课不一样——它教你思考的原则,让你以后能为自己的新问题设计方案。原则就是一条完整流水线:
怎么收集
怎么改造
成没成功
哪些顾虑
整学期分四大模块
先把这张地图记住,往后每一讲你都知道自己「走到哪了」。每块约 3–4 周:
AI 基础
数据 → 模型架构 → 学习与泛化
多模态 AI 基础
模态为何相连、如何学到连接、融合与跨模态迁移
大模型与现代 AI
预训练、微调、大型多模态、生成式
交互式 AI
多步推理 → 具身 AI → 人机交互安全
这门课和「传统机器学习入门课」
最大的不同是?
怎么算分:
40% 讨论 + 60% 项目
这是一门「研究型」课,不是刷题课。成绩两大块:
- 阅读 + 讨论 约 7 次论文阅读,周四分组讨论、互相批判观点
- 研究项目 像写一篇 AI 论文:开题 10% → 中期 50% → 终期 25% → 双周进度 10%
读同一篇论文,
扮 7 种角色
Paul 让学生扮不同身份读论文——这是训练批判思维的妙招。挑你喜欢的,读任何资料都能用:
挑优缺点、找错误
放进历史脉络看
提新想法新方向
说服老板「能赚钱」
怎么快速做 demo
追查作者为何做它
翻卡自测
先看问题,在脑子里答一遍,再点开核对。「先回忆、后核对」比直接看答案记得牢约 2 倍。
把今天的珠子,
串成一条线
这门课要让 AI 感知一切模态(闻花生、触觉机器人);它会做三件事:感知 → 生成 → 行动(自动网购);它教的是 原则(数据→架构→评估→部署)而非算法;整学期分 四大模块;玩法是 40% 讨论 + 60% 研究项目。
第 1 讲 · 完成
你已经掌握了整门课的地图和玩法。下一讲将进入「AI 研究入门」——怎么读论文、找想法、快速验证。
视频原声 © MIT Media Lab / Paul Liang · 中文讲解与交互按脑科学记忆原理编排