Feb 27, 2024 7 min read Podcast

INDIGO TALK / AI 创业的差异与 Sora 的世界模拟 - EP11

聊聊中美 AI 创业的差异、火爆的 Sora 与 Vision Pro 还有日本市场与远程团队

INDIGO TALK 第十一期，邀请了 Hallidai 的创始人 Neethan 还有老朋友棕榈资本的李厚明，一起来聊中美 AI 创业的差异以及最近爆火的 Sora 和 Vision Pro，AI 会如何理解世界、计算不可约化与世界的模拟。这也是第一次和嘉宾在一起线下录制，因为在东京 Remote Working，所以聊到了日本市场的特点和 AI 时代的远程创业团队！

音频播客

Apple Podcast & Spotify

小宇宙播客 - Indigo Talk - EP11

本期嘉宾

李厚明（棕榈资本创始人）

Neethan（Hallid.ai 创始人）

Indigo（数字镜像博主）

时间轴

01:08 开场介绍 - 为什么在东京？以及两位嘉宾介绍

05:18 Neethan 分享硅谷的 AI 创业

08:52 厚明分享中国的 AI 创业

14:05 Indigo 的总结与日本市场

15:50 中美创业文化的差异

27:35 日本市场的特点（出海第一站）

28:33 大力出奇迹的 Sora

30:24 什么是理解？

34:48 计算不可约化

37:52 Vision Pro 与 Sora 生成的平行世界

43:36 只用视觉数据能模拟世界么？

45:20 AGI 的多形态

50:36 大语言模型对语言的冲击

52:01 对 Digital Nomad 的实践 - AI 时代提升团队效率和保持团队小型化的机会

1:00:04 团队全球化与中国团队的机会

对谈纲要（TL;NR）

以下纲要由 maimo.ai 整理生成

Indigo Talk 特别对谈

本次对谈是 Indigo Talk 第一次与访谈嘉宾面对面进行；
参与本次对谈的有三次参加 Indigo Talk 的李厚明，以及首次参与的 Neethan，后者在硅谷从事 AI 产品创业，之前就职于湾区 Amazon Alexa 团队；
对谈地点位于东京的共享工作空间 Basis Point，位于商务中心新桥 Shinbashi；
Neethan 带领团队在东京进行远程工作实践，体现 Digital Nomad 理想；

AI 技术发展讨论

讨论了过去一年 AI 技术的发展，特别是在大模型和 Agent 方面的进展；
提到了 Sora，一种新的图像生成模型，以及它在视频生成方面的应用；
讨论了 RAG（Retrieval-Augmented Generation）技术的成熟和可能性；
硅谷的 AI 发展重点在于大模型、开源模型和 Agent，而中国则在 C 端应用上更为激进。

中国与硅谷的 AI 创业对比

中国的 AI 创业更倾向于实用主义，快速找到应用场景并实现产品化；
硅谷的 AI 创业更注重技术创新和基础架构建设；
中国创业者在 C 端应用探索上比硅谷更为激进，例如 kimi 和其他 AI 陪伴产品；
讨论了文化差异对 AI 创业的影响，中国更注重从 1 到 100 的快速发展，而硅谷则从 0 到 1 的创新；

日本市场的 AI 应用前景

日本市场对 AI 技术的兴趣高涨，尤其是在民用级别的应用上；
日本用户对 AI 产品的付费意愿强，为中国创业者提供了出海的良好机会；
讨论了日本错过移动智能手机时代，对 AI 技术的重视可能是对错过时代的补偿；
日本的 AI 创业环境和孵化器正在活跃，为 AI 技术的应用和发展提供了新的市场；

Sora、Vision Pro、计算不可约与 AGI

讨论了 Sora 图像生成模型的效果，它通过大量高质量数据训练，可以生成高清视频，运用了 transformer 和 diffusion 模型的混合结构。表现出了很好的物理效果和细节；
Vision Pro 和 Sora 的结合使用，可能旨在实现人脑与机器之间的直接交互，甚至是思维直接转化为视觉体验的技术；讨论中提出了哲学性的问题，即当技术达到一定水平，用户可能难以区分真实世界与通过设备生成的虚拟世界之间的差异；
探讨了 AI 是否能“理解”世界的问题。提出理解可能更多是底层对规则和规律的把握，不需要高层的意识形态。GPT 模型通过语言也可以表示对很多规律的理解；
讨论了计算的不可约性，现实世界的复杂度无法简化为一个公式计算。未来科学可能进化为依靠大规模参数和数据的 AI 科学，通过暴力计算模拟现实；
讨论了关于 AGI 的多个方向，既有尝试与人类价值观对齐的AGI，也有探索独立于人类的物理世界规律和宇宙模拟的AGI；
关于语言问题，翻译工具的进步也许会对语言多样性产生积极影响。AI 会使知识主要以英语体现；
AI 研究正朝多个方向并进，都在试图接近 AGI 的边缘，但可能永远也无法完整模拟复杂的现实世界；

Digital Nomad 实践与理想

团队成员来自不同地区，通过远程工作模式合作；
讨论了 Digital Nomad 理想在当前 AI 技术发展下的可行性；
远程工作模式要求高效的沟通和协作工具，AI 技术提供了支持；
团队周期性面对面会议，以增强信任和共识；

AI 时代的个人与团队能力

AI 时代可以看作是一个新能源和基础设施的时代，大公司提供基础能力，小公司将其应用到产品中。团队应该“挂在”AI能力之上；
小团队模式在 AI 时代更为灵活和高效；
中国团队可以利用效率优势,与全球团队混合合作,实现 24 小时工作；
个人在 AI 时代需要提高判断力、选择力、决策力，依靠人类独特的历史积淀做出最适合人类的选择。

补充阅读

解释 OpenAI Sora 训练和工作原理的最佳推文

Sora's video quality seems impossible so I dug into how it works under the hood

it uses both diffusion (starting with noise, refining towards a desired video) and transformer architectures (handling sequential video frames)

read on 🧵 pic.twitter.com/dCJkDi33Kz
— brett goldstein (@thatguybg) February 20, 2024

Guillaume Verdon: Beff Jezos, E/acc Movement, Physics, Computation & AGI

关于 Wolfram 的计算不可约化

传统的科学，是希望能够建立一套定律的系统，能够解释任何观测到的数据。也就是说用定律经过演绎得到的结果和实验得到的结果一致。而 Wolfram 所写的《A New Kind of Science》，是指这样的定律系统无法建立，如果我们想要得到结果，就必须进行模拟。所以在不可能进行归约的情况下，就只能对世界进行分类讨论，也就是模拟，这也就是 Wolfram 的核心思想。

音频播客

本期嘉宾

时间轴

对谈纲要（TL;NR）

补充阅读

You might also like...

当智力开始廉价 / 一个大厂工程师眼中的 AI 冲击波 - INDIGO TALK EP49

INDIGO TALK / AI 让你更像你 - EP48

在 AI 急速进化的此刻，我们要对齐什么 / INDIGO 月末直播 2026.04

INDIGO TALK / 知道"什么是好的"，比能写出好的更难 - EP47

AGENT 时代的投资与生存心法 / Rewired Meetup 分享回放