7 min read

INDIGO TALK / AI 创业的差异与 Sora 的世界模拟 - EP11

聊聊中美 AI 创业的差异、火爆的 Sora 与 Vision Pro 还有日本市场与远程团队
INDIGO TALK / AI 创业的差异与 Sora 的世界模拟 - EP11

INDIGO TALK 第十一期,邀请了 Hallidai 的创始人 Neethan 还有老朋友棕榈资本的李厚明,一起来聊中美 AI 创业的差异以及最近爆火的 Sora 和 Vision Pro,AI 会如何理解世界、计算不可约化与世界的模拟。这也是第一次和嘉宾在一起线下录制,因为在东京 Remote Working,所以聊到了日本市场的特点和 AI 时代的远程创业团队!

音频播客

Apple Podcast & Spotify

小宇宙播客 - Indigo Talk - EP11

本期嘉宾

李厚明(棕榈资本创始人)

Neethan(Hallid.ai 创始人)

Indigo(数字镜像博主)

时间轴

01:08 开场介绍 - 为什么在东京?以及两位嘉宾介绍

05:18 Neethan 分享硅谷的 AI 创业

08:52 厚明分享中国的 AI 创业

14:05 Indigo 的总结与日本市场

15:50 中美创业文化的差异

27:35 日本市场的特点(出海第一站)

28:33 大力出奇迹的 Sora

30:24 什么是理解?

34:48 计算不可约化

37:52 Vision Pro 与 Sora 生成的平行世界 

43:36 只用视觉数据能模拟世界么?

45:20 AGI 的多形态 

50:36 大语言模型对语言的冲击

52:01 对 Digital Nomad 的实践 - AI 时代提升团队效率和保持团队小型化的机会

1:00:04 团队全球化与中国团队的机会

对谈纲要(TL;NR)


以下纲要由 maimo.ai 整理生成

Indigo Talk 特别对谈

  • 本次对谈是 Indigo Talk 第一次与访谈嘉宾面对面进行;
  • 参与本次对谈的有三次参加 Indigo Talk 的李厚明,以及首次参与的 Neethan,后者在硅谷从事 AI 产品创业,之前就职于湾区 Amazon Alexa 团队;
  • 对谈地点位于东京的共享工作空间 Basis Point,位于商务中心新桥 Shinbashi;
  • Neethan 带领团队在东京进行远程工作实践,体现 Digital Nomad 理想;

AI 技术发展讨论

  • 讨论了过去一年 AI 技术的发展,特别是在大模型和 Agent 方面的进展;
  • 提到了 Sora,一种新的图像生成模型,以及它在视频生成方面的应用;
  • 讨论了 RAG(Retrieval-Augmented Generation)技术的成熟和可能性;
  • 硅谷的 AI 发展重点在于大模型、开源模型和 Agent,而中国则在 C 端应用上更为激进。

中国与硅谷的 AI 创业对比

  • 中国的 AI 创业更倾向于实用主义,快速找到应用场景并实现产品化;
  • 硅谷的 AI 创业更注重技术创新和基础架构建设;
  • 中国创业者在 C 端应用探索上比硅谷更为激进,例如 kimi 和其他 AI 陪伴产品;
  • 讨论了文化差异对 AI 创业的影响,中国更注重从 1 到 100 的快速发展,而硅谷则从 0 到 1 的创新;

日本市场的 AI 应用前景

  • 日本市场对 AI 技术的兴趣高涨,尤其是在民用级别的应用上;
  • 日本用户对 AI 产品的付费意愿强,为中国创业者提供了出海的良好机会;
  • 讨论了日本错过移动智能手机时代,对 AI 技术的重视可能是对错过时代的补偿;
  • 日本的 AI 创业环境和孵化器正在活跃,为 AI 技术的应用和发展提供了新的市场;

Sora、Vision Pro、计算不可约与 AGI

  • 讨论了 Sora 图像生成模型的效果,它通过大量高质量数据训练,可以生成高清视频,运用了 transformer 和 diffusion 模型的混合结构。表现出了很好的物理效果和细节;
  • Vision Pro 和 Sora 的结合使用,可能旨在实现人脑与机器之间的直接交互,甚至是思维直接转化为视觉体验的技术;讨论中提出了哲学性的问题,即当技术达到一定水平,用户可能难以区分真实世界与通过设备生成的虚拟世界之间的差异;
  • 探讨了 AI 是否能“理解”世界的问题。提出理解可能更多是底层对规则和规律的把握,不需要高层的意识形态。GPT 模型通过语言也可以表示对很多规律的理解;
  • 讨论了计算的不可约性,现实世界的复杂度无法简化为一个公式计算。未来科学可能进化为依靠大规模参数和数据的 AI 科学,通过暴力计算模拟现实;
  • 讨论了关于 AGI 的多个方向,既有尝试与人类价值观对齐的AGI,也有探索独立于人类的物理世界规律和宇宙模拟的AGI;
  • 关于语言问题,翻译工具的进步也许会对语言多样性产生积极影响。AI 会使知识主要以英语体现;
  • AI 研究正朝多个方向并进,都在试图接近 AGI 的边缘,但可能永远也无法完整模拟复杂的现实世界;

Digital Nomad 实践与理想

  • 团队成员来自不同地区,通过远程工作模式合作;
  • 讨论了 Digital Nomad 理想在当前 AI 技术发展下的可行性;
  • 远程工作模式要求高效的沟通和协作工具,AI 技术提供了支持;
  • 团队周期性面对面会议,以增强信任和共识;

AI 时代的个人与团队能力

  • AI 时代可以看作是一个新能源和基础设施的时代,大公司提供基础能力,小公司将其应用到产品中。团队应该“挂在”AI能力之上;
  • 小团队模式在 AI 时代更为灵活和高效;
  • 中国团队可以利用效率优势,与全球团队混合合作,实现 24 小时工作;
  • 个人在 AI 时代需要提高判断力、选择力、决策力,依靠人类独特的历史积淀做出最适合人类的选择。

补充阅读


解释 OpenAI Sora 训练和工作原理的最佳推文

Guillaume Verdon: Beff Jezos, E/acc Movement, Physics, Computation & AGI

关于 Wolfram 的计算不可约化

传统的科学,是希望能够建立一套定律的系统,能够解释任何观测到的数据。也就是说用定律经过演绎得到的结果和实验得到的结果一致。而 Wolfram 所写的《A New Kind of Science》,是指这样的定律系统无法建立,如果我们想要得到结果,就必须进行模拟。所以在不可能进行归约的情况下,就只能对世界进行分类讨论,也就是模拟,这也就是 Wolfram 的核心思想。