AI 进化和发展的速度已经超出了大众对它的预期

普通人都快跟不上了

不得不说，现在 AI 进化和发展的速度已经超出了大众对它的预期。

我觉得用快速已经不能来形容这种变化，用疯狂也不为过，而且简直是太疯狂了。

前几天我聊了 OpenAI 最新发布的文生视频模型 Sora，根据 Prompt 一次性生成 60 秒的视频已经吊打之前同类产品。

自从 ChatGPT 进化到 GPT-4 以来，很多人已经见识过或使用过它的能力，但这还不是目前最强的。

Sora 通过视频制作能力抢了舆论风头，但还有一家巨头的大模型我认为也值得关注，那就是谷歌的 Gemini。

谷歌发布了最新的 Gemini 1.5，其显著特点就是支持最多 100 万 token 上下文，这个能力明显强于 GPT-4 Turbo。

简单理解 token 上下文，就是你提交给大模型的信息池，大模型会基于这个信息池来理解你的提示词并给出更全面、准确和相关度更高的回答。

这个过程跟现实世界其实是一样的，如果你去问一个物理教授牛顿力学该如何理解，肯定比问一个物理系大一学生更准确，因为前者掌握的上下文更全面和充分。

理解了 token 上下文，那谷歌的 Gemini 1.5 模型能具体干嘛呢？

比如，支持一次性处理 1 小时的视频、11 小时的音频、3 万行代码库、以及包含 70 万个单词的文本库等。

这么一来，当你使用大模型去解决问题的时候，它知道的越多，你得到的答案也越准确。

我看了谷歌在 Gemini 官网放出来的测试 demo，这是一个包含 69 万 token 的视频，上传给 Gemini 1.5 后再问它一个问题。

这个问题是这样的：

从视频中找到纸条从男人口袋里拿出来的那个时刻，并告诉我一些关键信息以及对应的视频时间轴。

经过模型运算后给出了答案，时间轴是 12:01。然后在原视频里去查找这个时间轴，果然符合问题的设定。

还没完。

接着测试人员随手画了一张图，然后让 Gemini 从视频中寻找这个画面并给出具体的视频时间轴。

经过基于 token 上下文的学习和检索后，Gemini 给出了答案，时间轴是 15:34。

回到原视频里去搜索这个时间轴，正好定位到视频的这一帧。

有了这种能力，大模型就可以帮我们完成很多原本需要花时间精力的工作，效率直接拉满。

或许，这也是为什么有声音说 AI 大模型的出现堪比工业革命的原因。

不管是蒸汽机、电、计算机以及 AI，都是对社会生产力的极大提升，因此也会催生很多变化。

我还看了国外大佬对 Gemini 1.5 的一个有趣测试，上传一段由 Sora 生成的视频并让它判断这是不是 AI 生成的。

结果，Gemini 给出了准确的判断，还提供了充分的依据。

不仅是 Gemini 1.5 带来的进化，还有这几天比较火的另一款大模型产品 Groq。

Groq 的显著特点就是快，支持每秒 500 个 token 的输出，比 Gemini 快 10 倍，比 GPT-4 快 18 倍。

这个速度，号称是目前世界上最快的 LLM（Large Language Model）大语言模型。

Groq 之所以能做到这一点，完全凭借他们自研的 LPU，可以对标理解 GPT。

都知道大模型背后的硬件支撑是 GPU，英伟达在这件事上已经赚得盆满钵满，很多大公司也都在大量采购价格高昂的 GPU。

而 Groq 自研的 LPU 号称速度是英伟达 GPU 的 10 倍，价格是 2 万美元一张。

可以看到，不管是软件还是硬件层面的发展，AI 都在以几乎疯狂的速度迭代，而且超出很多人的预期。

这种疯狂背后，更多的是对未来的想象，有人相信、有人看到、有人触摸。

对于我们普通人来说，至少不能不接触，要去试着理解，去尝试，甚至去学着使用。

我每天都在学习和接触跟 AI 相关的知识和信息，也在跟这个圈子里的一线从业者交流，去体验新产品，研究新技术，其实挺有乐趣的。

如果你平时信息渠道有限，那可以保持关注我，因为之后我会多分享这方面的最新信息。

{{userData.name}}已认证

AI 进化和发展的速度已经超出了大众对它的预期

Gemini 1.5：最高支持100万tokens，超长上下文有什么用？

李一舟的成功你学不会

ChatGPT Pro代充值&成品账号、无限次数提问 | 独享一个月

ChatGPT Team账号购买 | 可自己邀请一个人

ChatGPT Team团队版 | 5个人共享合租、自动发货 | 保证能用30天

gpt4o账号共享 | chatgpt4共享账号合租，3个人合租一个月 | 自动发货

chatgpt4共享号 | 支持最新GPT4o、5个人合租使用一个月 | 自动发货

gpt4o账号购买 | 一人独享、独家质保30天，支持GPT4o

ChatGPT如何越狱（chatgpt越狱新版咒语提示词大全）

你的ChatGPT变笨了吗？针对智商下降和功能缺失的原因解析及解决办法

ChatGPT和Perplexity哪个更好？对比评测

OpenAI 付费全攻略，一篇讲完(亲测有效)

chatgpt打不开网站的原因（各种疑难杂症解决，此贴长期更新）

接码平台推荐（亲测可以注册Telegram ,Facebook,ChatGPT）

本站所有商品

ChatGPT论文专栏

微信人工客服