Claude、ChatGPT、Grok、Midjourney国内镜像版

支持 o3 & o4-mini Claude 3.7 sonnet DeepSeek Midjourney
无需魔法 无需担心封号 价格便宜 无降智版本 官网UI隐私聊天

为什么还要每月支付20美元?现在就来体验更便宜、更方便的AI助手!

AI 进化和发展的速度已经超出了大众对它的预期

普通人都快跟不上了

不得不说,现在 AI 进化和发展的速度已经超出了大众对它的预期。

我觉得用快速已经不能来形容这种变化,用疯狂也不为过,而且简直是太疯狂了。

前几天我聊了 OpenAI 最新发布的文生视频模型 Sora,根据 Prompt 一次性生成 60 秒的视频已经吊打之前同类产品。

自从 ChatGPT 进化到 GPT-4 以来,很多人已经见识过或使用过它的能力,但这还不是目前最强的。

Sora 通过视频制作能力抢了舆论风头,但还有一家巨头的大模型我认为也值得关注,那就是谷歌的 Gemini。

谷歌发布了最新的 Gemini 1.5,其显著特点就是支持最多 100 万 token 上下文,这个能力明显强于 GPT-4 Turbo。

AI 进化和发展的速度已经超出了大众对它的预期第1张

简单理解 token 上下文,就是你提交给大模型的信息池,大模型会基于这个信息池来理解你的提示词并给出更全面、准确和相关度更高的回答。

这个过程跟现实世界其实是一样的,如果你去问一个物理教授牛顿力学该如何理解,肯定比问一个物理系大一学生更准确,因为前者掌握的上下文更全面和充分。

理解了 token 上下文,那谷歌的 Gemini 1.5 模型能具体干嘛呢?

比如,支持一次性处理 1 小时的视频、11 小时的音频、3 万行代码库、以及包含 70 万个单词的文本库等。

这么一来,当你使用大模型去解决问题的时候,它知道的越多,你得到的答案也越准确。

我看了谷歌在 Gemini 官网放出来的测试 demo,这是一个包含 69 万 token 的视频,上传给 Gemini 1.5 后再问它一个问题。

AI 进化和发展的速度已经超出了大众对它的预期第2张

这个问题是这样的:

从视频中找到纸条从男人口袋里拿出来的那个时刻,并告诉我一些关键信息以及对应的视频时间轴。

经过模型运算后给出了答案,时间轴是 12:01。然后在原视频里去查找这个时间轴,果然符合问题的设定。

AI 进化和发展的速度已经超出了大众对它的预期第3张

还没完。

接着测试人员随手画了一张图,然后让 Gemini 从视频中寻找这个画面并给出具体的视频时间轴。

经过基于 token 上下文的学习和检索后,Gemini 给出了答案,时间轴是 15:34。

回到原视频里去搜索这个时间轴,正好定位到视频的这一帧。

AI 进化和发展的速度已经超出了大众对它的预期第5张

有了这种能力,大模型就可以帮我们完成很多原本需要花时间精力的工作,效率直接拉满。

或许,这也是为什么有声音说 AI 大模型的出现堪比工业革命的原因。

不管是蒸汽机、电、计算机以及 AI,都是对社会生产力的极大提升,因此也会催生很多变化。

我还看了国外大佬对 Gemini 1.5 的一个有趣测试,上传一段由 Sora 生成的视频并让它判断这是不是 AI 生成的。

结果,Gemini 给出了准确的判断,还提供了充分的依据。

不仅是 Gemini 1.5 带来的进化,还有这几天比较火的另一款大模型产品 Groq。

AI 进化和发展的速度已经超出了大众对它的预期第6张

Groq 的显著特点就是快,支持每秒 500 个 token 的输出,比 Gemini 快 10 倍,比 GPT-4 快 18 倍。

这个速度,号称是目前世界上最快的 LLM(Large Language Model)大语言模型。

Groq 之所以能做到这一点,完全凭借他们自研的 LPU,可以对标理解 GPT。

都知道大模型背后的硬件支撑是 GPU,英伟达在这件事上已经赚得盆满钵满,很多大公司也都在大量采购价格高昂的 GPU。

而 Groq 自研的 LPU 号称速度是英伟达 GPU 的 10 倍,价格是 2 万美元一张。

AI 进化和发展的速度已经超出了大众对它的预期第7张

可以看到,不管是软件还是硬件层面的发展,AI 都在以几乎疯狂的速度迭代,而且超出很多人的预期。

这种疯狂背后,更多的是对未来的想象,有人相信、有人看到、有人触摸。

对于我们普通人来说,至少不能不接触,要去试着理解,去尝试,甚至去学着使用。

我每天都在学习和接触跟 AI 相关的知识和信息,也在跟这个圈子里的一线从业者交流,去体验新产品,研究新技术,其实挺有乐趣的。

如果你平时信息渠道有限,那可以保持关注我,因为之后我会多分享这方面的最新信息。

AI资源采购

Gemini 1.5:最高支持100万tokens,超长上下文有什么用?

2024-2-21 18:04:16

AI资源采购

李一舟的成功你学不会

2024-2-21 18:22:19

Claude、ChatGPT、Grok、Midjourney国内镜像版

支持 o3 & o4-mini Claude 4 DeepSeek Midjourney
无需魔法 无需担心封号 价格便宜 无降智版本 官网UI隐私聊天

为什么还要每月支付20美元?现在就来体验更便宜、更方便的AI助手!

立即体验