Claude、ChatGPT、Midjourney国内镜像版

支持 o1-preview & GPT-4o Claude 3.5 Sonnet Midjourney
无需魔法 价格便宜 无降智版本 官网UI隐私聊天

为什么还要每月支付20美元?现在就来体验更便宜、更方便的AI助手!

AI 进化和发展的速度已经超出了大众对它的预期

普通人都快跟不上了

不得不说,现在 AI 进化和发展的速度已经超出了大众对它的预期。

我觉得用快速已经不能来形容这种变化,用疯狂也不为过,而且简直是太疯狂了。

前几天我聊了 OpenAI 最新发布的文生视频模型 Sora,根据 Prompt 一次性生成 60 秒的视频已经吊打之前同类产品。

自从 ChatGPT 进化到 GPT-4 以来,很多人已经见识过或使用过它的能力,但这还不是目前最强的。

Sora 通过视频制作能力抢了舆论风头,但还有一家巨头的大模型我认为也值得关注,那就是谷歌的 Gemini。

谷歌发布了最新的 Gemini 1.5,其显著特点就是支持最多 100 万 token 上下文,这个能力明显强于 GPT-4 Turbo。

AI 进化和发展的速度已经超出了大众对它的预期第1张

简单理解 token 上下文,就是你提交给大模型的信息池,大模型会基于这个信息池来理解你的提示词并给出更全面、准确和相关度更高的回答。

这个过程跟现实世界其实是一样的,如果你去问一个物理教授牛顿力学该如何理解,肯定比问一个物理系大一学生更准确,因为前者掌握的上下文更全面和充分。

理解了 token 上下文,那谷歌的 Gemini 1.5 模型能具体干嘛呢?

比如,支持一次性处理 1 小时的视频、11 小时的音频、3 万行代码库、以及包含 70 万个单词的文本库等。

这么一来,当你使用大模型去解决问题的时候,它知道的越多,你得到的答案也越准确。

我看了谷歌在 Gemini 官网放出来的测试 demo,这是一个包含 69 万 token 的视频,上传给 Gemini 1.5 后再问它一个问题。

AI 进化和发展的速度已经超出了大众对它的预期第2张

这个问题是这样的:

从视频中找到纸条从男人口袋里拿出来的那个时刻,并告诉我一些关键信息以及对应的视频时间轴。

经过模型运算后给出了答案,时间轴是 12:01。然后在原视频里去查找这个时间轴,果然符合问题的设定。

AI 进化和发展的速度已经超出了大众对它的预期第3张

还没完。

接着测试人员随手画了一张图,然后让 Gemini 从视频中寻找这个画面并给出具体的视频时间轴。

经过基于 token 上下文的学习和检索后,Gemini 给出了答案,时间轴是 15:34。

回到原视频里去搜索这个时间轴,正好定位到视频的这一帧。

AI 进化和发展的速度已经超出了大众对它的预期第5张

有了这种能力,大模型就可以帮我们完成很多原本需要花时间精力的工作,效率直接拉满。

或许,这也是为什么有声音说 AI 大模型的出现堪比工业革命的原因。

不管是蒸汽机、电、计算机以及 AI,都是对社会生产力的极大提升,因此也会催生很多变化。

我还看了国外大佬对 Gemini 1.5 的一个有趣测试,上传一段由 Sora 生成的视频并让它判断这是不是 AI 生成的。

结果,Gemini 给出了准确的判断,还提供了充分的依据。

不仅是 Gemini 1.5 带来的进化,还有这几天比较火的另一款大模型产品 Groq。

AI 进化和发展的速度已经超出了大众对它的预期第6张

Groq 的显著特点就是快,支持每秒 500 个 token 的输出,比 Gemini 快 10 倍,比 GPT-4 快 18 倍。

这个速度,号称是目前世界上最快的 LLM(Large Language Model)大语言模型。

Groq 之所以能做到这一点,完全凭借他们自研的 LPU,可以对标理解 GPT。

都知道大模型背后的硬件支撑是 GPU,英伟达在这件事上已经赚得盆满钵满,很多大公司也都在大量采购价格高昂的 GPU。

而 Groq 自研的 LPU 号称速度是英伟达 GPU 的 10 倍,价格是 2 万美元一张。

AI 进化和发展的速度已经超出了大众对它的预期第7张

可以看到,不管是软件还是硬件层面的发展,AI 都在以几乎疯狂的速度迭代,而且超出很多人的预期。

这种疯狂背后,更多的是对未来的想象,有人相信、有人看到、有人触摸。

对于我们普通人来说,至少不能不接触,要去试着理解,去尝试,甚至去学着使用。

我每天都在学习和接触跟 AI 相关的知识和信息,也在跟这个圈子里的一线从业者交流,去体验新产品,研究新技术,其实挺有乐趣的。

如果你平时信息渠道有限,那可以保持关注我,因为之后我会多分享这方面的最新信息。

AI资源采购

Gemini 1.5:最高支持100万tokens,超长上下文有什么用?

2024-2-21 18:04:16

AI资源采购

李一舟的成功你学不会

2024-2-21 18:22:19

Claude、ChatGPT、Midjourney国内镜像版

支持 o1-preview & GPT-4o Claude 3.5 Sonnet Midjourney
无需魔法 价格便宜 无降智版本 官网UI隐私聊天

为什么还要每月支付20美元?现在就来体验更便宜、更方便的AI助手!

立即体验