DeepSeek有多牛,我们已经不必介绍了吧,它的出现,在美国科技界引发了巨大震动,因为它证明了即使成本低廉,AI也可以拥有强大的性能。
微软首席执行官对这款来自中国的大模型DeepSeek进行了评价,认为它具有真正的创新性。
“DeepSeek-R1模型目前已经可以通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快将在Copilot+电脑上运行。”纳德拉表示。
纳德拉指出DeepSeek“确实有一些创新之处”,并认为AI成本的降低是大势所趋:“缩放定律(Scaling Law)在预训练和推理时间计算中不断积累。多年来,我们已经见证了AI训练和推理效率的显著提升。在推理方面,我们通常看到每一代硬件的性价比提升2倍以上,每一代模型的性价比提升10倍以上。”
在此之前,美国总统特朗普已经表示,DeepSeek给美国敲响了警钟。
此外,值得关注都是国外有个老哥,用树莓派成功运行了DeepSeek,让高高在上的AI“落入凡间”!
让我们来具体了解一下吧。以下内容来自国外博主Jeff Geerling的自述。
除了以 1% 的资源击败 OpenAI 这一令人尴尬的事实外,DeepSeek 的模型还具有另一个重要特性:它能够提炼其他模型,使其在较慢的硬件上运行得更好。这意味着即使是树莓派这样的小型设备,也可以运行高质量的本地 Quen AI 模型,并且效果更佳。
OpenAI 的核心优势在于其对庞大能源和 GPU 资源的掌控,这些资源是训练和运行大型 AI 模型所必需的。然而,如果任何人都能购买一个 GPU 并免费运行足够好的模型,那么 OpenAI 的这一优势将不复存在。
尽管如此,耸人听闻的头条新闻并没有讲述全部故事。虽然树莓派可以技术上运行 DeepSeek R1,但这与 DeepSeek R1 671B(一个 400GB 的模型)是不同的。真正能够击败 ChatGPT 的模型,仍然需要大量的 GPU 计算能力。不过,最大的区别在于,如果你有几块 3090 GPU,你可以在家里运行它,而无需向 OpenAI 支付使用其精美模型的费用。你可以直接安装 Llama,下载 DeepSeek,并尽情使用。即使你没有很多 GPU,你也可以在任何拥有足够 RAM 的计算机上运行 DeepSeek。
例如,它可以在 192.4 安培的1台服务器上运行 DeepSeek 671B,速度大约为每秒 4 个标记。虽然速度不算快,但这种服务器的价格也不会高达一万美元,且其功耗仅几百瓦特,这已经非常出色了。然而,像这样的嘈杂服务器不太可能出现在每个人的客厅里,但树莓派却可以。
让我们来看看较小的 14B 模型在树莓派上是如何运行的。它不会打破任何速度记录。在测试不同的提示时,速度大约为每秒 1.2 个标记。虽然可以运行,但如果想要一个像橡胶鸭调试或提供下一个 YouTube 视频标题想法的聊天机器人,这样的速度不太好玩。
不过,我们可以通过添加一块外接显卡来大大加快速度,因为 GPU 和其上的 VRAM 比 CPU 和系统内存快得多。作者已经用 AMD W7700 显卡进行了测试,该显卡拥有 16GB 的快速 VRAM。只要能将整个 AI 模型放入其中,它的速度肯定比任何 CPU 都要快。事实也确实如此,作者能够获得每秒 20 到 50 个标记的速度,具体取决于正在执行的工作类型。这是交互会话的原始输出结果,通过查看 NVTop,可以看到所有这些处理都在 GPU 上进行。如果运行 LamoBench,它报告每秒 24 到 54 个标记。而这块显卡甚至不是针对 LLMs 设计的。如果感兴趣,还可以更快。
今年,AMD GPU 和新的 Intel 开源驱动程序在 ARM 板上运行 GPU 方面也取得了一些进展。Nvidia 也可能会有所突破。此外,作者还拥有 Orion 06、CM5 ITX 主板和 Hi5 Premiere P550,所有这些主板都具有完整的 Bi16 PCIe 插槽。因此,即使“Linux 桌面时代”永远不会到来,至少我们会得到定制的 ARM 和 RISC-V PC。
人工智能仍然处于巨大的泡沫阶段。DeepSeek 发布后,Nvidia 的市值在一天内暴跌了超过 5000 亿美元。但他们的股价目前仍然是 2023 年的八倍多,而且现在没有人对 AI 降低热情。作者认为唯一的好处是,人们可能会意识到我们不需要将世界超过一半的能源投入到帮助计算机解决数万亿次乘法运算中,以便生成另外一千个中等品质的 Web 应用。另一个收获是人工智能模型对 Winnie the Pooh 的身份产生了新的困惑。
DeepSeek的成功,让我们看到了中国在AI领域的巨大潜力。它不仅打破了传统巨头的技术垄断,还为全球科技发展提供了新的思路和方向。中国AI的崛起,不仅仅是技术的进步,更是智慧的传承与创新的延续。它让我们相信,即使在资源有限的情况下,通过不懈的努力和创新,也能创造出令人瞩目的成就。
DeepSeek的另外一个意义是让各家企业能够绕开ChatGPT,因为当前很多AI都或多或少地“参考”了ChatGPT,一旦其出现啥问题,那影响可就比较大了。而现在企业可以选择我们自己的DeepSeek了,这也就是DeepSeek的最大成功之处!
接下来,需要忙起来的应该就是国外这些IT巨头了吧!
本文由 计算杂谈 作者:云中子 发表,转载请注明来源!