人工智能的世界正在快速发展,而这场革命的前沿正是大型语言模型(LLMs)。这些强大的工具能够以惊人的准确度理解、生成和操纵人类语言。从撰写引人入胜的内容到驱动复杂的聊天机器人,LLMs 正在改变我们与技术互动的方式。

然而,访问这些先进模型的能力通常需要付出高昂的代价。幸运的是,越来越多的供应商正在提供免费访问或试用额度,为开发者、研究人员和爱好者敞开了大门,使他们能够在不倾家荡产的情况下探索 LLMs 的潜力。本文深入探讨了这些基于免费和试用的 LLM API 资源的概况,提供全面的指南,帮助您了解您的选择,并充分利用这些宝贵的机遇。请注意,滥用这些服务可能会导致失去它们。此外,此列表明确排除了任何非合法的服务。

免费层级:不花一分钱探索 LLMs

一些供应商慷慨地提供对其 LLM API 的完全免费访问,尽管存在一定的限制。这些免费层级是实验、原型设计和小规模项目的绝佳起点。让我们探索一下这个领域的一些主要参与者:

  • OpenRouter: OpenRouter 作为一个多功能平台脱颖而出,提供对各种开源 LLM 的访问。虽然它施加了每分钟 20 个请求和每天 200 个请求的限制,但它提供了访问 Gemma、Llama、Mistral 和其他模型的入口。这使其成为希望尝试不同模型并比较其性能的开发者的绝佳选择。一些可用的模型包括 Gemma 2 9B InstructLlama 3 8B InstructMistral 7B InstructPhi-3 Mini 128k Instruct
  • Google AI Studio: 对于那些对 Google 的尖端 Gemini 模型感兴趣的人来说,Google AI Studio 是理想之选。它提供对各种 Gemini 迭代版本的免费访问,包括 Gemini 1.5 Flash 和 Gemini 1.5 Pro,每个版本都有自己的一组速率限制。虽然在英国/瑞士/欧洲经济区/欧盟以外使用的数据可能被用于训练目的,但该平台为使用 Google 最新的语言建模进展提供了宝贵的机会。可用模型包括 Gemini 1.5 FlashGemini 1.5 ProGemini 1.0 Pro
  • Mistral AI: Mistral AI 以其高性能的开源模型在 AI 社区引起轰动。他们提供两个平台:“La Plateforme",其免费层级需要选择加入数据训练和电话号码验证;以及 "Codestral",目前可以免费使用,也需要电话号码验证。这些平台提供对各种 Mistral 模型的访问,每个模型都有特定的速率限制,以满足通用语言任务和代码生成的需求。
  • HuggingFace Serverless Inference: 作为开源 AI 的中心,HuggingFace 提供了一个无服务器推理 API,允许用户免费访问各种开源模型。虽然它将使用限制在小于 10GB 的模型(有一些例外),但它仍然为实验提供了一个丰富的生态系统。拥有免费帐户的用户每天最多可以进行 1,000 个请求
  • SambaNova Cloud: SambaNova Cloud 提供对多个版本的 Llama 和 Qwen 模型的访问。虽然它没有明确说明任何特定的使用限制,但它确实对每个模型施加了速率限制,例如 Llama 3.1 8B 每分钟 30 个请求,Llama 3.1 70B 每分钟 20 个请求。
  • Cerebras: Cerebras 提供对 Llama 3.1 8B 和 Llama 3.3 70B 模型的免费访问,免费层级限制为 8K 上下文。这两个模型都具有每分钟 30 个请求,每分钟 60,000 个 tokens,每小时 900 个请求,每小时 1,000,000 个 tokens,每天 14,400 个请求和每天 1,000,000 个 tokens 的速率限制。
  • Groq: Groq 有各种模型可供免费使用。这包括不同版本的 Llama、Gemma 和 Whisper,每个版本都有不同的速率限制。例如,Llama 3 70B 的限制为每天 14,400 个请求和每分钟 6,000 个 tokens,而 Gemma 2 9B Instruct 允许每天 14,400 个请求和每分钟 15,000 个 tokens。
  • Scaleway Generative APIs: Scaleway 目前处于免费 Beta 阶段,提供诸如 Llama 3.1 70B Instruct、Llama 3.1 8B Instruct 和 Mistral Nemo 2407 等模型。大多数模型的速率限制为每分钟 300 个请求和每分钟 100,000 个 tokens。
  • OVH AI Endpoints: OVH 也处于免费 Beta 阶段,提供一系列模型,包括 CodeLlama、Codestral、Llama、Llava、Mathstral、Mistral 和 Mixtral。此平台上的所有模型都限制为每分钟 12 个请求。
  • Together AI: Together AI 有两个免费模型:Llama 3.2 11B Vision InstructLlama 3.3 70B Instruct。但是,速率限制未指定。
  • Cohere: Cohere 对其 Command-R 和 Command-R+ 模型提供有限的免费访问,共享速率限制为 每分钟 20 个请求和每月 1,000 个请求
  • GitHub Models: GitHub 免费提供各种模型。但是,它具有极其严格的输入/输出 token 限制,并且 速率限制 取决于 Copilot 订阅层级(免费/Pro/Business/Enterprise)。
  • Cloudflare Workers AI: Cloudflare 提供各种模型,免费配额为 每天 10,000 个 tokens。这包括 Deepseek、Falcon、Gemma、Llama、Mistral 等模型。
  • Google Cloud Vertex AI: Google Cloud Vertex AI 免费提供多个模型,但需要严格的付款验证。免费模型包括 Llama 3.1 70B Instruct、Llama 3.1 8B Instruct 和 Llama 3.2 90B Vision Instruct,在预览期间免费。此外,还有实验性的 Gemini 模型可免费使用。

试用额度:体验 LLMs

除了免费层级之外,许多供应商还提供试用额度,允许用户通过有限的免费使用来探索他们的服务。这些额度通常在注册或添加付款方式后授予,让您在没有任何前期成本的情况下体验平台的全部功能。

  • Together: 虽然也提供一些免费模型,但当您添加付款方式时,Together 提供 1 美元的额度。这允许访问更广泛的开源模型。
  • Fireworks: Fireworks 提供 1 美元的试用额度,使用户能够探索其平台上的各种开源模型。
  • Unify: 当添加付款方式时,Unify 提供 5 美元的额度。该平台路由到其他供应商,提供对各种开源和专有模型的访问,包括来自 OpenAI、Gemini、Anthropic、Mistral 和 Perplexity 的模型。
  • NVIDIA NIM: NVIDIA NIM 提供 1,000 次 API 调用,为期一个月,从而可以访问各种开源模型。
  • Baseten: Baseten 赠送 30 美元的试用额度,允许用户访问任何受支持的模型并按计算时间付费。
  • Nebius: Nebius 提供 1 美元的试用额度,从而可以访问各种开源模型。
  • Novita: Novita 提供 0.5 美元的试用额度,可用于探索各种开源模型。
  • Hyperbolic: Hyperbolic 以慷慨的 10 美元试用额度脱颖而出,允许访问包括 DeepSeek、Hermes、Llama、Pixtral 和 Qwen 在内的各种模型。
  • AI21: AI21 提供 10 美元的额度,为期三个月,从而可以访问其 Jamba 和 Jurassic-2 模型。
  • Upstage: Upstage 也提供 10 美元,为期三个月,从而可以访问其 Solar Pro 和 Solar Mini 模型。
  • NLP Cloud: NLP Cloud 提供 15 美元的试用额度,但需要电话号码验证。这提供了对各种开源模型的访问。
  • 阿里云 (国际) Model Studio: 阿里云 在每个模型的基础上提供 token/时间限制的试用,从而可以访问各种开源和专有的 Qwen 模型。

充分利用免费和试用资源

有了如此多的选择,战略性地使用这些免费和试用资源至关重要。以下是一些最大化您的体验的技巧:

  1. 明确您的需求: 在深入研究之前,请考虑您项目的具体需求。不同的模型擅长不同的任务,因此选择合适的模型至关重要。
  2. 比较速率限制: 密切关注每个供应商施加的速率限制。这些限制可能会严重影响您项目的可行性,特别是如果您需要高吞吐量或大规模处理。
  3. 探索不同的模型: 利用 OpenRouter 和 HuggingFace 等平台提供的多样性来尝试不同的模型,并找到最适合您需求的模型。
  4. 明智地利用试用额度: 在承诺付费订阅之前,使用试用额度来测试平台的全部功能。这使您可以评估服务的性能、易用性和整体价值。
  5. 遵守使用政策: 请记住,这些免费和试用资源是作为一种特权提供的。遵守使用政策,避免任何可能被视为滥用的行为。

结论

免费和基于试用的 LLM API 访问的可用性对于 AI 社区来说是一个游戏规则改变者。通过消除准入的经济障碍,这些资源使开发者、研究人员和爱好者能够探索语言模型的巨大潜力,从而促进创新并加速突破性应用的开发。无论您是构建聊天机器人、尝试内容生成还是进行前沿研究,这些平台都为您的 LLM 世界之旅提供了一个宝贵的起点。所以,深入探索,尽情实验,并释放语言模型的强大力量,而无需花费一分钱。