解锁 LLM 的力量：免费和试用 API 访问指南

人工智能的世界正在快速发展，而这场革命的前沿正是大型语言模型（LLMs）。这些强大的工具能够以惊人的准确度理解、生成和操纵人类语言。从撰写引人入胜的内容到驱动复杂的聊天机器人，LLMs 正在改变我们与技术互动的方式。

然而，访问这些先进模型的能力通常需要付出高昂的代价。幸运的是，越来越多的供应商正在提供免费访问或试用额度，为开发者、研究人员和爱好者敞开了大门，使他们能够在不倾家荡产的情况下探索 LLMs 的潜力。本文深入探讨了这些基于免费和试用的 LLM API 资源的概况，提供全面的指南，帮助您了解您的选择，并充分利用这些宝贵的机遇。请注意，滥用这些服务可能会导致失去它们。此外，此列表明确排除了任何非合法的服务。

免费层级：不花一分钱探索 LLMs

一些供应商慷慨地提供对其 LLM API 的完全免费访问，尽管存在一定的限制。这些免费层级是实验、原型设计和小规模项目的绝佳起点。让我们探索一下这个领域的一些主要参与者：

OpenRouter： OpenRouter 作为一个多功能平台脱颖而出，提供对各种开源 LLM 的访问。虽然它施加了每分钟 20 个请求和每天 200 个请求的限制，但它提供了访问 Gemma、Llama、Mistral 和其他模型的入口。这使其成为希望尝试不同模型并比较其性能的开发者的绝佳选择。一些可用的模型包括 Gemma 2 9B Instruct、Llama 3 8B Instruct、Mistral 7B Instruct 和 Phi-3 Mini 128k Instruct。
Google AI Studio： 对于那些对 Google 的尖端 Gemini 模型感兴趣的人来说，Google AI Studio 是理想之选。它提供对各种 Gemini 迭代版本的免费访问，包括 Gemini 1.5 Flash 和 Gemini 1.5 Pro，每个版本都有自己的一组速率限制。虽然在英国/瑞士/欧洲经济区/欧盟以外使用的数据可能被用于训练目的，但该平台为使用 Google 最新的语言建模进展提供了宝贵的机会。可用模型包括 Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Pro。
Mistral AI： Mistral AI 以其高性能的开源模型在 AI 社区引起轰动。他们提供两个平台：“La Plateforme"，其免费层级需要选择加入数据训练和电话号码验证；以及 "Codestral"，目前可以免费使用，也需要电话号码验证。这些平台提供对各种 Mistral 模型的访问，每个模型都有特定的速率限制，以满足通用语言任务和代码生成的需求。
HuggingFace Serverless Inference： 作为开源 AI 的中心，HuggingFace 提供了一个无服务器推理 API，允许用户免费访问各种开源模型。虽然它将使用限制在小于 10GB 的模型（有一些例外），但它仍然为实验提供了一个丰富的生态系统。拥有免费帐户的用户每天最多可以进行 1,000 个请求。
SambaNova Cloud： SambaNova Cloud 提供对多个版本的 Llama 和 Qwen 模型的访问。虽然它没有明确说明任何特定的使用限制，但它确实对每个模型施加了速率限制，例如 Llama 3.1 8B 每分钟 30 个请求，Llama 3.1 70B 每分钟 20 个请求。
Cerebras： Cerebras 提供对 Llama 3.1 8B 和 Llama 3.3 70B 模型的免费访问，免费层级限制为 8K 上下文。这两个模型都具有每分钟 30 个请求，每分钟 60,000 个 tokens，每小时 900 个请求，每小时 1,000,000 个 tokens，每天 14,400 个请求和每天 1,000,000 个 tokens 的速率限制。
Groq： Groq 有各种模型可供免费使用。这包括不同版本的 Llama、Gemma 和 Whisper，每个版本都有不同的速率限制。例如，Llama 3 70B 的限制为每天 14,400 个请求和每分钟 6,000 个 tokens，而 Gemma 2 9B Instruct 允许每天 14,400 个请求和每分钟 15,000 个 tokens。
Scaleway Generative APIs： Scaleway 目前处于免费 Beta 阶段，提供诸如 Llama 3.1 70B Instruct、Llama 3.1 8B Instruct 和 Mistral Nemo 2407 等模型。大多数模型的速率限制为每分钟 300 个请求和每分钟 100,000 个 tokens。
OVH AI Endpoints： OVH 也处于免费 Beta 阶段，提供一系列模型，包括 CodeLlama、Codestral、Llama、Llava、Mathstral、Mistral 和 Mixtral。此平台上的所有模型都限制为每分钟 12 个请求。
Together AI： Together AI 有两个免费模型：Llama 3.2 11B Vision Instruct 和 Llama 3.3 70B Instruct。但是，速率限制未指定。
Cohere： Cohere 对其 Command-R 和 Command-R+ 模型提供有限的免费访问，共享速率限制为每分钟 20 个请求和每月 1,000 个请求。
GitHub Models： GitHub 免费提供各种模型。但是，它具有极其严格的输入/输出 token 限制，并且速率限制取决于 Copilot 订阅层级（免费/Pro/Business/Enterprise）。
Cloudflare Workers AI： Cloudflare 提供各种模型，免费配额为每天 10,000 个 tokens。这包括 Deepseek、Falcon、Gemma、Llama、Mistral 等模型。
Google Cloud Vertex AI： Google Cloud Vertex AI 免费提供多个模型，但需要严格的付款验证。免费模型包括 Llama 3.1 70B Instruct、Llama 3.1 8B Instruct 和 Llama 3.2 90B Vision Instruct，在预览期间免费。此外，还有实验性的 Gemini 模型可免费使用。

试用额度：体验 LLMs

除了免费层级之外，许多供应商还提供试用额度，允许用户通过有限的免费使用来探索他们的服务。这些额度通常在注册或添加付款方式后授予，让您在没有任何前期成本的情况下体验平台的全部功能。

Together： 虽然也提供一些免费模型，但当您添加付款方式时，Together 提供 1 美元的额度。这允许访问更广泛的开源模型。
Fireworks： Fireworks 提供 1 美元的试用额度，使用户能够探索其平台上的各种开源模型。
Unify： 当添加付款方式时，Unify 提供 5 美元的额度。该平台路由到其他供应商，提供对各种开源和专有模型的访问，包括来自 OpenAI、Gemini、Anthropic、Mistral 和 Perplexity 的模型。
NVIDIA NIM： NVIDIA NIM 提供 1,000 次 API 调用，为期一个月，从而可以访问各种开源模型。
Baseten： Baseten 赠送 30 美元的试用额度，允许用户访问任何受支持的模型并按计算时间付费。
Nebius： Nebius 提供 1 美元的试用额度，从而可以访问各种开源模型。
Novita： Novita 提供 0.5 美元的试用额度，可用于探索各种开源模型。
Hyperbolic： Hyperbolic 以慷慨的 10 美元试用额度脱颖而出，允许访问包括 DeepSeek、Hermes、Llama、Pixtral 和 Qwen 在内的各种模型。
AI21： AI21 提供 10 美元的额度，为期三个月，从而可以访问其 Jamba 和 Jurassic-2 模型。
Upstage： Upstage 也提供 10 美元，为期三个月，从而可以访问其 Solar Pro 和 Solar Mini 模型。
NLP Cloud： NLP Cloud 提供 15 美元的试用额度，但需要电话号码验证。这提供了对各种开源模型的访问。
阿里云 (国际) Model Studio： 阿里云在每个模型的基础上提供 token/时间限制的试用，从而可以访问各种开源和专有的 Qwen 模型。

充分利用免费和试用资源

有了如此多的选择，战略性地使用这些免费和试用资源至关重要。以下是一些最大化您的体验的技巧：

明确您的需求： 在深入研究之前，请考虑您项目的具体需求。不同的模型擅长不同的任务，因此选择合适的模型至关重要。
比较速率限制： 密切关注每个供应商施加的速率限制。这些限制可能会严重影响您项目的可行性，特别是如果您需要高吞吐量或大规模处理。
探索不同的模型： 利用 OpenRouter 和 HuggingFace 等平台提供的多样性来尝试不同的模型，并找到最适合您需求的模型。
明智地利用试用额度： 在承诺付费订阅之前，使用试用额度来测试平台的全部功能。这使您可以评估服务的性能、易用性和整体价值。
遵守使用政策： 请记住，这些免费和试用资源是作为一种特权提供的。遵守使用政策，避免任何可能被视为滥用的行为。

结论

免费和基于试用的 LLM API 访问的可用性对于 AI 社区来说是一个游戏规则改变者。通过消除准入的经济障碍，这些资源使开发者、研究人员和爱好者能够探索语言模型的巨大潜力，从而促进创新并加速突破性应用的开发。无论您是构建聊天机器人、尝试内容生成还是进行前沿研究，这些平台都为您的 LLM 世界之旅提供了一个宝贵的起点。所以，深入探索，尽情实验，并释放语言模型的强大力量，而无需花费一分钱。