Together AI发布经济高效的按需专用端点

realtime news Mar 14, 2025 12:50 UTC 04:50

1 Min Read

Together AI宣布推出其新的按需专用端点，旨在为GPU推理任务提供出色的价格性能。据Together AI介绍，这一开发旨在解决初创企业在扩展AI应用时面临的灵活性与成本之间的平衡挑战。

增强的性能与控制

专用端点提供单租户服务，以确保用户流量不受其他用户影响，提供与无服务器解决方案相同的高性能。该服务提供了可观的成本节省，全权控制部署硬件和配置，支持自定义微调模型，并且无最低承诺。用户可以部署如DeepSeek-R1和Llama 3.3 70B等模型，无需承担上传或存储费用。

通过高达43%的降价，Together AI的专用端点被定位为市场上最具成本效益的专用GPU推理解决方案。与其他供应商相比，定价结构提供了显著的节省，在某些情况下折扣高达50%。这项举措是Together AI战略的一部分，旨在通过广泛的GPU架构选择来提供具有竞争力的价格。

专用端点允许企业通过垂直和水平扩展选项无缝应对使用高峰。用户可以通过增加GPU数量进行垂直扩展或调整副本数量进行水平扩展以管理高峰工作负载。这确保了始终如一的性能和优化的成本，使其适用于需要可靠QPS和可预测可用性的关键任务AI应用。

Together AI现在提供了一套全面的部署选项，包括无服务器、按需专用端点和每月预留部署。每种选项提供不同的优势，用户可以根据其特定的灵活性、性能和成本效益需求进行选择。专用端点对具有严格隐私要求和需要定制模型部署的客户尤其有利。

总之，Together AI的专用端点为希望在扩展其应用时保持高性能和控制其部署的AI公司提供了一种多功能且成本效益高的解决方案。