What is llm? llm news, llm meaning, llm definition

Character.AI 提升 AI 推理效率，成本降低 33 倍

Character.AI 宣布在 AI 推理技术方面取得重大突破，自上线以来服务成本降低了 33 倍，使大语言模型 (LLM) 更具可扩展性和成本效益。

by realtime news
Jun 21, 2024

IBM研究院推出具有投机解码功能的低成本AI推理

IBM研究院开发了一种结合分页注意机制的投机解码技术，大大提升了大型语言模型（LLM）推理的成本性能。

by realtime news
Jun 25, 2024

Oracle 推出 HeatWave GenAI 的数据库内 LLM 和自动向量存储功能

Oracle 的 HeatWave GenAI 现在提供数据库内 LLM 和自动向量存储功能，使生成式 AI 应用无需 AI 专业知识或额外成本。

by realtime news
Jun 27, 2024

LangChain推出用于LLM判定的自我改进评估器

LangChain的新自我改进评估器旨在通过利用少量学习和用户反馈，将AI输出与人类偏好对齐。

by realtime news
Jun 27, 2024

确保完整性：保护LLM Tokenizer免受潜在威胁

NVIDIA的AI红队强调了保护LLM Tokenizer以保持应用程序完整性和防止被利用的风险及对策。

by realtime news
Jun 28, 2024

理解 AI 代理的角色和能力

根据 LangChain Blog，探索 AI 代理的概念、它们的不同自主程度，以及代理行为在 LLM 应用中的重要性。

by realtime news
Jun 30, 2024

NVIDIA H100 GPUs 和 TensorRT-LLM 实现 Mixtral 8x7B 的突破性性能

NVIDIA 的 H100 Tensor Core GPU 和 TensorRT-LLM 软件展示了 Mixtral 8x7B 模型在 FP8 精度下的破纪录性能。

by realtime news
Jul 03, 2024

AssemblyAI通过LLM整合增强语音AI功能

AssemblyAI引入了与LangChain、LlamaIndex和Twilio的整合新功能，以利用大型语言模型（LLM）增强语音AI应用程序。

by realtime news
Jul 09, 2024

NVIDIA NIM 提升多语言 LLM 部署

NVIDIA NIM 引入了对多语言大型语言模型的支持，通过 LoRA 调整适配器提升全球业务的沟通和效率。

by realtime news
Jul 09, 2024

WordSmith 通过集成 LangSmith 增强法律 AI 操作

WordSmith 利用 LangSmith 进行原型开发、调试和评估 LLM 的性能，提升内部法律团队的工作效率。

by realtime news
Jul 09, 2024

NVIDIA NeMo 增强企业的大型语言模型定制化

NVIDIA NeMo 使企业能够根据领域特定需求定制大型语言模型，提高部署效率和性能。

by realtime news
Jul 11, 2024

NVIDIA NeMo 通过混合状态空间模型集成增强LLM能力

NVIDIA NeMo 引入了对混合状态空间模型的支持，显著提升了大语言模型的效率和能力。

by realtime news
Jul 18, 2024

LangChain 增强核心工具接口和文档

LangChain 对其核心工具接口和文档进行了关键改进，简化了工具集成、输入处理和错误管理。

by realtime news
Jul 19, 2024

通过少样本提示提升LLM工具调用性能

LangChain的实验揭示了少样本提示如何显著提升LLM工具调用的准确性，特别是针对复杂任务。

by realtime news
Jul 25, 2024

NVIDIA和Meta合作推出Llama 3.1和NeMo Retriever NIMs的先进RAG管道

NVIDIA和Meta推出了可扩展的代理RAG管道，配备Llama 3.1和NeMo Retriever NIMs，优化了LLM性能和决策能力。

by realtime news
Jul 24, 2024

Codestral Mamba：NVIDIA 下一代代码 LLM 革新代码补全

NVIDIA 的 Codestral Mamba，基于 Mamba-2 架构，使用先进的 AI 技术革新了代码补全，提升了编程效率。

by realtime news
Jul 25, 2024

AMD Instinct MI300X 加速器提升大语言模型性能

AMD 的 MI300X 加速器，通过高内存带宽和容量，增强了大语言模型的性能和效率。

by realtime news
Jul 30, 2024

NVIDIA 推出 NeMo Curator，用于定制 LLM 数据集的高效微调

NVIDIA 的 NeMo Curator 提供了一种简化的方法，通过定制数据集微调大型语言模型 (LLM)，优化机器学习工作流程。

by realtime news
Aug 01, 2024

LangSmith 通过动态少样本示例增强 LLM 应用程序

LangSmith 引入了动态少样本示例选择器，通过根据用户输入动态选择相关示例，提高 LLM 应用程序的性能。

by realtime news
Aug 07, 2024

LangGraph v0.2 通过新检查点器库增强定制功能

LangGraph v0.2 引入了新的检查点器库，包括 SQLite 和 Postgres 选项，以增强大型语言模型 (LLM) 应用的定制性和弹性。

by realtime news
Aug 09, 2024

NVIDIA NIM 微服务提升大语言模型推理效率

NVIDIA NIM 微服务优化大语言模型的吞吐量和延迟，提高了 AI 应用程序的效率和用户体验。

by realtime news
Aug 16, 2024

LangSmith引入灵活的数据集模式以提高数据管理效率

据LangChain博客报道，LangSmith现在提供灵活的数据集模式，以实现高效和迭代的数据管理，适用于LLM应用程序。

by realtime news
Jul 31, 2024

NVIDIA TensorRT-LLM 提升希伯来语 LLM 性能

NVIDIA 的 TensorRT-LLM 和 Triton Inference Server 优化了希伯来语大型语言模型的性能，克服了独特的语言挑战。

by realtime news
Aug 07, 2024

Circle 和 Berkeley 利用 AI 进行区块链交易的 TXT2TXN

Circle 和 Blockchain at Berkeley 推出了 TXT2TXN，这是一款使用大型语言模型的 AI 驱动工具，通过基于意图的应用简化区块链交易。

by realtime news
Aug 09, 2024

NVIDIA 推出高效 LLM 的剪枝和蒸馏技术

NVIDIA 介绍了结构化剪枝和蒸馏方法，以创建高效的语言模型，显著减少资源需求，同时保持性能。

by realtime news
Aug 16, 2024

Anyscale 探索使用合成数据进行直接偏好优化

Anyscale 最新的博客文章深入研究了使用合成数据的直接偏好优化 (DPO)，重点介绍了其方法和在调优语言模型中的应用。

by realtime news
Aug 22, 2024

理解大型语言模型 (LLMs) 的解码策略

探讨大型语言模型 (LLMs) 如何使用解码策略选择下一个词。了解不同的方法如贪心搜索、束搜索等。

by realtime news
Aug 22, 2024

麻省理工学院研究揭示AI在保护关键基础设施中的潜力

麻省理工学院的新研究表明，大型语言模型 (LLMs) 可以高效地检测关键基础设施系统中的异常，提供了一种即插即用的解决方案。

by realtime news
Aug 27, 2024

NVIDIA的Blackwell平台在MLPerf Inference v4.1中打破新记录

NVIDIA的Blackwell架构在MLPerf Inference v4.1中设立了新的基准，展示了在LLM推理方面显著的性能提升。

by realtime news
Aug 29, 2024

AMD Radeon PRO GPU和ROCm软件扩展LLM推断能力

AMD的Radeon PRO GPU和ROCm软件使小型企业能够利用包括Meta的Llama模型在内的高级AI工具，用于各种业务应用。

by realtime news
Aug 31, 2024

LangGraph.js v0.2 增强JavaScript代理，支持云和Studio

LangChain发布LangGraph.js v0.2，新增构建和部署JavaScript代理的功能，包括对LangGraph Cloud和LangGraph Studio的支持。

by realtime news
Sep 04, 2024

Ollama 实现 Llama 3.2 在 AMD GPU 上的本地运行

Ollama 使本地在 AMD GPU 上运行 Meta 的 Llama 3.2 模型变得更加容易，支持 Linux 和 Windows 系统。

by realtime news
Sep 27, 2024

NVIDIA 和 Outerbounds 改革 LLM 驱动的生产系统

NVIDIA 和 Outerbounds 合作，通过先进的微服务和 MLOps 平台简化 LLM 驱动的生产系统的开发和部署。

by realtime news
Oct 03, 2024

创新的 LoLCATs 方法提升 LLM 的效率和质量

Together.ai 引入了 LoLCATs，这是一种用于线性化 LLM 的新方法，提升了效率和质量。该方法有望在 AI 模型开发中带来显著改进。

by realtime news
Oct 15, 2024

LangChain庆祝两周年：反思里程碑与未来方向

LangChain迎来其两周年纪念，强调其从Python包到LLM应用领域领先公司的演变，并介绍LangSmith和LangGraph。

by realtime news
Oct 25, 2024

使用 NVIDIA Triton 和 TensorRT-LLM 在 Kubernetes 上增强大型语言模型

探索 NVIDIA 使用 Triton 和 TensorRT-LLM 优化大型语言模型的方法，同时在 Kubernetes 环境中高效地部署和扩展这些模型。

by realtime news
Oct 23, 2024

提升RTX上LLM性能：利用LM Studio和GPU卸载

探索如何通过LM Studio实现的GPU卸载在RTX系统上高效地本地执行大型语言模型，从而增强AI应用程序的性能。

by realtime news
Oct 23, 2024

探索大型语言模型（LLM）的模型合并技术

根据NVIDIA的观点，了解如何通过重新利用资源和提升任务特定性能来提高大型语言模型的效率。

by realtime news
Oct 29, 2024

NVIDIA 开发基于 RAG 的 LLM 工作流以增强 AI 解决方案

NVIDIA 正在通过开发基于 RAG 的问答 LLM 工作流来提升 AI 功能，提供有关系统架构和性能改进的见解。

by realtime news
Oct 29, 2024

优化大型语言模型：增强数据预处理技术

探索提升大型语言模型（LLM）性能的重要数据预处理技术，重点关注质量提升、去重和合成数据生成。

by realtime news
Nov 14, 2024

创新的 SCIPE 工具增强了 LLM 链故障分析

SCIPE 为开发者提供了一种强大的工具，通过识别问题节点和提高决策准确性，来分析和改善 LLM 链的性能。

by realtime news
Nov 08, 2024

NVIDIA 的 TensorRT-LLM 多模块注意力在 HGX H200 上提升 AI 推理性能

NVIDIA 的 TensorRT-LLM 引入多模块注意力，显著提升了 HGX H200 上的 AI 推理吞吐量，提升幅度高达 3.5 倍，解决了长序列长度的挑战。

by realtime news
Nov 22, 2024

NVIDIA NIM革新AI模型部署，优化微服务

NVIDIA NIM简化了微调AI模型的部署，提供性能优化的微服务以实现无缝推理，从而增强企业AI应用。

by realtime news
Nov 22, 2024

增强领域特定多轮对话的LLM

探索微调大型语言模型（LLM）以实现有效的领域特定多轮对话所面临的挑战和解决方案，详见together.ai。

by realtime news
Nov 26, 2024

NVIDIA TensorRT-LLM 在飞行批处理中增强编码器-解码器模型

NVIDIA 的 TensorRT-LLM 现在支持具有飞行批处理功能的编码器-解码器模型，为 AI 应用提供优化的推理。探索 NVIDIA GPU 上生成式 AI 的增强功能。

by realtime news
Dec 12, 2024

NVIDIA通过TensorRT-LLM中的ReDrafter支持增强LLM推理

NVIDIA的TensorRT-LLM现在支持Apple的ReDrafter，通过投机解码优化大语言模型推理，在NVIDIA GPU上提供显著的性能提升。

by realtime news
Dec 19, 2024

探索大型语言模型整合对会话智能平台的影响

了解大型语言模型（LLMs）的整合如何革新会话智能平台，提升用户体验、客户理解和决策过程。

by realtime news
Jan 10, 2025

NVIDIA 推出 Nemotron-CC：用于 LLM 预训练的大规模数据集

NVIDIA 亮相 Nemotron-CC，这是一个包含 6.3 万亿标记的英语数据集，通过创新的数据整理方法提升大型语言模型的预训练。

by realtime news
Jan 10, 2025

LangSmith 通过 Pytest 和 Vitest 集成提升 LLM 评估

LangSmith 引入 Pytest 和 Vitest 集成，以增强 LLM 应用评估，为开发人员提供改进的测试框架。

by realtime news
Jan 25, 2025

OpenEvals简化开发人员的LLM评估过程

LangChain推出了OpenEvals和AgentEvals，以简化大型语言模型的评估过程，为开发人员提供预构建的工具和框架。

by realtime news
Feb 26, 2025

使用Python提高LLM会议摘要效率

学习如何仅使用五行Python代码，通过AssemblyAI的LeMUR框架和大型语言模型（LLMs）创建详细的会议摘要。

by realtime news
Feb 22, 2025

探索LLM Red Teaming：AI安全的关键方面

LLM red teaming涉及测试AI模型以识别漏洞并确保安全性。了解其实践、动机及其在AI开发中的重要性。

by realtime news
Feb 26, 2025

NVIDIA NIM 微服务革新科学文献综述

NVIDIA 适用于大语言模型 (LLMs) 的 NIM 微服务正在改变科学文献综述的过程，在信息提取和分类方面提供更快、更准确的能力。

by realtime news
Feb 26, 2025

NVIDIA 推出 DriveOS LLM SDK 助力自动驾驶车辆创新

NVIDIA 引入了 DriveOS LLM SDK，以促进大型语言模型在自动驾驶车辆中的部署，增强人工智能驱动应用的性能优化。

by realtime news
Mar 11, 2025

确保AI可靠性：NVIDIA NeMo Guardrails集成Cleanlab的可信语言模型

NVIDIA的NeMo Guardrails与Cleanlab的可信语言模型合作，旨在通过防止AI生成的反应中的幻想来增强AI的可靠性。

by realtime news
Apr 11, 2025

llm

Trending topics