主题

按主题浏览

按主题浏览 Research Papers 的全部 AI 研究方向:大模型、扩散模型、智能体、世界模型、具身智能等。

语言模型 · 59 用于大规模理解、生成和转换自然语言的模型。 大模型推理 · 51 激发并提升大语言模型的逐步推理能力。 AI 智能体 · 48 由大模型驱动、能规划、行动、调用工具并携带技能的系统。 多模态模型 · 44 把语言与图像、音频、视频或其他信号结合的基础模型。 高效 AI · 40 降低大模型内存、算力或延迟成本的算法与系统。 扩散模型 · 34 通过迭代去噪合成数据的生成模型。 视觉基础模型 · 23 可迁移到识别、定位与感知任务的大型视觉表征模型。 微调与适配 · 19 低成本地把预训练模型适配到新任务,包括 LoRA 等参数高效方法。 文生图 · 19 从自然语言提示生成或编辑图像的模型。 Transformer · 17 以注意力机制为核心、成为现代语言和多模态模型骨架的架构。 对齐 · 15 让模型行为更符合偏好、更安全或更有用的训练方法。 开放模型 · 15 开放权重模型及其背后的训练配方。 强化学习 · 15 用奖励训练语言模型与智能体——RLHF、RLVR、GRPO 与可验证奖励等推动推理能力提升的方法。 机器人 · 15 面向物理机器人的学习与控制。 世界模型 · 14 随时间模拟一致、可控环境的生成模型。 检索增强生成 · 14 用检索到的文档为语言模型输出提供依据,提升事实性与时效性。 AI 科学 · 13 将机器学习用于科学发现——生物、化学、物理与材料,从蛋白质结构到新材料设计。 长上下文 · 13 面向超长文本、音频、视频或代码上下文的模型与评测。 视觉-语言-动作 · 12 把感知与语言直接映射到机器人动作的模型。 智能体记忆 · 10 AI 智能体如何跨任务、跨会话存储、检索与更新长期记忆——超越上下文窗口的局限。 视频生成 · 9 从文本或其它条件合成视频的模型,涵盖流式与自回归扩散等方法。 代码生成 · 8 用于合成、补全或推理程序的模型与系统。 序列建模 · 8 用于建模文本、音频、代码、基因组等长序列数据的架构。 专家混合 · 7 稀疏激活部分参数,让模型容量增长而算力不必同比上升。 定理证明 · 7 用于数学证明搜索的神经、符号与混合系统。 自监督学习 · 7 在没有特定任务标签的情况下从数据中学习通用表征的训练方法。 图像分割 · 6 在图像与视频中分离对象的可提示和自动化系统。 小语言模型 · 6 紧凑、可端侧与边缘部署的模型——以更少参数换取强能力,服务本地与低成本推理。 扩散语言模型 · 6 用迭代去噪而非从左到右解码来生成文本——并行的非自回归语言模型。 文本嵌入 · 6 把文本转成稠密向量用于检索、相似度与搜索的方法,包括用大模型当编码器。 生物分子建模 · 6 用于蛋白结构、分子相互作用与计算生物学的 AI 系统。 脑解码 · 6 用机器学习读取、建模并因果探查大脑如何表征感知。 语音合成 · 6 文本转语音与声音生成模型,涵盖零样本、表现力与对话合成。 可解释性 · 5 逆向解析神经网络内部的计算——特征、电路,以及驱动模型行为的内在机制。 语音识别 · 5 用于转写、翻译和理解语音音频的模型。