搜索大发玩和值的稳定必中方法规【罔芷:——88pk·ee—

从印地语到英式口音，人工智能让语音生成告别"一口一个味"——孟买工程学院突破多语言情感语音合成

孟买工程学院研究团队开发出突破性的多语言情感语音合成系统，能实现印地语与英语间的实时口音切换，同时准确表达多种情感。该系统在口音准确性上提升23.7%，情感识别准确率达85.3%，为南亚地区教育技术和无障碍软件应用开辟新道路。

至顶网科技行者 2025-06-25 14:54:05

AI学会"分区管理"思维：特拉维夫大学突破语言模型内部理解新方法

特拉维夫大学研究团队提出用"混合因子分析"方法重新理解AI语言模型的内部机制，发现AI思维呈现社区化结构而非简单线性排列。这种新方法将AI的激活空间分解为语义相关的区域中心和局部变化方向，在概念定位和行为控制任务上显著优于传统方法，为精确控制AI、个性化应用和提升AI可解释性开辟了新路径。

至顶网科技行者 2026-02-12 13:33:11

Google团队发布史上最轻便AI文本理解模型：3亿参数挑战7亿级性能

Google DeepMind团队发布了EmbeddingGemma，这是一个仅有3.08亿参数的轻量级文本理解模型，却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一，支持250多种语言，特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术，实现了性能与效率的完美平衡，为AI技术普及化开辟了新路径。

至顶网科技行者 2025-10-14 22:50:16

北京大学团队让AI学会玩《我的世界》：通过视觉语言训练打造超强游戏AI

北京大学团队开发出名为JARVIS-VLA的突破性AI系统，能够像人类玩家一样熟练操作《我的世界》游戏。该系统采用创新的三阶段训练方法：先学习游戏世界知识，再训练视觉理解能力，最后学习具体操作技巧。与传统AI不同，JARVIS-VLA不是简单模仿人类行为，而是真正理解游戏规律后再执行任务，可完成超过1000种游戏任务，在各项测试中显著超越现有系统，为未来智能AI发展提供了新思路。

至顶网科技行者 2025-07-31 09:55:15

SonicMaster：新加坡科技设计大学团队让破音音乐起死回生的神奇技术

新加坡科技设计大学研究团队开发出SonicMaster，这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题，包括混响、削波、频响不平衡等，用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集，测试显示系统在客观指标和主观听感上均显著优于传统方法，为音频处理技术的普及应用提供了新思路。

至顶网科技行者 2025-08-08 13:06:28

谷歌DeepMind团队揭秘：AI如何重新定义机器人的触觉世界

谷歌DeepMind团队2024年发表的突破性研究，首次系统性探索了机器人触觉感知技术。该研究开发了完整的触觉学习框架，让机器人能够像人类一样通过触觉"感受"世界，实现视觉与触觉的多感官协作。实验验证显示，机器人在材质识别、精细操作等任务中表现卓越，为医疗、制造、家庭服务等领域带来广阔应用前景，标志着机器人从自动化向真正智能化的重要转变。

至顶网科技行者 2025-08-25 10:25:19

新加坡国立大学发现AI写作新模式：离散扩散如何让机器像人一样"修改文章"

新加坡国立大学研究团队发布了离散扩散大语言模型的全面综述，这种新型AI写作模式让机器能像人类一样反复修改文本，而非传统的从左到右逐字生成。技术实现了10倍推理加速，支持精确的格式控制和并行生成，在保持传统模型性能的同时，解决了可控性和推理效率问题。

至顶网科技行者 2025-06-20 10:27:27

历经34个月共同协作完整意义上的5G网络国际标准如期完成

3GPP全会（TSG#80）批准了第五代移动通信技术标准（5G NR）独立组网功能冻结。加之去年12月完成的非独立组网NR标准，5G 已经完成第一阶段全功能标准化工作，进入了产业全面冲刺新阶段。

至顶网科技行者 2018-06-14 13:14:51

让大模型下棋：人工智能在外交游戏中的惊人表现——Good Start Labs与独立研究者的突破性发现

Good Start Labs与多位独立研究者合作开发了首个让任意大语言模型无需训练即可玩完整外交游戏的评估框架。通过优化文本化游戏状态表示，240亿参数模型就能可靠完成比赛。研究发现模型会自然展现承诺、背叛、联盟等复杂策略行为，且不同模型表现出独特的"外交性格"。该框架大幅降低了AI战略推理研究门槛，为理解语言模型的策略能力提供了新途径。

至顶网科技行者 2025-08-15 09:06:32

电影导演的神器来了！大连理工团队打造CineMaster，让普通人也能像专业导演一样精准控制AI视频生成

CineMaster是由大连理工大学等机构联合开发的突破性视频生成框架，首次实现了电影级别的三维空间精确控制。用户可在三维环境中自由摆放物体、设计摄像机运动，系统自动生成符合预期的高质量视频。该技术通过创新的数据标注流水线和分阶段训练策略，在物体定位精度和运动控制准确性方面显著超越现有方法，为可控视频生成领域树立了新标杆，有望推动创意产业的民主化发展。

至顶网科技行者 2025-08-21 16:40:09

慕尼黑大学团队让AI像蜂群一样自己造机器人军团：无需人工指导的全自动智能体生成技术

慕尼黑大学研究团队开发了SwarmAgentic技术，这是首个能够完全自主生成智能体系统的框架，无需人工预设模板。该技术借鉴蜂群智能原理，让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中，SwarmAgentic表现优异，在旅行规划任务上比现有最佳方法提升261.8%，展现了全自动智能体系统设计的巨大潜力。

至顶网科技行者 2025-06-24 15:48:32

华为全联接大会2022第二天产品和方案集锦，依旧是干货满满

华为全联接大会2022第二天，依旧是干货满满，在华为常务董事、ICT基础设施业务管理委员会主任汪涛的带领下，大会围绕数字基础设施，发布了众多产品

至顶网任新勃 2022-11-08 18:12:07

MiniMax推出革命性"零门槛"语音克隆技术：仅需一段录音就能让任何声音说出32种语言

MiniMax公司开发的MiniMax-Speech语音合成系统实现了真正的"零门槛"声音克隆技术，仅需一段录音即可生成32种语言的高质量语音。该系统采用创新的学习型声音编码器和Flow-VAE技术，在全球TTS竞技场中击败OpenAI等巨头登顶第一。

至顶网科技行者 2025-07-09 11:54:49

AI测试比人类更难的搜索任务：ByteDance研究揭示搜索代理的致命弱点

ByteDance研究团队通过WideSearch基准测试发现，当前最先进的AI搜索代理在大规模信息收集任务上表现极差，成功率普遍低于5%。研究揭示了AI在任务规划、反思调整、证据验证和知识幻觉等方面的根本缺陷，为未来发展多代理协作系统和改进AI搜索能力提供了重要指导。

至顶网科技行者 2025-08-14 12:13:03

阿里巴巴团队发布MinMo：让AI和人类像朋友一样自然聊天的革命性语音模型

MinMo是阿里巴巴通义实验室开发的80亿参数多模态语音模型，在140万小时语音数据上训练，实现了全双工语音交互，支持多语言识别翻译、情感分析、风格控制等功能，语音响应延迟仅100-800毫秒，在各项语音任务上达到业界最佳性能，代表了AI语音交互技术的重大突破。

至顶网科技行者 2025-09-17 13:28:13

取代Twitter拯救互联网，ActivityPub真能做到吗？

科技行业正在热烈讨论社交网络的新标准，希望下一代标准能够更开放，同时比Twitter和Facebook都更强大。只是，这一切怎么那么眼熟呢？

至顶网 The Verge 2023-04-28 11:05:48

AI也能"看懂"3D空间！香港科技大学团队让聊天机器人学会房间布局，颠覆传统3D建模方式

SPATIALLM是一个突破性的AI系统，能够理解3D室内空间并生成结构化场景描述。由香港科技大学和Manycore Tech公司研究团队开发，该系统基于大语言模型架构，可直接处理点云数据并输出Python代码形式的空间描述。研究团队构建了包含12328个场景的大规模数据集，在布局估计和3D物体检测任务上取得了领先性能，并展现出强大的跨域泛化能力，为增强现实、机器人导航和室内设计等应用开辟新可能。

至顶网科技行者 2025-06-12 13:05:35

上海AI实验室最新研究：让电脑真正"看懂"3D模型好坏的智能评判系统

这项研究开发了Hi3DEval系统，这是首个能够从整体、局部和材质三个层面全面评估3D模型质量的智能系统。通过创新的视频分析和3D几何特征结合方法，系统在各项评估指标上都显著超越了传统方法，为3D内容创作提供了标准化的质量检测工具，在游戏开发、虚拟现实、电商展示等领域具有广阔的应用前景。

至顶网科技行者 2025-10-11 10:06:29

绿动算力超智融合 ——第21届CCF全国高性能计算学术大会在鄂尔多斯成功举行

8月13-16日在鄂尔多斯国际会展中心举办的第21届CCF全国高性能计算学术大会（CCF HPC China 2025）

至顶网至顶网计算频道 2025-08-16 16:48:36

斯坦福大学研究团队发明"会读心术"的AI：一个提示就能帮大模型了解你的喜好

斯坦福大学研究团队开发出SynthesizeMe方法，能让AI通过观察用户的选择自动学习个人偏好，无需填写复杂资料。该方法通过三步流程分析用户互动，生成个性化画像，在理解用户偏好方面准确率提升4.4%。研究还构建了PersonalRewardBench测试平台，为AI个性化能力评估提供标准。这项技术有望应用于智能客服、教育和内容推荐等领域。

至顶网科技行者 2025-06-13 09:47:37