搜索准确率最高的计划软件【罔芷:——88pk·ee—

多模态大语言模型能帮助理解人类语言吗？MMLA：一个全面的多模态语言分析基准

想象一下，你正在看一部喜剧片。剧中角色面无表情地说："我棒极了。"单看文字，你可能认为这是自信的表达。但如果你看到他说这话时翻了个白眼，用讽刺的语调，你立刻就会理解——这是在自嘲或嘲讽他人。这种理解需要同时分析文字内容、表情和语调。这正是多模态语言分析的核心：通过整合多种信息渠道（如文本、视频和音频），来理解人类交流中的高级语义。

至顶网科技行者 2025-04-29 12:19:48

RLVR-World：用强化学习训练世界模型，突破视觉和语言边界的突破性研究

清华大学研究团队提出RLVR-World框架，通过可验证奖励的强化学习直接优化世界模型的预测质量，而非传统的最大似然估计。这一方法在文本游戏状态预测和网页导航中显著提升了准确率，在机器人视频预测中改善了视觉质量并减少重复问题。RLVR微调仅需几百个梯度步骤即可取得显著成效，远比传统训练高效。研究证明该框架可作为生成模型的通用后训练范式，为自动驾驶、机器人控制等应用提供更准确的环境预测能力。

至顶网科技行者 2025-05-27 11:07:05

Galileo 发布新平台用于评估 AI 代理系统

Galileo 发布了 Agentic Evaluations 平台，用于评估基于大语言模型的 AI 代理性能。该平台提供全生命周期框架，支持系统级和步骤级评估，帮助开发者快速定位inefficiencies和错误。平台使用专有的 LLM-as-a-Judge 指标，支持 LangGraph 和 CrewAI 框架，现已向所有 Galileo 用户开放。

至顶网 SiliconANGLE 2025-01-24 14:29:48

统计调查：69％的IT高管无法在没有AI辅助的情况下应对网络安全威胁

最近一些人工智能的健康和进展状况相关调查、研究、预测和其他定量评估突出显示出人工智能在网络安全防御和评分标准化测试中发挥的作用...

至顶网 Forbes 2019-08-29 10:05:10

大数据＋AI能与碳中和扯上关系？看这家新能源企业如何操作

当AI进入落地期，认真思考如何打通大数据与AI应用的关联，才是企业眼前既现实、又关键的一大挑战。

至顶网业界供稿 2021-07-15 09:47:28

华为突破5G网络故障诊断难题：让AI像老工程师一样"看透"网络问题根源

华为研究团队开发出基于大语言模型的5G网络故障诊断系统，通过双阶段训练方法让AI学会像专家一样分析网络问题根源。他们创建了TeleLogs数据集，包含网络配置参数和故障案例。实验显示，经过训练的小参数模型诊断准确率达95.86%，远超现有方法，且能提供详细解释，为网络运维自动化带来突破性进展。

至顶网科技行者 2025-08-11 14:29:49

打开抗体大门：AI在COVID-19中的潜在应用

研究人员Parkinson等提出了一种名为RESP的AI管线，能够高效且独立识别出高亲和力的候选抗体。在给定明确的抗体靶标之后，RESP就能选择最适合的抗体来改进现有抗体。在RESP的帮助下，研究人员将现有药物的结合亲和力提升了近20倍。

至顶网至顶网软件与服务频道 2023-02-08 16:46:37

亚利桑那州立大学团队破解AI工具使用难题：让智能助手在复杂环境下准确率飙升19.1%

亚利桑那州立大学研究团队开发出IRMA框架，通过输入重构技术显著提升AI助手在复杂环境下的工具使用准确率。该系统采用记忆、约束和工具建议三模块协同工作，相比传统方法准确率最高提升19.1%，在航空和零售领域测试中表现卓越，为智能客服等实际应用提供了实用解决方案。

至顶网科技行者 2025-09-08 14:13:09

百度输入法AI探索版问世：调动表情、肢体全感官输入

1月16日，在百度输入法“AI·新输入全感官输入2.0”发布会上，百度输入法AI探索版正式亮相，这是一款默认输入方式为全语音输入，并调动表情、肢体等进行全感官输入的全新输入产品。

至顶网科技行者 2019-01-16 19:34:41

曙光慧眼亮相智能大会让人脸识别变得如此简单

大会期间，人脸识别技术作为契合主题的智能技术之一被广泛应用于多个场景之中。“曙光慧眼智能视频人脸识别一体机”（即“曙光慧眼”），为会场及活动酒店构建人脸识别智能场景，在大会期间为国内外嘉宾提供便捷服务，受到与会各界人士的关注及认可。

至顶网至顶网服务器频道 2019-05-17 16:31:29

知识图谱：企业 AI 中的关键纽带

知识图谱作为连接结构化数据和大语言模型的关键技术,正在引起企业界的广泛关注。它可以帮助企业更好地理解数据之间的关系,提高AI应用的准确性和可解释性。虽然构建知识图谱仍存在技术挑战,但结合生成式AI的新方法正在简化这一过程,有望加速知识图谱在企业中的应用和价值实现。

至顶网 CIO.com 2025-01-30 18:33:27

TAGS是一种创新的医学问答框架，结合了泛医和专医两种视角，通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发，无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制，解决了现有方法在复杂医学推理中的短板，为构建更可靠的医学AI系统提供了新思路。

至顶网科技行者 2025-05-30 11:00:04

云拿科技——多维视角打造无人商业新模式

在未来真正通过数字化技术手段，向用户展示产品真正价值的企业是什么样子的呢？现在未来已来，让我们看一下云拿科技是如何利用多维仿真技术实现商业的无人化智能管理。

至顶网董培欣 2021-12-30 15:03:54

为什么AI感知与人类感知无法直接比较？

人与机器之间的比较性研究，往往受到人类自发解释思维这一强烈偏见的影响。

至顶网科技行者 2020-08-27 12:20:51

古希腊陶器遇上AI：澳洲团队打造首个专业文物识别智能助手

澳大利亚研究团队开发出首个专门识别古希腊陶器的AI系统VaseVL，通过创新的"诊断式强化学习"方法，在材质识别、工艺判断等任务上达到专家级水平。该系统基于超过3万张陶器图片训练，准确率最高达99.95%，为文化遗产保护和考古研究提供了强大的技术支持，开启了AI辅助文物分析的新时代。

至顶网科技行者 2025-09-28 09:47:06

浙江大学团队用高斯分布"教会"AI点击屏幕：让计算机像人类一样自然操作界面

浙江大学团队创新性地将人类点击行为的高斯分布特征应用于AI界面操作训练，开发出GUI-G2方法。该方法摒弃传统二元奖励机制，采用连续高斯奖励建模，包含点精度评估和区域覆盖评估两大机制，并引入自适应方差处理不同尺寸元素。实验证实该方法在多个测试集上显著提升AI界面操作准确率，最高达24.7%的性能提升。

至顶网科技行者 2025-07-25 11:44:49

搜狗推出千元AI录音笔，支持10种语言方言转写，还会个人同传

提起搜狗，人们的印象大多是「输入法」以及「搜索引擎」，但基于此，这家公司正在布局 "以语言为核心的 AI 战略"。

至顶网周雅 2020-02-26 20:14:16

s3搜索智能体：使用强化学习训练高效搜索，让你的Large Language Models检索能力大增

伊利诺伊大学研究团队开发的s3框架只需2,400个训练样本，就能超越需要17万个样本的现有方法，大幅提升语言模型的搜索质量。通过将搜索与生成解耦，s3使用"超越朴素RAG的增益"奖励，专注训练搜索智能体而保持生成模型不变。在通用和医学问答任务中，s3均取得最佳性能，同时实现33倍训练速度加快，适用于各类冻结或专有模型，为RAG系统开辟高效新路径。

至顶网科技行者 2025-05-29 12:01:08

神经符号扩散模型：突破性整合神经感知与符号推理的新框架

这项研究介绍了神经符号扩散模型(NESYDMs)，一种创新融合神经网络感知与符号推理的框架，克服了传统神经符号系统中概念独立性假设的局限。通过离散扩散技术建模概念间依赖关系，该模型在高维视觉路径规划和自动驾驶等任务上展现出卓越性能，同时维持较好的校准性，能够意识到"推理捷径"问题。这一突破为构建既可靠又可解释的AI系统提供了新方向，特别适用于安全关键的应用场景。

至顶网科技行者 2025-05-26 17:58:55

耶鲁大学推出MMVU：AI看视频理解专业知识的"高考"真的来了！

耶鲁大学研究团队开发了MMVU测试系统，专门评估AI模型的专业视频理解能力。该测试包含3000道专家出题，覆盖科学、医疗、工程等27个学科。测试结果显示，最先进的o1模型准确率达80%，接近人类专家开卷考试水平，但大多数模型表现远低于人类专家，揭示了当前AI在专业领域应用中的局限性和改进方向。

至顶网科技行者 2025-09-18 11:08:02