搜索准确率最高的计划软件【罔芷:——88pk·ee—

IBM利用机器学习诊断早发性阿尔茨海默氏症

科技巨头IBM周一表示，机器学习和人工智能（AI）可以用于取代现存的阿尔茨海默氏症侵入性及昂贵的检测。

至顶网至顶网软件频道 2019-03-12 15:32:01

复旦大学团队突破AI推理瓶颈：让机器在"脑海"中思考而非"嘴上"表达

复旦大学团队开发的SIM-CoT方法突破了AI推理效率瓶颈，让机器学会在"脑海"中思考而非必须表达每个推理步骤。该方法通过巧妙的监督机制解决了隐式推理训练不稳定问题，在保持高效率的同时显著提升准确性，在GPT-2和LLaMA系列模型上均表现出色，为AI推理技术开辟新路径。

至顶网科技行者 2025-10-15 08:41:52

中国信通院公布知识计算产品测评结果华为云推动重塑知识价值

8月16日-17日，2022年可信AI峰会在北京举办。

至顶网业界供稿 2022-08-16 18:30:15

史丹福大学团队推出MedCaseReasoning：首个用真实病例评估和提升AI医疗推理能力的开源数据集

斯坦福大学研究团队开发了MedCaseReasoning数据集，这是首个专门评估人工智能与临床医生诊断推理一致性的开源数据库。现有医疗AI评估标准仅检验诊断准确率，忽视了推理过程质量。该数据集包含14,489个诊断问答案例，每个都附有真实临床推理，涵盖800多种医学期刊。研究发现顶尖AI模型在医疗推理方面表现有限，如DeepSeek-R1的诊断准确率仅48%，推理召回率仅64%。

至顶网科技行者 2025-05-23 15:28:18

百度CTO王海峰：依托智能云，百度大脑AI大生产平台推动产业智能化

10月26日，第九届中国智能产业高峰论坛（CIIS 2019）在西安开幕。百度首席技术官、ACL/CAAI 会士王海峰出席峰会，并发表题为《AI大生产平台推动产业智能化》的演讲，全面介绍百度如何通过探索顶尖AI技术、打造AI大生产平台，助力产业智能化发展。

至顶网业界供稿 2019-10-30 11:57:36

阿里巴巴让机器开口说话：Marco-Voice如何让AI既会模仿声音又能表达情感

阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统，能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术，系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统，为虚拟助手、内容创作和教育技术等领域提供了强大工具。

至顶网科技行者 2025-08-13 09:23:03

人工智能学会"记忆"的秘密：瑞士EPFL研究团队的突破性方法让AI在长篇文档中精准找到信息

瑞士EPFL研究团队开发的PERK方法通过参数高效的测试时学习技术，让AI能够像人类一样将长文档信息编码到专门的记忆模块中，显著提升了长上下文推理能力。该方法在多项测试中表现卓越，不仅能处理比训练时长32倍的文档，还解决了传统AI的位置偏见问题，为处理复杂长文档提供了创新解决方案。

至顶网科技行者 2025-07-18 10:07:05

这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO，用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落，并在段级粒度上估计优势，实现了更精确的信用分配和更准确的优势估计。SPO框架包含灵活段落划分、基于蒙特卡洛的段落优势估计和段落优势策略优化三个核心组件。研究团队基于此框架设计了SPO-chain和SPO-tree两个特定实例，分别针对短链思维和长链思维场景。

至顶网科技行者 2025-06-09 09:41:19

人工智能化身物理学家：北卡罗来纳大学团队开发能"看"懂运动规律的AI系统

北卡罗来纳大学团队开发的VIPER-R1系统首次实现了从视觉观察到物理定律的自动发现。该系统模拟物理学家的认知过程，通过观察运动图像和数据自动生成物理公式，准确率达81.2%，远超现有AI系统。这项技术有望加速工程、材料科学等领域的科学发现进程。

至顶网科技行者 2025-09-05 15:12:24

小模型也能学会深度思考：UCLA团队让2B视觉AI实现类人推理突破

UCLA团队首次成功让20亿参数的小型视觉AI模型实现了类似DeepSeek R1的"啊哈时刻"现象。他们通过在未经指令微调的基础模型上直接应用强化学习，让模型学会了自我反思和深度推理，在视觉推理任务上取得了显著突破。研究还发现指令微调可能限制模型的推理能力发展，为AI训练方法提供了新的思路。

至顶网科技行者 2025-08-01 10:15:14

视频数学问答：突破性基准测试，通过视频理解检验模型数学推理能力

这项研究推出了VideoMathQA，一个创新基准测试，专门评估人工智能模型在视频中的数学推理能力。不同于静态图像或文本基准，它要求模型在时间轴上整合视觉、音频和文本信息，模拟真实教学场景中的"多模态大海捞针"挑战。基准测试涵盖10个数学领域，视频长度从10秒到1小时以上，设计了三种推理挑战：直接问题解决、概念迁移和深度理解。对30个模型的评估显示，专有与开源系统的差距正在缩小，而模型成功不仅取决于规模，还受架构和训练质量影响。

至顶网科技行者 2025-06-09 11:17:41

买不到N卡，不如入手英特尔Gaudi2和至强CPU

就在今天MLCommons刚刚公布的MLPerf推理v3.1性能基准测试结果显示，英特尔Habana Gaudi2加速器、第四代英特尔至强可扩展处理器，以及英特尔至强CPU Max在AI推理方面表现出色。

至顶网至顶网计算频道 2023-09-12 16:28:51

有大学老师正用ChatGPT批改论文，让同学也这么做！

4月7日，CNN消息，美国伊萨卡学院-战略传播学教授Diane Gayeski，正在使用ChatGPT批改学生的论文。

至顶网 AIGC开放社区 2024-04-09 17:04:25

谁在给新闻媒体打分？ChatGPT竟成了最佳"真相侦探"——阿联酋人工智能大学最新研究揭秘

阿联酋人工智能大学研究团队开发出创新方法，让GPT-3.5等大型语言模型学会像专业事实核查员一样评估新闻媒体。通过模仿专家标准设计问题体系，该方法在政治偏向预测上达到93.5%准确率，在事实准确性预测上达到80.6%准确率，为媒体素养教育和信息筛选提供了新工具。

至顶网科技行者 2025-06-20 14:17:16

斯坦福大学突破：AI能否像人类一样判断创意写作的好坏？

斯坦福大学研究团队创建了全球首个创意写作评估基准LitBench，通过分析Reddit写作社区的4万多对故事比较数据，训练AI模型判断创意写作质量。研究发现专门训练的小型奖励模型（78%准确率）能超越大型语言模型评委（73%），但添加推理链反而降低了表现，揭示了创意评判需要直觉性判断的特点。

至顶网科技行者 2025-07-11 09:48:53

Anthropic 的 Claude 3.7 Sonnet 瞄准 OpenAI 和 DeepSeek，开启 AI 新一轮较量

Anthropic 推出 Claude 3.7 Sonnet 模型，为用户提供前所未有的 AI 思考时间控制能力，并发布 Claude Code 命令行编码助手。这标志着 Anthropic 积极进军企业 AI 市场，可能重塑企业软件开发和工作自动化方式。新模型在延长思考模式下在研究生级推理任务上达到 78.2% 的准确率，挑战 OpenAI 最新模型并超越 DeepSeek-R1，展现出强大的竞争力。

至顶网 VentureBeat 2025-02-25 16:56:07

市场份额第一！阿里云WAAP安全产品能力获IDC评测七项满分

近日，全球领先的IT市场研究和咨询公司IDC发布《中国WAAP厂商技术能力评估，2024》和《中国云Web应用防火墙市场份额，2023》报告发布

至顶网业界供稿 2024-07-11 17:28:30

SAP实验室重磅突破：让AI助手告别"糊里糊涂"，精准识别企业工具的革命性方法

SAP实验室研究团队开发了DIAFORGE系统，通过三阶段训练显著提升AI助手在企业环境中的工具调用准确性。该方法专门解决AI助手面对相似工具时的选择困难，通过模拟真实企业场景训练AI主动澄清用户需求。实验结果显示，经过训练的模型比GPT-4o和Claude-3.5-Sonnet分别高出27和49个百分点，为企业AI助手的实际应用提供了重要突破。

至顶网科技行者 2025-07-11 09:52:09

RICO：通过视觉重建提升图像描述的准确性和完整性 - 北京大学最新研究成果

北京大学多媒体信息处理国家重点实验室的研究团队提出了RICO方法，通过视觉重建机制显著提升图像描述的准确性和完整性。传统描述方法常面临"幻觉"和细节缺失问题，RICO通过文本-图像转换和反馈循环解决这些挑战。研究证明，该方法在多个基准测试中均优于现有技术，包括超越GPT-4o和人类编辑的表现。团队还开发了高效版本RICO-Flash，将这一方法应用于实际场景。这一创新不仅推动了多模态学习技术发展，还为改善人工智能系统的视觉理解能力提供了新思路。

至顶网科技行者 2025-06-02 16:30:38

百川智能发布全能AI助手：一个模型同时理解文字、图片、视频和语音的技术突破

百川智能发布突破性AI模型Baichuan-Omni-1.5，实现文字、图像、视频、音频的统一理解与生成。该7B参数模型在多项测试中超越同类产品，特别在医疗图像理解方面达到83.8%准确率，超过72B参数竞争模型。研究团队使用500亿高质量多模态数据，创新的四阶段训练策略，以及独创的音频处理技术，解决了多模态AI的关键技术难题，为人机交互开辟新方向。

至顶网科技行者 2025-09-17 13:33:02