搜一下
用了 0.046908秒,为您找到
北京
pk
精准
人工
计划
软件
網纸
YB233
相关内容3540 条
Writer公司突破性发现:大语言模型在金融领域的可靠性危机——FailSafeQA基准测试揭示AI系统的脆弱性
Writer公司研究团队通过FailSafeQA基准测试发现,即使最先进的AI模型在处理金融查询时也存在严重可靠性问题。测试涵盖24个模型,发现最优秀的系统仍有41%概率在信息不足时编造答案。该研究创新性地评估了AI系统在面对拼写错误、文档缺失、OCR错误等真实场景时的表现,揭示了当前AI技术在关键应用中的风险,为金融等行业的AI部署提供了重要安全参考。
至顶网
科技行者 2025-08-26 10:18:25
清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。
至顶网
科技行者 2025-08-13 10:57:51
HumaniBench:一个从人性角度评估大型多模态模型的全新框架——Vector研究院和中佛罗里达大学联合打造的人机协作评测体系
HumaniBench是由Vector研究院和中佛罗里达大学联合开发的首个以人为中心的大型多模态模型评测框架,包含约3.2万对真实世界图像-问题对。与传统仅关注准确率的评测不同,它从公平性、伦理性、理解能力、推理能力、语言包容性、共情能力和鲁棒性七个维度全面评估模型的"人性化"程度。研究对15个顶尖多模态模型的测试显示,闭源商业模型总体领先,但在视觉定位和抗干扰性上存在短板;开源模型在特定能力上表现出色,但在平衡准确率与人性化原则方面面临更大挑战。
至顶网
科技行者 2025-05-27 17:00:27
多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手
清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能提升,特别是在高分辨率图像处理和复杂推理任务中表现突出,代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。
至顶网
科技行者 2025-08-19 12:35:48
香港科技大学团队发明"减肥药":让AI大模型既聪明又轻盈的神奇方法
香港科技大学研究团队提出GAPrune方法,通过双重评估机制实现AI模型的智能压缩。该方法结合Fisher信息和梯度对齐分析,在保持领域专业性的同时大幅降低计算资源需求。实验表明,GAPrune在50%参数削减下性能损失仅2.5%,重训练后甚至超越原模型性能,为AI技术普及和可持续发展提供新路径。
至顶网
科技行者 2025-09-26 13:56:00
InfiX.ai发布InfiAlign:用12%训练数据追平顶级AI模型,让机器"小体量大智慧"的数据精选秘籍
InfiX.ai和香港理工大学联合发布的InfiAlign框架,通过多维数据筛选和两阶段课程学习,仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关,创新性地用长度作为难度指标,结合多样性采样和质量过滤,实现了数据效率的巨大提升。在数学推理等任务中表现优异,为资源有限的机构提供了经济高效的AI模型训练方案。
至顶网
科技行者 2025-08-13 09:23:43
韩国大学联合耶鲁大学:让AI医生学会"边推理边验证",小模型也能超越大模型诊断准确率
这项由韩国大学联合耶鲁大学等多所院校开展的研究,开发了名为Med-PRM的医疗AI推理框架。该系统让AI在诊断时能够实时查阅医学文献并验证每个推理步骤,使80亿参数的小模型在医学考试中首次突破80%准确率,训练成本仅需20美元却超越了成本数万美元的竞争对手,为医疗AI的普及和可靠性提升提供了新路径。
至顶网
科技行者 2025-06-19 16:59:27
MIT 研究人员用
人工
智能重新定义了
软件
调试:让计算机自己找出代码哪里出了错
MIT研究团队开发出一款能够自动识别并修复代码错误的AI调试助手,该系统在处理初级、中级和高级编程问题时分别达到94.2%、82.7%和67.3%的成功率,平均调试时间仅需2.3分钟,远超人类程序员45分钟的平均水平。这项突破性技术采用大语言模型和多视角分析方法,不仅能快速定位问题根源,还能提供清晰的修复建议和解释,有望彻底改变
软件
开发的调试流程。
至顶网
科技行者 2025-06-16 09:42:41
微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语
沙特阿拉伯misraj.ai团队开发了Kuwain 1.5B,一个仅15亿参数的阿拉伯语-英语双语AI模型。他们创新性地提出"语言注射"技术,在英语模型基础上增加8个新层专门处理阿拉伯语,同时保持原有层冻结。通过扩展26000个阿拉伯语词汇和9:1的数据配比,实现了阿拉伯语性能8%提升,英语能力完全保持,训练成本降低70%。该方法可推广到其他语言,为多语言AI发展提供了高效经济的新路径。
至顶网
科技行者 2025-07-17 09:27:01
KAIST团队推出Mol-LLaMA:首个能真正"看懂"分子的AI助手,药物发现新时代来临
韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息,不仅能准确预测分子特性,还能详细解释背后的科学原理,在药物发现、化学教育等领域展现出巨大应用潜力,为分子科学研究开启了AI辅助的新时代。
至顶网
科技行者 2025-08-22 09:34:37
0.5B参数也能超越7B模型?西湖大学团队让机器人操控成本狂降38倍
西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模,为机器人控制技术普及提供了新路径。
至顶网
科技行者 2025-09-25 13:14:46
北京
科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
至顶网
科技行者 2025-07-18 16:07:11
让AI看懂视频因果关系:女王大学突破视频推理技术壁垒
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
至顶网
科技行者 2025-07-09 15:45:45
香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术
这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
至顶网
科技行者 2025-06-19 12:54:25
《数字经济洞察周报》2023年第22期 |第十四届夏季达沃斯论坛在天津召开
2023年新领军者年会在天津召开
至顶网
孙硕,吕敬儒 2023-06-30 17:11:13
斯坦福大学揭秘:AI如何通过"拟人化"变得更聪明更可信
斯坦福大学研究团队通过大规模实验发现,AI系统的拟人化程度显著影响用户的信任和依赖行为。适度拟人化能提升信任度40%,但过度拟人化可能导致用户失去独立判断能力。研究揭示了年龄、性别等因素对拟人化接受度的影响,为AI设计提供了科学依据,强调需要在不同应用场景中平衡拟人化程度与用户理性判断的关系。
至顶网
科技行者 2025-08-25 12:27:54
IBM THINK演讲实录 | IBM总裁Jim Whitehurst:利用混合云加速规模创新
Jim Whitehurst于IBM Think Digital 大会上的主题演讲全文。
至顶网
至顶网云计算频道 2020-05-12 14:34:54
人工
智能与深度学习技术16大回顾,承包你一年的知识点
激动人心的2017年已结束,博客WildML的作者、曾在Google Brain做了一年Resident的Denny Britz,就分享出这一年他对AI和深度学习领域重点事件的回顾与梳理。可以说,这16个要点,能在让你在
人工
智能圈子里装逼一年不落伍!
至顶网
CNET科技行者 2018-01-05 10:16:05
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
至顶网
至顶AI实验室 2025-06-25 16:46:50
中国工业报2020“智造基石”优选榜揭晓,面向工业互联网、智能制造、数字化转型
经专家团队调研、企业申报、编辑推荐和评审组评定,中国工业报2020“智造基石”优选榜近日正式揭晓。
至顶网
业界供稿 2021-03-04 17:03:29
<
上一页
168
169
170
171
172
173
174
175
176
177
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号