搜一下
用了 0.298293秒,为您找到
信誉
最好
靠谱
大发
平台
罔芷
88pkee
驻测
相关内容28382 条
AI大模型来了,还需要学校和老师吗?
AI工具在为教育工作者和学生带来了前所未有的机遇与便利,但同时,AI对教育行业的冲击究竟有多大?甚至,有人提出一个终极之问:“AI时代是否还需要人类老师和学校?”智能教育时代,如何在AI和人类教师之间找到平衡?
至顶网
科技行者 2024-09-03 21:54:30
上海交大团队突破AI代理人技术:让机器像人类科学家一样思考和探索
上海交通大学研究团队开发的X-Master AI代理人系统在"人类最后的考试"中获得32.1%的突破性成绩,超越OpenAI和谷歌产品。该系统通过"散布-堆叠"多代理协作机制,让AI能够像人类科学家一样使用工具进行推理和探索,为AI辅助科学研究开辟了新道路。研究采用完全开源方式,展示了推理时计算的巨大潜力。
至顶网
科技行者 2025-07-20 11:47:07
用AI玩游戏,加州大学伯克利分校科学家发明了一个永远玩不完的智力测试
加州大学伯克利分校研究团队开发了gg-bench系统,让AI自己设计策略游戏来测试其他AI的智能水平。研究发现,即使是最先进的AI模型,在面对自己"同类"设计的游戏时胜率也只有7-36%,揭示了AI在创造和解决问题之间的能力差异。这项研究为避免传统AI测试中的"数据污染"问题提供了创新解决方案。
至顶网
科技行者 2025-07-09 11:52:14
华中科大团队破解AI网页设计痛点:让机器像人类一样"分块思考"生成代码
华中科技大学研究团队开发的LaTCoder通过"分而治之"策略解决AI网页代码生成中的布局保持难题。该方法将复杂网页设计分割为小块,逐块生成代码后智能拼接,在多个评估指标上显著优于现有方法。团队还构建了更具挑战性的CC-HARD数据集,为行业提供了新的测试标准。这项技术有望大幅降低网页开发门槛,推动设计到代码的自动化转换。
至顶网
科技行者 2025-08-11 11:05:52
IBM姜锡岫:商业与科技的变与不变
企业处在新旧时代更迭的关键节点:背后是打下的江山(宝贵的资产与数据),周围充斥着各种方法、概念和新技术,前面是吊诡多变的市场和环境——“黑犀牛”随时会从某个角落跳出来,挡住前行的道路。
至顶网
业界供稿 2021-07-12 14:10:28
上海交大团队首次证实:AI思考时间越长,医学诊断越精准
上海交通大学团队通过"推理时间扩展"技术让AI学会深度思考,在医学诊断中取得突破。研究发现AI思考时间越长诊断越准确,仅用500个样本就实现6%-11%准确率提升。AI模型展现出类似医生的临床推理能力,能进行差异诊断和证据权衡,特别在复杂罕见疾病诊断方面表现出色,为AI医学应用开辟新方向。
至顶网
科技行者 2025-09-15 10:40:25
DevSecOps的实施步骤及其常见误区
忽略掉安全问题,一切利用DevOps改善工作流程的努力都将付之东流。
至顶网
至顶网软件与服务频道 2021-06-24 17:24:59
碳手印与ICT,欧洲能源转型与碳中和的深度思考
如今三年已近,在绿色新政实施的过程中,既有硕果累累,也有经验教训。这些都是宝贵的财富,可以作为我们能源转型与碳中和的参考与借鉴。
至顶网
业界供稿 2022-06-01 11:10:09
OpenBMB团队:让小模型也能写出深度研究报告,写作即推理的全新框架
北京智源人工智能研究院等机构联合发布的AgentCPM-Report系统,首次实现了"写作即推理"的AI报告生成框架。该系统让80亿参数的小模型在写作过程中不断思考调整,突破了传统"先规划后执行"模式的洞察力天花板,在多项基准测试中超越了大型商业AI系统,为本地化深度研究提供了隐私安全的解决方案。
至顶网
科技行者 2026-02-10 15:36:36
武汉大学团队让AI学会"诊断"金融知识:像医生检查身体一样评估AI模型
武汉大学团队开发出FinCDM金融AI认知诊断框架,首次将教育心理学的认知诊断理论应用到金融AI评估中。该框架能像医生体检一样精确诊断AI模型在70个金融概念上的具体掌握情况,而非传统的粗糙总分评估。研究构建了基于CPA考试的高质量数据集,对30个AI模型的测试揭示了模型间的隐藏差异和现有评估的盲区,为金融AI的精准选择和针对性改进提供了重要工具。
至顶网
科技行者 2025-09-09 10:37:25
德国研究团队突破医学图像分割难题:无需训练就能让AI医生变得更聪明
德国研究团队开发出MedSAMix技术,这是一种无需训练的AI模型融合方法,专门用于医学图像分割。该技术通过智能组合现有的通用型和专用型AI模型,在25个医学影像任务上实现了显著性能提升,单任务场景下提升6.67%,多任务场景下提升4.37%。与传统需要大量GPU和数天训练的方法相比,MedSAMix仅需2-4块GPU和数小时即可完成优化,大幅降低了医疗AI的应用门槛和成本,为医疗机构提供了更经济高效的智能诊断解决方案。
至顶网
科技行者 2025-08-28 11:07:21
视频生成黑科技:腾讯团队仅用1%参数就让AI精准识别人脸,一张照片秒变高质量视频
腾讯微信视觉团队提出Stand-In框架,仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制,让AI在生成视频时能持续参考原始照片,确保人物面部特征一致。在多项评测中表现优异,面部相似度0.724,支持零样本泛化到非人类主体,可即插即用集成到各种应用中。
至顶网
科技行者 2025-08-18 13:57:11
大语言模型能当期刊审稿人吗?耶鲁团队首创AI论文评审基准测试
耶鲁大学团队首创AI论文审稿基准测试系统LIMITGEN,通过人工植入缺陷和真实审稿数据两套测试集,系统评估大语言模型识别科学论文局限性的能力。结果显示AI审稿准确率约52%,远低于人类专家的86%,但检索增强技术和多智能体协作显著提升了性能,为AI辅助学术评议提供了新思路。
至顶网
科技行者 2025-07-07 09:18:58
UC伯克利大学突破性发现:让AI"眼睛"更清晰的神奇方法,无需重新训练!
UC伯克利研究团队发现了一种革命性方法,能够在不重新训练的情况下修复AI视觉系统的注意力异常问题。他们识别出少数"寄存器神经元"是造成注意力噪点的根源,并开发出"测试时寄存器"技术,将这些异常重定向到专门区域。该方法在多项视觉任务中表现出色,性能媲美专门训练的系统,同时还能抵御印刷攻击,为AI视觉技术的实际应用提供了简单高效的改进方案。
至顶网
科技行者 2025-06-13 08:03:46
不用看到论文全文也能明白:VeriGUI让AI智能体学会"复杂电脑操作"的创新数据集
VeriGUI是新加坡南洋理工大学等机构开发的GUI智能体训练数据集,专门用于教AI学会复杂电脑操作。该数据集最大创新是将复杂任务分解为可独立验证的子任务,每个任务平均包含214个操作步骤,涵盖网页和桌面两大场景。目前最先进AI智能体测试成功率仅8.5%,显示了数据集的挑战性,为开发真正实用的数字助理AI奠定了重要基础。
至顶网
科技行者 2025-08-11 14:29:19
IBM缪可延:watsonx的三大“x因子”之我见
发布watsonx是IBM推进混合云与AI战略、助力企业云智转型的又一里程碑。
至顶网
业界供稿 2023-10-10 13:13:42
颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
至顶网
至顶AI实验室 2025-07-17 17:24:04
汽车业驶进白银时代:新势力的第一次车展,或者最后一次
一方面,华为、BAT等科技和互联网公司正在打破汽车业的传统集中度。另一方面,新晋亮相车展的新兴厂商们实现车型量产,并不意味着它们将进入收获期,未来的一两年时间才是生死大考。
至顶网
张翔 2019-05-05 15:39:47
AI模型学会"深度思考":马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力
马里兰大学团队开发了名为Huginn的新型AI架构,通过让3.5B参数的小模型学会"深度思考",在推理任务上达到了50B参数大模型的性能水平。该模型采用循环深度设计,可根据问题复杂度进行1-64轮思考,在数学推理和编程任务中表现出色。这项突破证明了通过优化思考过程而非单纯增加参数规模来提升AI能力的可行性,为更高效、经济的AI发展开辟了新路径。
至顶网
科技行者 2025-08-26 12:00:26
数学天才都被AI算哭了!斯坦福大学推出史上最难数学考试,连最强AI模型都只能考42分
斯坦福大学研究团队开发了史上最具挑战性的AI数学推理测试系统Putnam-AXIOM,基于威廉·洛威尔·普特南数学竞赛的522道大学级难题。测试结果显示,即使最强的AI模型也只能达到42%的正确率,远低于它们在传统测试中的表现。研究还创新性地引入了变形题目生成和教师强制准确率评估方法,有效识别了AI对训练数据的记忆依赖问题,为真实评估AI数学推理能力提供了新标准。
至顶网
科技行者 2025-08-15 15:06:29
<
上一页
169
170
171
172
173
174
175
176
177
178
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号