搜索信誉最好靠谱的大发平台【罔芷:——88pk·ee—

AI大模型来了，还需要学校和老师吗？

AI工具在为教育工作者和学生带来了前所未有的机遇与便利，但同时，AI对教育行业的冲击究竟有多大？甚至，有人提出一个终极之问：“AI时代是否还需要人类老师和学校？”智能教育时代，如何在AI和人类教师之间找到平衡？

至顶网科技行者 2024-09-03 21:54:30

上海交大团队突破AI代理人技术：让机器像人类科学家一样思考和探索

上海交通大学研究团队开发的X-Master AI代理人系统在"人类最后的考试"中获得32.1%的突破性成绩，超越OpenAI和谷歌产品。该系统通过"散布-堆叠"多代理协作机制，让AI能够像人类科学家一样使用工具进行推理和探索，为AI辅助科学研究开辟了新道路。研究采用完全开源方式，展示了推理时计算的巨大潜力。

至顶网科技行者 2025-07-20 11:47:07

用AI玩游戏，加州大学伯克利分校科学家发明了一个永远玩不完的智力测试

加州大学伯克利分校研究团队开发了gg-bench系统，让AI自己设计策略游戏来测试其他AI的智能水平。研究发现，即使是最先进的AI模型，在面对自己"同类"设计的游戏时胜率也只有7-36%，揭示了AI在创造和解决问题之间的能力差异。这项研究为避免传统AI测试中的"数据污染"问题提供了创新解决方案。

至顶网科技行者 2025-07-09 11:52:14

华中科大团队破解AI网页设计痛点：让机器像人类一样"分块思考"生成代码

华中科技大学研究团队开发的LaTCoder通过"分而治之"策略解决AI网页代码生成中的布局保持难题。该方法将复杂网页设计分割为小块，逐块生成代码后智能拼接，在多个评估指标上显著优于现有方法。团队还构建了更具挑战性的CC-HARD数据集，为行业提供了新的测试标准。这项技术有望大幅降低网页开发门槛，推动设计到代码的自动化转换。

至顶网科技行者 2025-08-11 11:05:52

IBM姜锡岫：商业与科技的变与不变

企业处在新旧时代更迭的关键节点：背后是打下的江山（宝贵的资产与数据），周围充斥着各种方法、概念和新技术，前面是吊诡多变的市场和环境——“黑犀牛”随时会从某个角落跳出来，挡住前行的道路。

至顶网业界供稿 2021-07-12 14:10:28

上海交大团队首次证实：AI思考时间越长，医学诊断越精准

上海交通大学团队通过"推理时间扩展"技术让AI学会深度思考，在医学诊断中取得突破。研究发现AI思考时间越长诊断越准确，仅用500个样本就实现6%-11%准确率提升。AI模型展现出类似医生的临床推理能力，能进行差异诊断和证据权衡，特别在复杂罕见疾病诊断方面表现出色，为AI医学应用开辟新方向。

至顶网科技行者 2025-09-15 10:40:25

DevSecOps的实施步骤及其常见误区

忽略掉安全问题，一切利用DevOps改善工作流程的努力都将付之东流。

至顶网至顶网软件与服务频道 2021-06-24 17:24:59

碳手印与ICT，欧洲能源转型与碳中和的深度思考

如今三年已近，在绿色新政实施的过程中，既有硕果累累，也有经验教训。这些都是宝贵的财富，可以作为我们能源转型与碳中和的参考与借鉴。

至顶网业界供稿 2022-06-01 11:10:09

OpenBMB团队：让小模型也能写出深度研究报告，写作即推理的全新框架

北京智源人工智能研究院等机构联合发布的AgentCPM-Report系统，首次实现了"写作即推理"的AI报告生成框架。该系统让80亿参数的小模型在写作过程中不断思考调整，突破了传统"先规划后执行"模式的洞察力天花板，在多项基准测试中超越了大型商业AI系统，为本地化深度研究提供了隐私安全的解决方案。

至顶网科技行者 2026-02-10 15:36:36

武汉大学团队让AI学会"诊断"金融知识：像医生检查身体一样评估AI模型

武汉大学团队开发出FinCDM金融AI认知诊断框架，首次将教育心理学的认知诊断理论应用到金融AI评估中。该框架能像医生体检一样精确诊断AI模型在70个金融概念上的具体掌握情况，而非传统的粗糙总分评估。研究构建了基于CPA考试的高质量数据集，对30个AI模型的测试揭示了模型间的隐藏差异和现有评估的盲区，为金融AI的精准选择和针对性改进提供了重要工具。

至顶网科技行者 2025-09-09 10:37:25

德国研究团队突破医学图像分割难题：无需训练就能让AI医生变得更聪明

德国研究团队开发出MedSAMix技术，这是一种无需训练的AI模型融合方法，专门用于医学图像分割。该技术通过智能组合现有的通用型和专用型AI模型，在25个医学影像任务上实现了显著性能提升，单任务场景下提升6.67%，多任务场景下提升4.37%。与传统需要大量GPU和数天训练的方法相比，MedSAMix仅需2-4块GPU和数小时即可完成优化，大幅降低了医疗AI的应用门槛和成本，为医疗机构提供了更经济高效的智能诊断解决方案。

至顶网科技行者 2025-08-28 11:07:21

视频生成黑科技：腾讯团队仅用1%参数就让AI精准识别人脸，一张照片秒变高质量视频

腾讯微信视觉团队提出Stand-In框架，仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制，让AI在生成视频时能持续参考原始照片，确保人物面部特征一致。在多项评测中表现优异，面部相似度0.724，支持零样本泛化到非人类主体，可即插即用集成到各种应用中。

至顶网科技行者 2025-08-18 13:57:11

大语言模型能当期刊审稿人吗？耶鲁团队首创AI论文评审基准测试

耶鲁大学团队首创AI论文审稿基准测试系统LIMITGEN，通过人工植入缺陷和真实审稿数据两套测试集，系统评估大语言模型识别科学论文局限性的能力。结果显示AI审稿准确率约52%，远低于人类专家的86%，但检索增强技术和多智能体协作显著提升了性能，为AI辅助学术评议提供了新思路。

至顶网科技行者 2025-07-07 09:18:58

UC伯克利大学突破性发现：让AI"眼睛"更清晰的神奇方法，无需重新训练！

UC伯克利研究团队发现了一种革命性方法，能够在不重新训练的情况下修复AI视觉系统的注意力异常问题。他们识别出少数"寄存器神经元"是造成注意力噪点的根源，并开发出"测试时寄存器"技术，将这些异常重定向到专门区域。该方法在多项视觉任务中表现出色，性能媲美专门训练的系统，同时还能抵御印刷攻击，为AI视觉技术的实际应用提供了简单高效的改进方案。

至顶网科技行者 2025-06-13 08:03:46

不用看到论文全文也能明白：VeriGUI让AI智能体学会"复杂电脑操作"的创新数据集

VeriGUI是新加坡南洋理工大学等机构开发的GUI智能体训练数据集，专门用于教AI学会复杂电脑操作。该数据集最大创新是将复杂任务分解为可独立验证的子任务，每个任务平均包含214个操作步骤，涵盖网页和桌面两大场景。目前最先进AI智能体测试成功率仅8.5%，显示了数据集的挑战性，为开发真正实用的数字助理AI奠定了重要基础。

至顶网科技行者 2025-08-11 14:29:19

IBM缪可延：watsonx的三大“x因子”之我见

发布watsonx是IBM推进混合云与AI战略、助力企业云智转型的又一里程碑。

至顶网业界供稿 2023-10-10 13:13:42

颠覆式创新还是学术诈骗？韩科院联名谷歌发布新模型架构MoR

至顶网至顶AI实验室 2025-07-17 17:24:04

汽车业驶进白银时代：新势力的第一次车展，或者最后一次

一方面，华为、BAT等科技和互联网公司正在打破汽车业的传统集中度。另一方面，新晋亮相车展的新兴厂商们实现车型量产，并不意味着它们将进入收获期，未来的一两年时间才是生死大考。

至顶网张翔 2019-05-05 15:39:47

AI模型学会"深度思考"：马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

马里兰大学团队开发了名为Huginn的新型AI架构，通过让3.5B参数的小模型学会"深度思考"，在推理任务上达到了50B参数大模型的性能水平。该模型采用循环深度设计，可根据问题复杂度进行1-64轮思考，在数学推理和编程任务中表现出色。这项突破证明了通过优化思考过程而非单纯增加参数规模来提升AI能力的可行性，为更高效、经济的AI发展开辟了新路径。

至顶网科技行者 2025-08-26 12:00:26

数学天才都被AI算哭了！斯坦福大学推出史上最难数学考试，连最强AI模型都只能考42分

斯坦福大学研究团队开发了史上最具挑战性的AI数学推理测试系统Putnam-AXIOM，基于威廉·洛威尔·普特南数学竞赛的522道大学级难题。测试结果显示，即使最强的AI模型也只能达到42%的正确率，远低于它们在传统测试中的表现。研究还创新性地引入了变形题目生成和教师强制准确率评估方法，有效识别了AI对训练数据的记忆依赖问题，为真实评估AI数学推理能力提供了新标准。

至顶网科技行者 2025-08-15 15:06:29