搜一下
用了 0.003377秒,为您找到
信誉
最好
靠谱
大发
平台
罔芷
88pkee
驻测
相关内容129 条
宾汉姆顿大学研究:八种AI大模型检测反犹言论,谁最
靠谱
?
宾汉姆顿大学研究团队评估了八个开源大语言模型检测反犹言论的能力,使用国际大屠杀纪念联盟定义作为标准。研究开发了"引导式思维链"新方法,显著提升了所有模型的检测性能。Llama 3.1 70B表现最佳,甚至超越了专门训练的GPT-3.5。研究还分析了AI模型的常见错误类型和解释差异,为AI在敏感内容审核领域的应用提供了重要参考。
至顶网
科技行者 2025-10-17 11:04:38
Kindle的诞生往事|贝索斯:有什么比重新发明书更重要?
我们节选了书中讲述亚马逊如何创造Kindle并变革了图书行业的故事,这段往事非常适合在今天回顾。
至顶网
海外来电 2023-07-01 19:39:28
一个百万年薪的程序员大佬竟然也租房?
「和年薪百万的老w聊完天后,我对于职业发展所能达到的高度有了一个清晰的想象。」
至顶网
尼酱 2022-09-23 10:13:24
南京航空航天大学团队破解AI安全难题:如何让聊天机器人拒绝回答危险问题
南京航空航天大学团队发现当前AI安全测试数据存在严重问题:超过50%的测试题目不合格。他们开发了MDH智能筛选系统,准确率达95%,并创建了更可靠的RTA数据集。同时发现了两种新型AI越狱攻击方法:D-Attack和DH-CoT,分别针对传统模型和推理模型,成功率最高达98%和66%,为AI安全防护改进提供了重要参考。
至顶网
科技行者 2025-08-29 09:33:13
复旦大学团队首创多维约束框架:让AI更听话,不再"一言难尽"
复旦大学团队开发了全新的多维约束框架来评估和改进大语言模型的指令跟随能力。研究发现AI在处理复杂约束时表现不佳,成功率从简单约束的77%降至复杂约束的33%。通过强化学习训练,模型性能显著提升30-50个百分点且不影响其他能力。研究揭示改进主要来自注意力机制优化,为AI实用化提供了重要突破。
至顶网
科技行者 2025-07-09 11:53:17
我,阿里P7,找不到工作
「 过去大家眼中阿里P7的光彩只是公司带来的光环,和身处其中的个体没什么关系。今日推荐空白女侠(id:kongbainvxia)一篇文章,34岁的阿里p7失业独白。」
至顶网
至顶网码客人生频道 2022-10-12 13:34:30
中科院团队首创AI界的"行前检查员":让虚拟助手告别手机误操作灾难
这是中科院自动化研究所与阿里巴巴合作的突破性研究,首次提出AI助手的"预操作检查"机制。他们开发的GUI-Critic-R1模型能在AI助手执行手机操作前进行错误预防,成功率提升23%,效率显著改善,为智能设备自动化操作的安全性和可靠性提供了重要保障。
至顶网
科技行者 2025-06-16 10:57:17
华为前员工创业四年,资产冻结
赵昱在华为的第一课就是《把信交给加西亚》,在美西战争中,中尉罗文要把信交给不知身在何处、不知模样的“加西亚将军”,在没有任何援助的情况下,他仍然完成了任务。
至顶网
尼酱 2023-04-07 11:20:09
北航大学团队突破:AI代码生成不再"自欺欺人",用属性测试让程序真正
靠谱
北京航空航天大学研究团队提出了Property-Generated Solver框架,通过属性测试解决AI代码生成中的"自欺欺人"问题。该方法使用双智能体协作,一个负责代码生成,一个负责属性验证,避免了传统测试依赖具体输输出对的局限性。实验显示相比现有方法在代码正确率上提升23%-37%,为AI辅助编程提供了更可靠的解决方案。
至顶网
科技行者 2025-06-30 11:06:02
觉醒!一个程序员的自我救赎
历经生命中的高光与低谷,郭正扬心态发生了巨变。
至顶网
尼酱 2022-07-26 11:22:19
这家创业公司,如何让无数海外房东开成民宿酒店?
出海开一家
靠谱
的民宿酒店需要几步?
至顶网
周雅 2024-04-25 11:54:44
“女博士”张晴晴的硬核AI创业经:做数据难于做芯片
人们普遍认为,AI科学家每天的工作是构建高大上的模型,但其实绝大多数时间都用在了数据上,他们也想用好的数据帮助建模,但结果却是像围城一样——这是很多AI科学家共同的难题。
至顶网
周雅 2023-02-26 23:38:42
南京大学联合美团发布ScaleEnv框架:让AI智能体自学成才的终极训练场
这项研究开发了ScaleEnv框架,能够从简单关键词自动构建完整的AI训练环境。通过程序化测试和双阶段构建,确保虚拟环境的真实可靠。实验证明,在此框架训练的AI智能体在跨领域测试中表现显著提升,验证了环境多样性对AI泛化能力的重要作用,为AI训练方法开辟了新方向。
至顶网
科技行者 2026-02-12 13:32:27
AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf
AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf
至顶网
至顶AI实验室 2025-08-26 18:02:41
上海AI实验室团队提出LEGO-Puzzles:揭露多模态大模型在空间推理上的惊人短板
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
至顶网
科技行者 2025-07-30 10:00:55
中科大团队推出深度研究智能体新基准:机器也能像博士生一样写研究报告了?
中科大团队推出深度研究智能体评测基准DeepResearch Bench,包含100个跨22领域的博士级研究任务,创新性地设计了RACE和FACT双重评估框架,分别评判AI生成报告质量和信息收集能力。测试显示谷歌Gemini表现最佳,该研究为AI研究助手行业建立了首个科学统一的评估标准。
至顶网
科技行者 2025-06-20 09:29:26
性能“全域压制” AI“降维打击” 锐龙5 PRO 230“制霸”移动商用生产力“战场”
移动办公战场的“破局之刃”——AMD锐龙5 PRO 230。
至顶网
猫叔 2025-09-22 09:45:35
大模型训练途中机器突然坏了怎么办?研究人员找到了无需备份的神奇恢复方法
这项由Gensyn、纳沙泰尔大学和代尔夫特理工大学联合研究的突破性成果,解决了大型AI模型训练中机器故障导致的巨大损失问题。研究团队开发的CheckFree方法无需备份即可快速恢复故障阶段,利用相邻层参数的加权平均重建丢失部分。升级版CheckFree+通过乱序管道执行技术还能处理边界层故障。实验显示该方法在低中故障率下比传统方案快12%以上,为AI训练民主化提供了重要技术支撑。
至顶网
科技行者 2025-06-25 11:35:25
对话达观数据陈运文:我们在打破文本智能处理的“真空地带”
陈运文34岁那年,是2015年,他离开任职多年的大厂,转而投身于“大众创业、万众创新”的时代浪潮中。从此,他成为达观数据董事长兼CEO,他的使命是“扛起国内文本智能处理ToB业务这面大旗”。
至顶网
周雅 2022-09-20 11:57:29
中科院团队重磅发布:如何让AI在万千工具中精准定位?LiveMCPBench带你探索智能体的终极挑战
中科院软件所团队发布LiveMCPBench,这是全球首个大规模MCP工具使用评估框架。该研究构建了包含527个工具的测试环境和95个真实任务,评估AI在复杂工具环境中的表现。测试显示Claude-Sonnet-4达到78.95%成功率,而多数模型仅30%-50%,揭示了AI工具组合使用能力的巨大差距,为未来智能助手发展指明方向。
至顶网
科技行者 2025-08-08 09:57:37
<
上一页
1
2
3
4
5
6
7
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号