搜一下
用了 0.119235秒,为您找到
bob
手机
在线
網纸
YB233
相关内容9432 条
马来西亚需要N个“蚂蚁”
中国企业技术出海与马来西亚的数字化征程。
至顶网
金旺 2024-06-07 11:41:30
马来西亚需要N个“蚂蚁”
中国企业技术出海与马来西亚的数字化征程。
至顶网
金旺 2024-06-07 11:43:05
阿尔托大学携手帕多瓦大学:大型语言模型能否成为知识图谱的"质检员"?
由阿尔托大学和帕多瓦大学联合开展的研究构建了FactCheck平台,首次系统评估大型语言模型在知识图谱事实验证中的表现。研究测试了五个语言模型在三个真实世界数据集上的验证能力,发现开源模型在某些任务上甚至优于商业模型,但所有模型在识别少数错误事实方面表现不佳。检索增强方法能提升准确性但大幅增加计算成本。研究为AI辅助信息验证的实际应用提供了重要参考。
至顶网
科技行者 2026-02-13 08:34:05
角色扮演能力大考验:里尔大学研究团队开发的大语言模型角色扮演评估新标准
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
至顶网
科技行者 2025-06-04 16:08:13
量子验证问题被这位女博士生破解
这“无疑代表着她将成为一颗冉冉升起的新星。”
至顶网
科技行者 2018-10-15 12:15:31
比亚迪如何从特斯拉手中夺取桂冠的?
比亚迪本身就是一个开拓者。公司 2003 年才开始生产汽车,是最早使用电动动力系统并逐步淘汰纯汽油动力车型的公司之一。
至顶网
至顶网软件与服务频道 2023-09-08 17:51:52
围观WRC 2025,看到了中国人形机器人的“一小步”
打拳、走秀、送货、踢球,WRC 2025成了人形机器人的“演武场”。
至顶网
金旺 2025-08-10 10:31:37
围观WRC 2025,看到了中国人形机器人的“一小步”
打拳、走秀、送货、踢球,WRC 2025成了人形机器人的“演武场”。
至顶网
金旺 2025-08-10 11:16:13
浙江大学最新突破:让AI像人类一样具备预见性,解决电脑助手的"后悔药"难题
浙江大学团队开发的SAFEPRED系统通过赋予AI助手"预见未来"的能力,解决了传统安全防护只能被动应对眼前威胁的局限。该系统能预测操作的长期后果,在97.6%的测试案例中成功识别潜在风险,同时将任务效率提升21.4%。研究还推出了可在普通设备运行的轻量版本,为AI安全防护技术的普及应用奠定了基础。
至顶网
科技行者 2026-02-12 13:35:13
神秘的东方力量:解密日本加密货币商人
日本已经成为加密金融世界的主要参与国之一,亦是Bitcoin.com网站总部以及加密货币交易所Mt.Gox的所在地。而且作为比特币缔造者中本聪的理论祖国,加密货币在日本普遍拥有着合法的市场地位。
至顶网
科技行者 2018-11-08 16:49:12
从乡下放牛娃到大厂AI顾问:我用本硕七年,重写自己的人生
LangGPT创始者云中江树的双面人生
至顶网
杨淼 2024-11-19 09:41:28
三维旋转做不到的事,清华团队用全新数学方法轻松解决了
清华大学研究团队开发出突破性的三维旋转优化方法,通过四维空间处理解决了困扰计算机图形学几十年的"万向节锁死"问题。该方法将旋转路径缩短15-25%,显著提升动画自然度,在用户测试中获得更高评分并能减少VR晕动症。技术已可实用化,预计将改善电影、游戏、虚拟现实等领域的视觉体验。
至顶网
科技行者 2025-09-18 10:24:46
华为吴辉:强健“伙伴+华为”体系,让数智世界一触即达
在华为中国合作伙伴大会2024上,华为中国政企业务总裁吴辉表示,围绕“四梁六柱”,沿着三个赛道,落实六个升级,强健开放、紧密、成长的“伙伴+华为”体系。
至顶网
业界供稿 2024-03-15 16:12:36
新年将至,IBM先抖一下未来科技——盘点IBM 2018十大产品创新
本文盘点了2018年IBM的十大产品创新,让我们从中一同领略未来智慧。
至顶网
业界供稿 2018-12-29 16:27:16
阿里巴巴与香港中文大学联手打造AI"自我进化"评判官:让大模型学会给自己挑错
阿里巴巴与香港中文大学合作开发了SCRIT系统,让AI大模型学会自我评判和纠错。该系统通过对比学习机制,先分析标准答案理解关键概念,再评判学生解答,配合自我验证确保质量。在数学和科学推理测试中,评判准确率提升10%,错误识别能力提升19%,开创了AI自主改进的新方向。
至顶网
科技行者 2025-09-18 11:07:31
WebChoreArena:东京大学研究团队推出更具挑战性的网页代理任务评估基准
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
至顶网
科技行者 2025-06-05 15:25:34
四大升级!助力首个 AI 原生开源操作系统 openEuler 24.03 LTS 正式发布
在整个开发过程中,国内外十多家芯片厂商,二十多家操作系统厂商,一百多家行业头部软件供应商启动原生开发,两年内共有 5136 名社区开发者参与到了版本的开发工作中。
至顶网
至顶网存储频道 2024-06-07 09:37:24
云聚高性能,论道新超算——CCF HPC CHINA 2020在郑州举行
CCF HPC CHINA 2020由中国计算机学会主办,中国计算机学会高性能计算专业委员会、郑州大学、郑州航空港经济综合实验区共同承办,北京并行科技股份有限公司协办。
至顶网
至顶网计算频道 2020-09-29 11:41:04
搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统
这项研究由加州大学伯克利分校团队完成,通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询,他们更看重引用丰富的回答,即使引用与内容无直接关联。有趣的是,用户更偏爱社区平台引用,而非维基百科。研究还表明搜索能力不会影响AI在普通场景中的表现,但在需要实时信息时至关重要。这些发现为改进下一代AI助手提供了重要指导。
至顶网
科技行者 2025-06-10 13:51:22
视觉语言模型能看懂色彩世界吗?马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试
你是否曾经因为衣服色彩搭配不协调而尴尬?或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑?色彩在我们的日常生活中扮演着至关重要的角色,从科学发现到医疗保健,从购物到艺术欣赏,无处不在。而人工智能,特别是视觉语言模型(VLMs),正在迅速融入我们的生活,但它们真的能像人类一样理解和利用色彩信息吗?
至顶网
科技行者 2025-04-18 16:53:57
<
上一页
448
449
450
451
452
453
454
455
456
457
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号