搜索 bob手机在线【網纸——YB233典CN—

马来西亚需要N个“蚂蚁”

中国企业技术出海与马来西亚的数字化征程。

至顶网金旺 2024-06-07 11:41:30

马来西亚需要N个“蚂蚁”

中国企业技术出海与马来西亚的数字化征程。

至顶网金旺 2024-06-07 11:43:05

阿尔托大学携手帕多瓦大学：大型语言模型能否成为知识图谱的"质检员"？

由阿尔托大学和帕多瓦大学联合开展的研究构建了FactCheck平台，首次系统评估大型语言模型在知识图谱事实验证中的表现。研究测试了五个语言模型在三个真实世界数据集上的验证能力，发现开源模型在某些任务上甚至优于商业模型，但所有模型在识别少数错误事实方面表现不佳。检索增强方法能提升准确性但大幅增加计算成本。研究为AI辅助信息验证的实际应用提供了重要参考。

至顶网科技行者 2026-02-13 08:34:05

角色扮演能力大考验：里尔大学研究团队开发的大语言模型角色扮演评估新标准

这项研究介绍了RPEval，一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度：情感理解、决策制定、道德对齐和角色一致性，通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先，而GPT-4o虽在决策方面表现出色，但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。

至顶网科技行者 2025-06-04 16:08:13

量子验证问题被这位女博士生破解

这“无疑代表着她将成为一颗冉冉升起的新星。”

至顶网科技行者 2018-10-15 12:15:31

比亚迪如何从特斯拉手中夺取桂冠的？

比亚迪本身就是一个开拓者。公司 2003 年才开始生产汽车，是最早使用电动动力系统并逐步淘汰纯汽油动力车型的公司之一。

至顶网至顶网软件与服务频道 2023-09-08 17:51:52

围观WRC 2025，看到了中国人形机器人的“一小步”

打拳、走秀、送货、踢球，WRC 2025成了人形机器人的“演武场”。

至顶网金旺 2025-08-10 10:31:37

围观WRC 2025，看到了中国人形机器人的“一小步”

打拳、走秀、送货、踢球，WRC 2025成了人形机器人的“演武场”。

至顶网金旺 2025-08-10 11:16:13

浙江大学最新突破：让AI像人类一样具备预见性，解决电脑助手的"后悔药"难题

浙江大学团队开发的SAFEPRED系统通过赋予AI助手"预见未来"的能力，解决了传统安全防护只能被动应对眼前威胁的局限。该系统能预测操作的长期后果，在97.6%的测试案例中成功识别潜在风险，同时将任务效率提升21.4%。研究还推出了可在普通设备运行的轻量版本，为AI安全防护技术的普及应用奠定了基础。

至顶网科技行者 2026-02-12 13:35:13

神秘的东方力量：解密日本加密货币商人

日本已经成为加密金融世界的主要参与国之一，亦是Bitcoin.com网站总部以及加密货币交易所Mt.Gox的所在地。而且作为比特币缔造者中本聪的理论祖国，加密货币在日本普遍拥有着合法的市场地位。

至顶网科技行者 2018-11-08 16:49:12

从乡下放牛娃到大厂AI顾问：我用本硕七年，重写自己的人生

LangGPT创始者云中江树的双面人生

至顶网杨淼 2024-11-19 09:41:28

三维旋转做不到的事，清华团队用全新数学方法轻松解决了

清华大学研究团队开发出突破性的三维旋转优化方法，通过四维空间处理解决了困扰计算机图形学几十年的"万向节锁死"问题。该方法将旋转路径缩短15-25%，显著提升动画自然度，在用户测试中获得更高评分并能减少VR晕动症。技术已可实用化，预计将改善电影、游戏、虚拟现实等领域的视觉体验。

至顶网科技行者 2025-09-18 10:24:46

华为吴辉：强健“伙伴+华为”体系，让数智世界一触即达

在华为中国合作伙伴大会2024上，华为中国政企业务总裁吴辉表示，围绕“四梁六柱”，沿着三个赛道，落实六个升级，强健开放、紧密、成长的“伙伴+华为”体系。

至顶网业界供稿 2024-03-15 16:12:36

新年将至，IBM先抖一下未来科技——盘点IBM 2018十大产品创新

本文盘点了2018年IBM的十大产品创新，让我们从中一同领略未来智慧。

至顶网业界供稿 2018-12-29 16:27:16

阿里巴巴与香港中文大学联手打造AI"自我进化"评判官：让大模型学会给自己挑错

阿里巴巴与香港中文大学合作开发了SCRIT系统，让AI大模型学会自我评判和纠错。该系统通过对比学习机制，先分析标准答案理解关键概念，再评判学生解答，配合自我验证确保质量。在数学和科学推理测试中，评判准确率提升10%，错误识别能力提升19%，开创了AI自主改进的新方向。

至顶网科技行者 2025-09-18 11:07:31

WebChoreArena：东京大学研究团队推出更具挑战性的网页代理任务评估基准

东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准，它包含532个精心设计的任务，专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示，即使是最先进的语言模型（如Gemini 2.5 Pro）在这些挑战性任务上的表现也比常规任务降低了约14个百分点，证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务，为评估AI代理在实际应用场景中的表现提供了更严格的标准。

至顶网科技行者 2025-06-05 15:25:34

四大升级！助力首个 AI 原生开源操作系统 openEuler 24.03 LTS 正式发布

在整个开发过程中，国内外十多家芯片厂商，二十多家操作系统厂商，一百多家行业头部软件供应商启动原生开发，两年内共有 5136 名社区开发者参与到了版本的开发工作中。

至顶网至顶网存储频道 2024-06-07 09:37:24

云聚高性能，论道新超算——CCF HPC CHINA 2020在郑州举行

CCF HPC CHINA 2020由中国计算机学会主办，中国计算机学会高性能计算专业委员会、郑州大学、郑州航空港经济综合实验区共同承办，北京并行科技股份有限公司协办。

至顶网至顶网计算频道 2020-09-29 11:41:04

搜索舞台：加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

这项研究由加州大学伯克利分校团队完成，通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询，他们更看重引用丰富的回答，即使引用与内容无直接关联。有趣的是，用户更偏爱社区平台引用，而非维基百科。研究还表明搜索能力不会影响AI在普通场景中的表现，但在需要实时信息时至关重要。这些发现为改进下一代AI助手提供了重要指导。

至顶网科技行者 2025-06-10 13:51:22

视觉语言模型能看懂色彩世界吗？马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试

你是否曾经因为衣服色彩搭配不协调而尴尬？或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑？色彩在我们的日常生活中扮演着至关重要的角色，从科学发现到医疗保健，从购物到艺术欣赏，无处不在。而人工智能，特别是视觉语言模型(VLMs)，正在迅速融入我们的生活，但它们真的能像人类一样理解和利用色彩信息吗？

至顶网科技行者 2025-04-18 16:53:57