搜索 AG手机客户端登录【網纸——YB233典CN—

ArtifactsBench：腾讯混元团队重新定义AI代码生成评测标准，让机器写出真正能看能用的界面程序

腾讯混元团队推出ArtifactsBench，这是全球首个专门评测AI生成视觉交互代码质量的综合基准系统。该系统包含1825个真实应用场景测试任务，创新性地通过实际运行代码、动态截图、多模态AI评委等方式，从功能性、美观度、用户体验等十个维度进行评测。实验结果显示其与人类专家判断一致性超过90%，与业界金标准WebDev Arena的一致性达94.4%，为AI代码生成能力评估树立了新标准。

至顶网科技行者 2025-07-11 10:13:36

机器人学会"三重思考"：清华大学让机器人拥有了分层视觉理解能力

清华大学研究团队开发出H3DP系统，让机器人具备了类似人类的"三重分层思考"能力。该系统通过深度感知分层、多尺度视觉表征和分层动作生成三个层次，实现了视觉感知与动作执行的深度融合。在44个仿真任务中平均提升27.5%性能，在真实世界复杂操作中提升32.3%。这项技术为机器人在杂乱环境中的精确操作和家庭服务应用奠定了重要基础。

至顶网科技行者 2025-07-09 09:42:06

华为科技的AI新突破：电脑也能像人一样"看脸识年龄"！COMSATS大学团队让广告投放更精准

巴基斯坦拉合尔COMSATS大学研究团队开发出同时识别人脸年龄和性别的AI系统，专门针对精准广告投放优化。该系统性别识别准确率达95%，年龄估算平均误差仅5.77年。与传统分别处理两项任务的方法不同，研究采用统一框架学习共享特征表示，显著提升了整体性能。系统基于20000张人脸图像训练，为商业广告和智能监控等领域提供了新的技术解决方案。

至顶网科技行者 2025-07-29 12:02:34

阿里巴巴团队推出WorldVLA：机器人终于学会了"先看后思考再行动"的本领

阿里巴巴团队推出的WorldVLA是一个突破性的机器人智能系统，它首次实现了行动模型和世界模型的有机结合。系统不仅能根据视觉和语言指令生成动作，还能预测动作的环境效果，形成"理解-预测-行动"的完整循环。通过创新的注意力掩码策略，有效解决了连续动作中的错误累积问题，在LIBERO基准测试中显著提升了机器人的操作成功率和环境预测准确性。

至顶网科技行者 2025-07-01 09:55:41

社交媒体新浪潮来临，Instagram联合创始人却要做新闻应用

Kevin Systrom希望解决新闻行业面临的“生存危机”。

至顶网 Vox 2023-05-26 10:36:47

IBM THINK演讲实录 | IBM CEO Arvind Krishna：新常态下的业务发展不可或缺的新技术

IBM新任首席执行官Arvind Krishna在IBM Think Digital 2020大会上“云首秀”，他以“新常态下的业务发展：不可或缺的新技术”为主题分享了数字化转型时期的企业技术战略趋势。

至顶网至顶网云计算频道 2020-05-12 14:30:16

谷歌CEO皮查伊两小时访谈：AI是人类所见过最深远的技术，意义将超越火与电，因为它可以自我迭代

谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则，顶住压力加倍投入，最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响，通过递归自我改进极大降低创意实现门槛，这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。

至顶网至顶AI实验室 2025-06-09 16:34:01

布尔诺工业大学团队突破语音识别瓶颈：让机器更准确理解人类话语的新方法

布尔诺工业大学研究团队开发了DeCRED方法，通过在语音识别系统解码器中添加辅助监督，显著提升了系统在未知领域的泛化能力。该方法将域外测试错误率从18.2%降至16.2%，仅用1.72亿参数就达到了接近大型模型的性能。

至顶网科技行者 2025-08-15 08:29:33

SonicMaster：新加坡科技设计大学团队让破音音乐起死回生的神奇技术

新加坡科技设计大学研究团队开发出SonicMaster，这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题，包括混响、削波、频响不平衡等，用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集，测试显示系统在客观指标和主观听感上均显著优于传统方法，为音频处理技术的普及应用提供了新思路。

至顶网科技行者 2025-08-08 13:06:28

生于云，长于云，开发者如何更好吃透云原生？

第四届 Techo TVP 开发者峰会以「云以致用，智效合一」为主题，为行业、企业与开发者们带来了前沿的云原生技术趋势与实践总结。

至顶网业界供稿 2022-05-06 16:38:46

黄仁勋北京媒体会：如何用十个AI方法论改变世界？

黄仁勋于昨天（7月16日）参加了在北京举行的第三届链博会，并于下午举行了长达90分钟的记者会。

至顶网至顶AI实验室 2025-07-17 08:35:46

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"，一个模型懂36种语言还能精准定位

谷歌DeepMind团队开发的SigLIP 2是新一代多语言视觉-语言编码器，支持36种语言的图像理解。通过创新的分阶段训练方法，结合解码器训练、自蒸馏学习和智能数据筛选，实现了在零样本分类、图像检索、精准定位等任务上的全面突破。该系统还采用去偏见技术，显著提升了文化公平性，为全球化AI应用奠定重要基础。

至顶网科技行者 2025-08-26 10:18:38

关山不再难越，IBM公有云为中国出海企业提供最佳路径

IBM将继续聚焦这个时代最具变革性的企业技术——混合云和AI ，帮助出海客户一次构建、随处运行和托管他们的关键工作负载，提供无缝体验，帮助他们把 AI 的能力注入其技术架构、系统和业务流程中，全力支持中国出海企业的全球化发展。

至顶网业界供稿 2023-03-23 16:49:06

MIT：让AI画画也能"抄近路"——从256步到20步的图像生成革命

MIT研究团队突破传统AI图像生成瓶颈，开发出局部感知并行解码技术，将生成步骤从256步减少至20步，速度提升12.8倍。该技术通过发现AI绘图中的空间局部性规律，重新设计了生成架构，让AI能够同时在多个区域并行"作画"而不影响质量，为实时图像生成应用开辟新道路。

至顶网科技行者 2025-07-04 17:20:25

OPPO研究团队突破AI智能体技术瓶颈：首个系统性评估框架让AI助手真正"智能"起来

OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准，开发出模块化的OAgents框架，在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议，将智能体能力分为事实获取和逻辑推理两个维度，为行业提供了标准化的工具和方法，推动AI智能体研究走向科学化和规范化。

至顶网科技行者 2025-06-26 12:52:10

蚂蚁集团包容性AI团队重磅发布Ming-Omni：首个媲美GPT-4o的开源全能AI模型

这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni，这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频，并具备语音和图像生成能力。采用MoE架构和模态特定路由器，仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录，特别是在语音理解、图像生成和多模态融合方面表现突出。

至顶网科技行者 2025-06-18 09:23:26

会议观察 | 2023世界人工智能大会WAIC精彩回顾

2023世界人工智能大会WAIC在上海召开。

至顶网孙硕 2023-07-14 11:36:05

斯坦福大学发布新一代GloVe词向量：十年后的语言"翻译官"大升级

斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量，这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练，新增超过70万词汇，涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本，为自然语言处理应用提供了更准确的语言理解工具。

至顶网科技行者 2025-07-29 12:03:43

Gradient团队突破分布式训练瓶颈：ECHO-2让AI训练成本骤降35%！

Gradient公司联合多所知名学府开发的ECHO-2框架通过分布式架构突破了传统AI训练的成本瓶颈。该系统巧妙地将训练过程分解为三个独立车间，让便宜设备承担数据生成任务，昂贵设备专注核心学习，并允许适度的数据延迟来换取更高的资源利用效率。实验证明在保持模型质量的同时成功降低训练成本35%以上，为AI技术普及奠定了重要基础。

至顶网科技行者 2026-02-13 08:32:06

用AI"慧眼"保护非洲野生动物：从传统CNN到视觉变换器的技术革命

这项由尼日利亚阿雷瓦数据科学学院主导的国际研究，通过对比DenseNet、ResNet、EfficientNet和Vision Transformer四种深度学习模型，为非洲野生动物保护提供了AI技术解决方案。研究发现DenseNet-201在实用性和准确率间达到最佳平衡，并成功部署了在线识别应用，为AI技术服务野生动物保护事业提供了完整的从理论到实践的范例。

至顶网科技行者 2025-08-05 13:21:09