搜一下
用了 0.122379秒,为您找到
bob
手机
在线
網纸
YB233
相关内容9432 条
阿里巴巴和上海交通大学联手打造的"3D侦探":一张照片就能看透世界的三维秘密
Dens3R是一个革命性的3D视觉基础模型,能够仅从普通照片中同时提取深度、法线、点云等多种三维几何信息。通过创新的两阶段训练策略和共享编码器-解码器架构,系统在多个标准测试中取得了领先性能,特别是在处理高分辨率输入和复杂场景方面表现卓越。该技术在自动驾驶、增强现实、机器人导航等领域具有广泛应用前景,代表了三维计算机视觉的重要突破。
至顶网
科技行者 2025-10-10 10:27:21
香港大学与字节跳动联手打造的Goku:让AI同时掌握图片和视频生成的"变形金刚"
香港大学与字节跳动联合开发了名为Goku的AI模型,能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构,使用1.6亿张图片和3600万段视频训练,在多项评测中达到业界领先水平,在VBench视频测试中获得84.85分,GenEval图片测试中达到0.76分,展现了AI视觉生成技术向通用化发展的新趋势。
至顶网
科技行者 2025-08-25 14:27:23
斯坦福大学发布BIOMEDICA:从2400万张医学图片中诞生的AI医生助手
斯坦福大学研究团队构建了包含2400万医学图像的BIOMEDICA数据库,并开发出性能卓越的BMC-CLIP医学AI模型。该项目通过从600万篇科学文献中提取图像和文字,创建了医学领域最大的开放数据集,在40项医学任务测试中平均性能提升6.56%,计算效率提高10倍,为医学AI发展提供了重要基础资源。
至顶网
科技行者 2025-09-17 13:31:12
史丹福大学团队打造AI"股市福尔摩斯",四个智能助手联手预测股价走势
史丹福大学团队开发出名为QuantAgent的AI股票预测系统,由四个专业AI助手协作:技术指标分析师、图形识别专家、趋势分析师和风险管理师。该系统仅通过分析股价数据就能预测市场走向,在比特币、标普500等八种资产的测试中,预测准确率普遍超过随机水平,最高达到80%。该研究展示了人工智能在高频交易领域的突破性应用。
至顶网
科技行者 2025-09-25 14:41:46
人工智能界的新突破:让机器像人一样"理解"图片和文字的革命性技术
这项由中国人民大学与斯坦福大学、微软公司合作的研究,开发出名为MoCa的革命性多模态AI技术。该技术通过双向注意力机制和联合重建训练,让AI能够像人类一样同时理解图片和文字,并建立深层语义关联。在大规模测试中,MoCa显著超越现有技术,30亿参数模型就能匹敌传统70亿参数模型,展现出强大的实用潜力和应用前景。
至顶网
科技行者 2025-07-03 14:00:22
清华大学和新加坡技术设计大学联合研究:AI不用学习样本也能写出万字长文,强化学习让机器从零开始掌握写作
清华大学和新加坡技术设计大学联合发布了突破性AI写作研究LongWriter-Zero,该模型完全通过强化学习训练,无需任何长文样本即可生成万字高质量文章。实验显示,仅32B参数的LongWriter-Zero在WritingBench和Arena-Write基准测试中均超越了千亿参数级的顶级模型,证明了创新训练方法胜过单纯扩大模型规模的理念。
至顶网
科技行者 2025-06-26 19:51:12
加州理工学院全新突破:让AI同时"看懂"文字、图片和3D世界的革命性技术
加州理工学院研究团队开发出名为Kyvo的突破性AI系统,首次实现文字、图像和3D空间信息的统一处理。该系统通过创新的"结构化3D表示法"和"统一token空间"技术,让AI能够同时理解和生成三种不同类型的信息。在四大核心任务(3D渲染、识别、指令跟随、问答)中表现出色,为设计、机器人、AR/VR等领域带来重要应用前景。
至顶网
科技行者 2025-06-16 09:43:01
华为全联接大会2022第二天产品和方案集锦,依旧是干货满满
华为全联接大会2022第二天,依旧是干货满满,在华为常务董事、ICT基础设施业务管理委员会主任汪涛的带领下,大会围绕数字基础设施 ,发布了众多产品
至顶网
任新勃 2022-11-08 18:12:07
华为徐直军:共成长 同发展
华为轮值董事长徐直军在会上做了题为《共成长 同发展》的主题演讲。发言全文共9000余字,主要分为两部分。
至顶网
科技行者 2021-05-19 14:44:27
谷歌的宇宙正迎来终结
二十年来,谷歌搜索如同一只无形之手,操弄着网络内容的潮起潮落。如今,它在文化领域的江湖地位,也首次遭到质疑。
至顶网
The Verge 2023-09-07 14:51:12
新加坡国立大学团队突破性成果:让AI从几十张图片就能学会艺术家的"涂鸦"技巧
新加坡国立大学团队开发的PhotoDoodle系统,通过两阶段训练策略实现了从少量样本学习艺术家照片涂鸦风格的突破。该系统采用位置编码复用和无噪声条件机制,仅需30-50对图片样本就能掌握特定艺术风格,在保持背景完整的同时精确添加装饰元素,为AI辅助艺术创作开辟了新方向。
至顶网
科技行者 2025-08-21 16:39:53
当人工智能无处不在,2065年你的生活将是什么样子的?
机器人会拥有自我意识吗?它们是否应当拥有权利?它们是否需要负责?
至顶网
科技行者 2018-03-27 14:23:48
AI能否准确理解英国公共卫生指南?英国卫生安全局首创最大规模LLM健康知识基准测试
英国卫生安全局研究团队首次构建了包含8000多道题目的AI公共卫生知识评测基准PubHealthBench,测试24个AI模型对英国健康指南的掌握程度。结果显示最先进AI在选择题中正确率超90%,但自由作答时降至75%以下,且在面向公众的指南上表现优于专业医疗指南。
至顶网
科技行者 2025-07-08 09:32:03
AI推理能力再次升级!新加坡国立大学团队发布多模态思维链推理全面调研报告
这份由新加坡国立大学等顶尖学府研究团队发布的调研报告,系统梳理了多模态思维链推理这一前沿AI技术的发展现状。该技术让AI具备了同时处理文字、图像、音频等多种信息并进行逐步推理的能力,在医疗诊断、自动驾驶、智能机器人等领域展现出巨大应用潜力,代表了AI从简单工具向真正智能伙伴进化的重要一步。
至顶网
科技行者 2025-07-30 10:00:17
《数字经济洞察周报》2023年第31期 | 全国工业和信息化工作会议在京召开
容联云发布生成式应用“容犀Copilot”,全国工业和信息化工作会议在京召开,《“数据要素×”三年行动计划(征求意见稿)》发布。
至顶网
孙硕 2023-12-21 15:03:50
震撼登场!AI不再需要"家教",自信心竟成了最佳老师——莫斯科团队突破性发现
莫斯科研究团队开发了基于自信心的AI训练新方法RLSC,让AI模型通过分析自己回答的可信度来自我改进,无需外部标注数据。该方法仅用16个样本和20个训练步骤,就让数学AI模型在多项测试中准确率提升13-22个百分点,同时大幅降低了计算成本,为AI训练提供了高效实用的新思路。
至顶网
科技行者 2025-06-17 09:47:52
慕尼黑工业大学重磅发现:AI隐私保护与解释性能否双全?
慕尼黑工业大学研究团队首次系统性探讨了AI系统中隐私保护与解释性之间的关系,发现两者并非完全对立。通过对三种差分隐私方法和四种解释技术的大规模实验,研究证明在特定条件下适度隐私保护可提升解释质量,并提出了实用的平衡策略和"甜蜜点"配置方案。
至顶网
科技行者 2025-08-19 10:19:47
复旦大学联合团队发布GeometryZero:让小尺寸AI模型也能像数学天才一样解决几何难题
复旦大学联合多所知名院校开发了GeometryZero模型,通过创新的群体对比策略优化(GCPO)方法,让小尺寸AI模型具备了类似数学专家的几何推理能力。该模型能智能判断何时使用辅助构造工具,在多个几何基准测试中表现优异,为AI教育应用的普及化奠定了基础,展现了专门化训练的巨大潜力。
至顶网
科技行者 2025-06-12 09:55:13
StepFun发布Step-Audio 2:让AI像人类一样自然对话,首个真正懂"言外之意"的语音助手
StepFun团队发布了突破性语音AI系统Step-Audio 2,这是首个真正实现端到端语音对话的模型,能直接处理语音而无需文字转换。该系统不仅能理解语言内容,还能感知情绪、语调等副语言信息,并用自然的语音回应。通过8百万小时语音数据训练,在多项测试中超越GPT-4o等商业系统,代表了人机交互技术的重大进步。
至顶网
科技行者 2025-07-28 10:58:19
阿里云团队突破传统:金融AI如何学会像专家一样思考
阿里云团队开发了Fin-PRM,一个专门针对金融推理的AI评判系统。该系统采用双重评判机制,既检查推理步骤准确性又评估整体合理性,并具备专业知识验证功能。通过3000个高质量样本训练,在三大应用场景中显示出显著性能提升:数据筛选提升12.9%,测试选择提升5.1%,强化学习提升5.2%,为金融AI的专业化发展提供了重要技术支撑。
至顶网
科技行者 2025-08-28 14:52:43
<
上一页
463
464
465
466
467
468
469
470
471
472
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号