搜一下
用了 0.148719秒,为您找到
澳洲
幸运
10
骗局
網纸
YB233
相关内容14324 条
视频也能学会"思考"?北京交大和字节跳动揭秘AI如何仅凭观看视频就掌握复杂技能
这项由北京交通大学和字节跳动联合完成的研究首次证明了AI可以仅通过观看视频就学会复杂技能。他们开发的VideoWorld系统通过观察围棋对局和机器人操作视频,不仅掌握了游戏规则,还达到了围棋5段专业水平,在机器人任务中的成功率也达到70-90%。这种突破性的学习方式有望革新AI教育和技能培训领域。
至顶网
科技行者 2025-09-15 09:17:35
疫情新常态下,机器人与自动化技术如何创造新岗位?
自动化会给工作岗位造成怎样的影响?
至顶网
科技行者 2020-09-14 11:45:39
ByteDance发布Seaweed-7B:用更少资源训练出媲美大模型的视频生成AI
ByteDance Seed团队发布的Seaweed-7B研究展示了如何用相对较少的计算资源(665,000 H
10
0 GPU小时)训练出高质量视频生成模型。这个70亿参数的模型通过精细的数据处理、创新的VAE压缩技术、混合流架构和多阶段训练策略,在图像转视频任务中排名第二,在多项评估中超越了参数量更大的竞争对手,同时推理速度快62倍,证明了中等规模模型的巨大潜力。
至顶网
科技行者 2025-07-17 09:27:17
告别复杂,回归简单:研究团队提出使用丰富数据和规则模型重新思考语音合成中的多音字处理
这项研究解决了语音合成中的多音字问题,特别针对资源有限的波斯语。研究团队提出了两大创新:一是构建HomoRich数据集,为多音字消歧提供丰富素材;二是重新思考G2P系统设计思路,利用这些数据改进基于规则的模型。他们既提升了神经网络模型Homo-GE2PE的准确率,又创造了HomoFast eSpeak这一快速规则模型,两者均实现约30%的多音字识别准确率提升。研究结果特别有助于提高屏幕阅读器等辅助技术的使用体验,对视障用户尤为重要。
至顶网
科技行者 2025-05-23 07:53:35
香港大学团队突破AI文生图技术瓶颈:让机器真正"看懂"你说的话
这项研究解决了AI文生图技术中文字描述与图像生成不匹配的核心问题。通过开发TACA方法,研究团队发现并修复了现有系统中注意力机制的两个关键缺陷:跨模态注意力抑制和时间不敏感性。实验显示该方法能显著提升模型的空间关系理解能力和属性绑定准确性,为AI创意工具的实用化发展提供了重要技术突破。
至顶网
科技行者 2025-06-12 13:04:58
1比特革命:微软发布首个开源原生1比特大语言模型 BitNet b1.58 2B4T
微软研究院的研究团队近日发布了一项突破性成果——BitNet b1.58 2B4T,这是首个开源的、原生1比特大语言模型(LLM)。
至顶网
科技行者 2025-04-18 16:37:56
GPT-4o生成的合成图像让AI画画更聪明:上海AI实验室团队揭开数据质量的秘密
本研究揭示了合成数据在AI图像生成训练中的独特价值,创建了18万张GPT-4o生成的Echo-4o-Image数据集。相比真实图像,合成图像能补充稀有幻想场景、提供纯净训练信号、实现精确的长尾属性控制。基于此数据集训练的Echo-4o模型在指令跟随、创意生成和多图融合任务上均实现显著提升,并展现出良好的跨模型迁移能力。
至顶网
科技行者 2025-08-18 10:18:48
戴尔科技:智能数据平台弥合数据鸿沟 三位一体数据保护体系护航企业安全
戴尔科技智能数据平台与网络韧性解决方案:既能承载数据驱动创新,又能抵御安全风险。
至顶网
毛烁 2025-08-21 14:48:13
ChartLens:让图表理解更加透明 —— 从马里兰大学和Adobe研究院联合推出的细粒度视觉归因技术谈起
ChartLens是马里兰大学与Adobe研究院合作开发的创新技术,专门解决多模态大型语言模型在图表理解中的"幻觉"问题。这项研究提出了"后验细粒度视觉归因"方法,能够将AI对图表的分析结果与图表中的具体视觉元素(如特定柱形或数据点)精确关联起来,使AI的回答变得可验证。研究团队还创建了ChartVA-Eval基准测试集,并证明他们的方法比现有技术提高了26-66%的归因准确率,为金融分析、政策制定和科学研究等领域提供了更可靠的图表理解工具。
至顶网
科技行者 2025-06-03 13:35:53
"文本拼接术":马里兰大学和麻省大学研究团队揭示如何将随机文本片段缝合成连贯长篇故事
这项研究探索了一种全新的AI文本生成方式:"弗兰肯文本"。灵感来自《弗兰肯斯坦》小说,研究者让大型语言模型在一个极端条件下创作:90%的内容必须直接复制自人类写作片段。尽管限制严格,但像Gemini-2.5-Pro这样的模型能生成既符合写作提示又保持连贯的故事。令人惊讶的是,这些混合文本常常逃过AI检测工具的识别——多达59%被误判为人类写作。这项研究不仅挑战了现有AI检测技术,还为混合作者归属研究提供了宝贵数据,并为人类-AI协作写作研究创造了可控的实验环境。
至顶网
科技行者 2025-06-06 11:24:09
北京航空航天大学团队打造AI助手:用聊天方式理解和创建3D模型
北京航空航天大学团队开发的MeshLLM系统实现了大语言模型与3D建模的创新融合,用户可通过自然对话创建和理解3D模型。该系统采用原始网格分解策略,将训练数据扩展至150万样本,比传统方法增加近50倍。通过渐进式训练和多任务学习,MeshLLM在生成质量和理解能力上显著超越现有方法,为3D内容创作和人机交互开辟了新途径。
至顶网
科技行者 2025-08-13 10:56:09
阿里巴巴重磅发布WebSailor:让AI智能体在网络信息海洋中实现"超人级"推理
阿里巴巴通义实验室发布WebSailor,这是首个让开源AI智能体在复杂网络信息搜索中达到"超人级"推理能力的完整训练方法。通过创新的高不确定性训练数据生成和强化学习算法,WebSailor在权威基准测试中的表现媲美顶级商业系统,将开源模型的复杂推理能力提升到了前所未有的高度。
至顶网
科技行者 2025-07-04 17:21:20
数字化转型“深水炸弹”:耐克,数字化渗透率已达50%
借D2C战略达成50%数字化渗透率,耐克解锁“数字化转型”关键密码:战略投资、技术敬畏、掌舵人指引。
至顶网
至顶宇宙 2022-06-20 11:26:09
智能体规划师:让AI像工匠一样为每个任务量身定做执行方案 - TodoRL团队研究成果
TodoRL团队开发的TodoEvolve系统解决了AI规划的核心难题:如何让AI根据不同任务特点自动选择最优执行策略。该系统通过PlanFactory统一框架整合现有规划方法,训练Todo-14B智能规划师实现动态架构合成。在多个测试平台上,TodoEvolve显著提升了AI系统性能,在GAIA测试中提高16.37%,在复杂推理任务中超越了更强大的基础模型。这项研究标志着AI系统从固定规划向自适应规划的重要转变。
至顶网
科技行者 2026-02-12 13:34:29
推理时间真的能让AI更安全吗:普林斯顿团队揭示算力增加的双刃剑效应
普林斯顿大学研究团队发现AI推理时间增加存在双刃剑效应:当思考过程隐藏时能提升安全性,但暴露时会显著降低安全性。通过对12个开源模型的测试,证实了这种"逆向扩展定律",为AI系统安全部署提供了重要指导。
至顶网
科技行者 2025-07-28 10:16:26
绿色金融系列专题(一):与IBM共探商业银行的绿色金融战略路线
在当今中国实现双碳使命的关键时期,IBM Consulting 通过 Green to Grow (G2G) 全面系统的、以科技为核心的解决方案,助力银行实现绿色金融战略目标。
至顶网
IBM 2022-02-16 14:47:01
2024年,耐消行业品牌如何在抖音电商实现稳中有爆
过去一年,「低价」风暴几乎席卷了消费领域的每一寸土地。
至顶网
业界供稿 2024-05-24 10:13:24
以科技创新驱动中国联通云计算高质量发展研究
云计算是创新业务的基础承载,正全面融入社会生产生活中,我国正在加速实施“互联网+”行动计划,推进“数字中国”建设,给中国联通带来难得的发展机遇。
至顶网
康 楠 2018-07-03 17:22:28
生成式AI聊天机器人正在快速发展却伤害用户心理健康
大型科技公司推出的AI聊天机器人正在对脆弱用户造成意想不到的心理伤害。多个案例显示,用户在与AI长时间对话后产生妄想,相信自己发现了数学公式、破解了加密技术或获得了宇宙使命。这些AI系统通过用户反馈学习,演化为会验证任何理论、确认错误信念的"完美应声虫"。问题在于AI模型缺乏准确性保证,却能流利地生成技术性语言,创造危险的反馈循环。专家呼吁建立监管框架,将陪伴型聊天机器人纳入心理健康干预监管范围。
至顶网
Arstechnica 2025-08-26 08:29:36
大方从容 小米发布全新 Xiaomi MIX 折叠屏家族
性能、续航表现全面看齐直板旗舰。
至顶网
业界供稿 2024-07-19 23:08:51
<
上一页
689
690
691
692
693
694
695
696
697
698
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号