搜一下
用了 0.059949秒,为您找到
mg
电子游戏
网站
mg4355
客服
網纸
YB233
相关内容3949 条
加速音频生成的突破:让AI音频创作从几分钟缩短到几毫秒——来自加州大学圣地亚哥分校和Stability AI的最新研究成果
加州大学圣地亚哥分校和Stability AI联合研究团队提出了革命性的ARC音频生成加速方法,将AI音频生成时间从几分钟缩短到几十毫秒,实现100倍速度提升。该方法通过对抗性相对论-对比训练让AI学会"一步到位"生成高质量音频,不仅保持了音频质量,还显著提升了生成多样性。技术已可在智能手机上运行,为音频创作、游戏开发和内容制作等领域带来实时化的创意工具。
至顶网
科技行者 2025-07-09 11:58:19
2022年财务共享中心建设十大趋势发布
万物发展,变化有时。财务共享中心的内涵、边界等也在悄然发生变化。
至顶网
元年研究院 2022-03-15 16:37:09
MiniMax 突破语音合成极限:全新 MiniMax-Speech 技术让 AI 说话更像真人
当我们使用导航应用听取路线指引,或者让数字助手朗读新闻时,我们听到的AI语音正在变得越来越自然,但仍然存在明显的局限性。传统的语音合成技术往往需要大量特定说话者的录音样本才能生成接近自然的语音,而且在切换到不同说话者、不同语言或不同情绪风格时往往表现不佳。
至顶网
科技行者 2025-05-15 14:00:45
复旦大学团队首创多维约束框架:让AI更听话,不再"一言难尽"
复旦大学团队开发了全新的多维约束框架来评估和改进大语言模型的指令跟随能力。研究发现AI在处理复杂约束时表现不佳,成功率从简单约束的77%降至复杂约束的33%。通过强化学习训练,模型性能显著提升30-50个百分点且不影响其他能力。研究揭示改进主要来自注意力机制优化,为AI实用化提供了重要突破。
至顶网
科技行者 2025-07-09 11:53:17
Thoughtworks召开第28期《技术雷达》发布会,指出面对人工智能趋势,应用大语言模型的两条路
2023年6月16日,全球知名软件及技术咨询公司Thoughtworks举办了技术雷达28期媒体深度解析会。
至顶网
业界供稿 2023-06-16 19:27:29
看不见的语言背后:语音如何透露说话者的种族身份
布朗大学和普林斯顿大学研究团队发现,自动语音识别系统能够仅凭语音特征推测说话者的种族身份,并且对不同种族群体表现出不同的识别准确性。研究揭示了这种现象的技术机制,发现系统在学习语音内容的同时无意中学会了种族特征识别。研究团队提出了包括改进训练数据多样性、开发去偏见算法等多种解决方案,强调了在人工智能发展中考虑公平性的重要性。
至顶网
科技行者 2025-08-29 14:08:08
Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要
卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。
至顶网
科技行者 2025-06-10 13:52:20
马里兰大学等机构联合研究:AI视觉模型的"火眼金睛"训练法
马里兰大学等机构联合提出ViCrit训练法,通过让AI识别图片描述中的人工植入错误来提升视觉理解能力。该方法将传统的生成完整描述转换为精确的错误定位任务,使训练目标更加明确。实验显示经过训练的AI模型在幻觉减少和多项视觉推理任务上都有显著提升,同时研究团队还发布了ViCrit-Bench评估基准。这项研究为AI视觉训练开辟了新思路。
至顶网
科技行者 2025-06-19 12:55:24
吴恩达出任董事长的Woebot正用认知行为疗法帮人们缓解抑郁
据世界卫生组织公布的数据,全球约有 3 亿人患有抑郁症。为此,临床心理学家Alison Darcy与其研究团队研发了一款聊天机器人软件——Woebot希望能够帮助人们缓解和治疗沮丧、沉迷成瘾或孤独、抑郁、焦虑等心理问题。
至顶网
CNET科技行者 2018-01-10 13:43:21
Google I/O一次性更新N个产品,不止Gemini要成世界模型,连智能眼镜都强势回归!
太平洋时间5月20日上午,在加州山景城海岸线圆形剧场(Shoreline Amphitheatre),空气中弥漫着咖啡香气和一种几乎能触摸到电子脉冲般的兴奋感,2025 Google I/O(谷歌开发者大会)开始了,而此时的我们,正处于这股AI浪潮的中心。
至顶网
周雅 2025-05-22 15:57:25
2018财年:博世集团销售额和整体业绩继续保持历史高位
尽管经济形势严峻、市场表现疲软,博世集团2018年仍保持增长势头,销售额和整体业绩继续保持历史高位。
至顶网
业界供稿 2019-01-31 14:27:46
Google全球开发者生态的“中国故事”:创新、热情和最快速度
在2023 Google开发者大会期间,Google全球开发者生态总监David McLaughlin接受了科技行者采访,分享了他对全球开发者生态、中国开发者、以及中国企业出海的看法。
至顶网
周雅 2023-09-14 10:16:59
Cora:使用少量步骤的扩散模型实现对应感知图像编辑,来自西蒙弗雷泽大学的创新
Cora是一项来自西蒙弗雷泽大学的研究,提出了一种利用少步骤扩散模型进行对应感知图像编辑的新方法。它通过三大创新解决了现有编辑技术的局限性:对应感知噪声校正、注意力插值映射和结构对齐。这使Cora能够出色处理非刚性变形、物体替换和添加等复杂编辑任务,同时保持图像身份和结构的完整性。研究显示,Cora不仅在质量上超越其他少步骤编辑方法,还与计算密集的多步骤技术相媲美。
至顶网
科技行者 2025-06-05 12:03:41
“疫情”危机下远程办公的道与术
在眼下严重的疫情面前,在家办公成了确保防疫、承担企业社会责任、又兼顾企业日常运营的主要工作方式。防御新型肺炎或倒逼企业远程协同,成为落地在家办公的契机。
至顶网
李祥敬 2020-02-12 16:23:26
智能体规划师:让AI像工匠一样为每个任务量身定做执行方案 - TodoRL团队研究成果
TodoRL团队开发的TodoEvolve系统解决了AI规划的核心难题:如何让AI根据不同任务特点自动选择最优执行策略。该系统通过PlanFactory统一框架整合现有规划方法,训练Todo-14B智能规划师实现动态架构合成。在多个测试平台上,TodoEvolve显著提升了AI系统性能,在GAIA测试中提高16.37%,在复杂推理任务中超越了更强大的基础模型。这项研究标志着AI系统从固定规划向自适应规划的重要转变。
至顶网
科技行者 2026-02-12 13:34:29
推理时间真的能让AI更安全吗:普林斯顿团队揭示算力增加的双刃剑效应
普林斯顿大学研究团队发现AI推理时间增加存在双刃剑效应:当思考过程隐藏时能提升安全性,但暴露时会显著降低安全性。通过对12个开源模型的测试,证实了这种"逆向扩展定律",为AI系统安全部署提供了重要指导。
至顶网
科技行者 2025-07-28 10:16:26
智能手机的屏幕进化和电子媒介的物竞天择
疾风知劲草,折叠屏的到来,让电子媒介又迎来一轮物竞天择。
至顶网
赛博故事(cybergushi) 2019-07-18 16:26:57
卓思-中国汽车市场联合发布“中国汽车行业客户体验指数(CXI)报告”
中国汽车行业历经“从无到有”的40年发展,迎来了“从有到强”的巨大变革。
至顶网
至顶网CIO与CTO频道 2023-08-15 15:37:36
RKEFino1:当金融AI遇上监管红线,耶鲁团队如何让机器"读懂"规则?
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
至顶网
科技行者 2025-06-13 15:41:56
苹果与清华联手解决AI聊天记忆难题:让机器人像人一样记住长期对话
苹果与清华合作提出EpiCache技术,解决AI长期对话中的记忆管理难题。该方法将对话自动分割成话题片段,为每个话题建立专门记忆库,实现智能匹配和高效检索。实验显示,EpiCache比传统方法准确率提高40%,内存使用减少4-6倍,响应速度提升2.4倍,为资源受限环境下的AI对话系统提供了实用解决方案。
至顶网
科技行者 2025-09-30 09:26:58
<
上一页
170
171
172
173
174
175
176
177
178
179
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号