用了 0.124577秒,为您找到bob 什么 意思 網纸 YB233相关内容9785 条
  • OmniResponse:打破对话隔阂的全方位响应系统——KAUST团队实现在线多模态对话生成重大突破

    OmniResponse是由KAUST和埃克塞特大学研究团队开发的创新系统,首次实现了在线多模态对话响应生成(OMCRG)任务。该系统能够实时处理说话者的视频和音频输入,并生成与之同步的听众面部表情和语音反馈,通过引入文本作为中间模态并利用Chrono-Text和TempoVoice两个关键模块解决了多模态同步生成的难题。研究团队还构建了ResponseNet数据集作为评估基准,实验表明OmniResponse在语义内容、音视频同步和生成质量方面显著优于基线模型,为人机交互、元宇宙体验和心理健康干预等应用领域开辟了新可能。
    至顶网  科技行者  2025-06-05 18:01:39  
  • 苹果的关键拐点:中国市场遭遇负数,5G迎来未知数

    一度万亿市值的苹果公司正处于艰难时期。
    至顶网  周雅  2019-02-01 09:28:10  
  • 香港中文大学推出TalkVid:让AI说话视频告别偏见,覆盖全球各种人群的超大数据集

    香港中文大学等机构联合发布TalkVid数据集,包含1244小时高质量说话视频,覆盖7729名不同背景说话者和15种语言。该数据集专门解决现有AI说话视频生成技术的种族、年龄、语言偏见问题。同时发布TalkVid-Bench评估基准,能够检测模型公平性。实验证明使用该数据集训练的模型在各群体上表现均衡,为构建更加公平包容的AI技术奠定基础。
    至顶网  科技行者  2025-09-05 11:26:53  
  • 视觉指令瓶颈调优:通过信息压缩提升多模态大语言模型的鲁棒性

    这篇研究介绍了"视觉指令瓶颈调优"(Vittle)方法,该方法通过应用信息瓶颈原理,增强多模态大语言模型应对分布偏移的能力。研究不依赖增加数据量或模型规模,而是教会模型像人类一样进行"概念压缩",在保留关键信息的同时丢弃冗余细节。在45个数据集的30种分布偏移场景中,Vittle显著提高了模型的鲁棒性,同时保持了标准任务上的出色表现,且几乎不增加推理时间。
    至顶网  科技行者  2025-05-27 10:26:51  
  • Meta推出ARE平台:让AI智能体像真人一样在手机环境中工作和协作

    Meta超级智能实验室开发了ARE平台和Gaia2基准测试,为AI智能体创造了更真实的训练和评估环境。ARE支持异步交互,模拟真实世界的复杂性和不确定性。Gaia2包含1120个场景,评估AI的七项核心能力。实验显示最强模型成功率仅42%,特别在时间管理和处理歧义方面表现较差,揭示了当前AI技术的局限性和改进方向。
    至顶网  科技行者  2025-09-30 08:54:33  
  • 2023《幻境法典》现世 AI大师NVIDIA施展十大现实“幻境”

    NVIDIA2023年10大研究亮点,从CV到AI,从智能体到生成式AI。
    至顶网  毛烁  2024-02-05 13:53:32  
  • AniMaker:哈工大深圳团队让电脑变身动画导演,一句话就能拍出多角色动画片

    这项由哈工大深圳与阿里巴巴联合研发的AniMaker系统,能够仅凭文字描述自动制作多角色动画片。系统采用四个AI智能体协作模式,模拟专业动画制作流程,引入蒙特卡洛树搜索算法优化视频片段选择,并首创AniEval动画专用评价体系。实验显示该系统在各项评价指标上均超越现有方法,为AI创意应用开辟新方向。
    至顶网  科技行者  2025-06-18 09:54:44  
  • Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

    Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。
    至顶网  科技行者  2025-09-04 09:59:03  
  • HANRAG:让AI问答更聪明的新武器——蚂蚁集团重磅发布多跳问答"大脑"

    蚂蚁集团研发的HANRAG系统通过智能调度模块"Revelator",能根据问题类型选择最优处理策略:直接回答、单步搜索、并行处理或逐步推理。系统具备强大噪音过滤能力,在单跳和多跳问答测试中全面超越现有方法,准确率提升6-20%,搜索效率显著改善,为智能问答系统发展开启新篇章。
    至顶网  科技行者  2025-09-26 11:43:54  
  • 一个符号就能骗过AI判官:腾讯AI实验室揭示大语言模型评估系统的惊人漏洞

    腾讯AI实验室联合普林斯顿大学发现,当前主流AI评估系统存在严重漏洞,简单的符号或短语就能让GPT-4、Claude等先进AI产生错误判断。研究团队开发了Master-RM防御方案,并公开了相关技术,为AI安全领域贡献重要成果。这项发现揭示了AI理解能力的根本局限,对整个人工智能行业具有重要警示意义。
    至顶网  科技行者  2025-07-21 11:31:46  
  • 无所不在的AI为影视制作带来新变革

    不止于小众技术和投资圈,关于AI和云计算的讨论似乎无处不在。而其中最具传播力和影响力的层级,当数娱乐业务。在娱乐领域,创意和商务从业者都非常关心AI和云会对自己的技能储备带来哪些冲击,但同时也对技术大众化后的无限可能性充满期待。
    至顶网  至顶网软件与服务频道  2023-02-28 11:05:55  
  • 开放跨任务多语言人类偏好数据集:NVIDIA的HelpSteer3引领全面评估奖励建模

    NVIDIA最新发布的HelpSteer3-Preference是一个包含超过4万个样本的开放许可偏好数据集,涵盖STEM、编程和多语言等多样化任务。由专业标注者标注的高质量数据使研究团队训练出在RM-Bench和JudgeBench基准上分别取得82.4%和73.7%准确率的顶尖奖励模型,比现有最佳模型提升约10%。研究还展示了如何利用这些奖励模型通过RLHF对齐大语言模型,在MT Bench和Arena Hard等评估基准上取得显著提升。这个以CC-BY-4.0许可证发布的数据集为开发更好的通用领域指令型语言模型提供了宝贵资源。
    至顶网  科技行者  2025-05-23 07:58:07  
  • IT领导者应力求避免的六大生成式AI危害

    OpenAI最近发布了自定义版本的ChatGPT,允许各家组织更轻松地以灵活方式使用生成式AI——但辩证法告诉我们,不存在只有积极作用的事物。
    至顶网  至顶网软件与服务频道  2023-12-08 11:43:58  
  • 微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?

    微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。
    至顶网  至顶AI实验室  2025-08-29 18:38:02  
  • 解开AI大脑密码:揭秘大语言模型的"思维模块"如何像生物大脑一样协同工作

    伦斯勒理工学院研究团队通过网络科学方法首次系统揭示了大语言模型的内部"认知架构"。研究发现AI模型采用类似鸟类大脑的弱定位架构,模块间通过分布式协作而非专业化分工来处理认知任务。这一发现颠覆了基于功能模块优化的传统思路,指出应充分利用网络级协作来提升AI性能。
    至顶网  科技行者  2025-09-02 09:33:59  
  • 阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然

    阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。
    至顶网  业界供稿  2025-07-22 16:01:53  
  • 风起云涌,谷歌云战略终于站稳脚跟

    十年来,谷歌云平台的市场份额一直在不足10%的区间内徘徊,摆在面前的是一个要去努力攀登的陡峭山坡。
    至顶网  至顶网软件与服务频道  2021-10-12 18:18:47  
  • 《使命召唤16:现代战争》:游戏光追效果体验

    使命召唤是一款由美国动视暴雪(Activision Blizzard)有限公司开发的第一人称角色扮演射击类视频游戏,10月25日,该系列游戏最新版本《使命召唤16:现代战争》,Call of Duty®: Modern Warfare®,下文也称COD16)开始全球解锁发售,售价约60美元。
    至顶网  阡陌客  2019-11-17 00:49:04  
  • 星辰大海引航:大型语言模型如何从奖励中学习提升自己

    想象一下航海时代的探险家们,他们在茫茫大海上航行时,依靠天空中的星辰来指引方向。同样,当今的大型语言模型也需要某种"指引之星"帮助它们朝着正确的方向发展。这个指引之星,就是研究人员所说的"奖励信号"。
    至顶网  科技行者  2025-05-13 15:27:35  
  • 曾经无话不谈的好朋友,如今怎么见个面都难

    大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
    至顶网  至顶网云计算频道  2019-01-02 10:53:13  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号