用了 0.034348秒,为您找到彩神 APP 官方 最高 代理 内部 邀请 码罔芷 YB266CN 驻测相关内容2803 条
  • 成功破解3D重建难题!中美韩三国联合研究团队推出革命性建模系统

    韩国成均馆大学联合美国Rembrand公司开发的iLRM系统成功破解了3D重建技术的效率难题。该系统采用迭代优化策略,将复杂的一步式重建转变为逐步精雕细琢的过程,同时通过解耦设计和分批处理技术,实现了2-3倍的速度提升和显著的质量改善。这项突破为虚拟现实、电商展示、房地产等领域的3D应用普及奠定了技术基础,有望推动3D内容创作的民主化发展。
    至顶网  科技行者  2025-08-06 12:52:48  
  • 为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

    这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
    至顶网  科技行者  2025-07-30 10:01:42  
  • 当AI开始从声音就能"看出"你的样子:复旦团队揭秘音频重建人像的神奇技术

    复旦大学研究团队开发出突破性AI技术,能够仅通过声音重建说话者面部图像。该技术基于声音特征与面部结构的生理关联,使用多层深度学习系统实现声音到图像的精确映射。测试显示生成图像与真实面孔高度相似,在执法、娱乐、医疗等领域具有广阔应用前景,同时也带来隐私保护等伦理挑战。
    至顶网  科技行者  2025-08-19 12:36:09  
  • 微软等顶级科研机构联手发现:让AI说话像真人一样流畅,关键在于给声音加上"身体语言"

    微软等机构联合开发的NaturalSpeech 3实现了革命性的语音合成突破,通过因子化编解码器和扩散模型技术,首次让AI能够生成具有真人般自然韵律和情感表达的语音。该系统具备零样本学习能力,仅需少量样本即可模仿任何人的声音特征,在主观评测中达到以假乱真的水平,为医疗康复、教育娱乐、个人助手等领域带来广阔应用前景。
    至顶网  科技行者  2025-08-26 10:17:33  
  • Salesforce研究院BLIP3-o:让AI同时看懂图片又能画出图片的统一多模态模型

    Salesforce研究院联合多所知名大学开发的BLIP3-o是首个真正统一图像理解与生成的AI模型。通过创新的"CLIP特征+流匹配"架构和顺序训练策略,实现了在保持强大图像理解能力的同时获得优质图像生成效果。模型在多项评测中表现优异,并通过专门的6万张图像指令调优数据集显著提升了美学质量。
    至顶网  科技行者  2025-07-09 15:45:10  
  • 字节跳动团队突破性成果:让AI记住你的脸,随心所欲重塑照片的新技术

    字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。
    至顶网  科技行者  2025-07-30 10:00:39  
  • 英伟达推出Llama-Nemotron:开源推理优化的高效思维模型

    想象一下,如果传统AI模型是一辆可以载你去任何地方的汽车,那么这些新的"思维模型"就像是既能当汽车用,又可以变身为越野车的变形金刚。在平坦道路上,它们像普通汽车一样高效运行;遇到复杂地形,它们就能切换到更强大的思维模式,慢慢思考并解决困难问题。英伟达的这项技术突破正是要让这种转换变得更加自然、高效。
    至顶网  科技行者  2025-05-06 11:39:12  
  • 哥伦比亚大学团队揭秘:AI购物助手竟然比人类更加"偏心"?

    这项由哥伦比亚大学等机构研究团队完成的研究,通过ACES测试环境深入分析了AI购物助手的行为特征。研究发现不同AI模型存在显著购物偏好差异,对商品位置异常敏感但偏好各异,对营销标签反应独特,在理性购物测试中仍存在缺陷。研究揭示了AI购物时代将重构电商生态系统,带来新的商业机遇与监管挑战。
    至顶网  科技行者  2025-08-11 09:57:48  
  • 参加完这场阿里云中企出海大会,我脑海中浮现出三个类比

    人与人之间的交流,有时距离会产生美,但对做生意而言,距离往往只能产生更高的成本。
    至顶网  高飞  2025-05-26 18:44:47  
  • 全球机器学习教父Tom Mitchell宣布加入松鼠AI

    Tom Mitchell教授,正式宣布接受松鼠AI的邀约,出任Chief AI officer一职。
    至顶网  业界供稿  2018-11-25 17:38:28  
  • 观远数据发布一站式BI 6.0:融合大语言模型,赋能数据驱动的敏捷经营

    2023年,在复杂严峻的外部环境影响下,商业环境愈发多变难测,市场进入周期更替的“蕴新”时刻,对企业应对内外变化的能力提出更高要求。
    至顶网  业界供稿  2023-10-23 17:04:57  
  • 当语音遇上表情:首个能同时生成说话和表情的AI模型问世

    韩国研究团队开发出全球首个能够同时生成语音和面部表情的AI系统JAM-Flow,突破了传统技术分离处理音频和视觉的局限。该系统采用多模态扩散变换器架构,通过联合注意力机制实现音频与表情的完美协调。在多项测试中表现优异,用户体验测试显示其生成效果明显优于现有系统。这项技术为虚拟主播、影视制作、教育培训等领域带来革命性进展,代表了多模态AI发展的重要里程碑。
    至顶网  科技行者  2025-07-04 10:19:59  
  • 阿里巴巴突破AI说话人视频生成技术壁垒:首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

    阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
    至顶网  科技行者  2025-08-19 14:54:26  
  • 斯坦福大学如何让AI像人类一样思考:用4D建模重新定义空间理解

    斯坦福大学Gordon Wetzstein教授团队提出神经辐射场技术,首次让AI具备类似人类的三维空间理解能力。该技术仅需少量不同角度照片即可重建完整三维场景,在图像质量上比传统方法提升20%以上。研究成果应用于自动驾驶、VR/AR、医学影像等领域,标志着AI从二维图像识别向三维空间理解的重大跃进。
    至顶网  科技行者  2025-08-21 16:40:32  
  • 【6000字深度稿】CES管中窥豹:看IBM如何以区块链撬动可信商业?

    在CES 2020上,一项全新的区块链技术将把新体验送到酷爱咖啡的消费者手里。是的,咖啡是很多人每天热爱的伙伴,也是一个价值千亿美元的全球性产业。
    至顶网  至顶网数字化转型频道  2020-01-07 19:52:52  
  • 跟英特尔网络业务负责人NICK MCKEOWN聊聊网络编程

    在漫长的职业生涯中,McKeown一直倡导让网络设计适应英特尔的计算引擎与网络引擎。只有保证了这个前提,才能让研发工作顺风顺水、最终成果匹配需求。
    至顶网  至顶网计算频道  2022-08-17 11:46:07  
  • 微软研究院重磅发布:MineWorld让你在Minecraft里实时玩转AI世界,速度快到让职业玩家都惊呆!

    微软研究院开发的MineWorld是首个开源实时交互式游戏AI世界模型,专门针对Minecraft设计。该系统使用创新的并行解码算法,实现每秒4-7帧的超快生成速度,能够跟上职业电竞选手的操作节奏。系统不仅能生成高质量游戏画面,更重要的是真正理解玩家操作含义,甚至具备自主游戏能力。研究团队设计了全新的评测体系来衡量AI的理解能力,并将所有代码开源,为游戏AI领域树立了新标杆。
    至顶网  科技行者  2025-07-14 14:37:59  
  • 声音变视频:Captions公司推出能听会说的AI导演Mirage

    Captions公司推出的Mirage是一项革命性的AI视频生成技术,仅通过音频就能生成完全匹配的说话视频。该技术采用先进的扩散模型,能够分析音频中的语调、节奏和情感信息,转换为自然流畅的视频内容。Mirage在嘴唇同步准确率和面部表情自然度方面表现出色,为教育培训、内容创作、企业宣传等领域提供了低成本、高效率的视频制作解决方案,有望推动整个数字内容创作行业的变革。
    至顶网  科技行者  2025-08-22 10:52:26  
  • Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件

    Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
    至顶网  科技行者  2025-05-23 07:40:18  
  • 史丹佛AI突破:一秒钟预测十年后——机器学习中的超越人类能力边界探索

    史丹佛大学AI实验室的突破性研究显示,机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域,AI预测准确率比人类专家高出15-25%,处理速度从几天缩短至几秒。这一发现不仅颠覆了对AI能力边界的认知,更为医疗、环保、商业等领域的决策革新开辟了广阔前景,标志着人机协作新时代的到来。
    至顶网  科技行者  2025-08-19 12:37:31  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号