用了 0.096076秒,为您找到mg 娱乐 公司 什么 網纸 YB233相关内容8410 条
  • 当机器开始"看懂"人类情感:清华大学团队让AI学会识别表情背后的真实感受

    清华大学研究团队在IEEE Transactions on Affective Computing发表突破性研究,提出双重学习策略让AI准确识别人类面部情感。新方法结合判别性和生成性学习,在多个标准数据集上准确率显著提升3-4个百分点,特别在处理陌生人脸时表现出色。技术有望应用于智能教育、医疗健康、人机交互等领域,但仍需解决文化差异和隐私保护等挑战。
    至顶网  科技行者  2025-07-22 09:50:58  
  • 只要256MB就能秒杀80B大模型?Hugging Face推出史上最小却最强的视觉AI助手

    Hugging Face联合斯坦福大学推出革命性小型视觉AI模型SmolVLM,最小版本仅256MB却能超越300倍大小的传统模型。该系列包含三个版本,运行显存需求0.8-4.9GB,可在手机端部署。通过创新架构设计、高效tokenization和精心数据策略,在图像理解、视频分析、文档处理等任务上表现卓越,真正实现"人人可用的AI助手"。
    至顶网  科技行者  2025-07-17 11:39:06  
  • 17个服务器发展趋势,我们都给您总结好了!

    长期以来,戴尔易安信一直对行业保有敏锐的洞察和分析力,今天编就来聊聊未来服务器市场的一些洞察。
    至顶网  戴尔易安信  2018-09-03 10:13:46  
  • 连接:始于科技,成于信任I 腾讯产业互联网笔记(二)

    “马化腾法则”的核心是服务分层,即基础业务和增值业务的分层。
    至顶网  业界供稿  2021-04-30 17:56:35  
  • 波士顿大学研究揭秘:为什么大脑"练得越多,想得越少"?神经科学家发现思维自动化的惊人真相

    波士顿大学研究团队通过先进脑成像技术首次揭示了技能从需要意识控制转变为自动化执行的完整神经过程。研究发现大脑存在两个关键网络:认知控制网络负责新技能学习,程序性学习网络负责自动化执行。随着练习增加,控制权从前者转向后者,释放认知资源处理新挑战。研究还发现了三种不同的个体学习类型,为个性化教育和康复治疗提供科学依据,并为人工智能发展提供生物学启发。
    至顶网  科技行者  2025-06-11 07:51:19  
  • 掘金AIoT正当时,2023中国物联网产业领航者峰会暨2022‘物联之星’榜单颁奖典礼成功举办!

    5月17日,“2023中国物联网产业领航者峰会·上海站暨2022‘物联之星’中国物联网产业年度榜单颁奖典礼”在上海世博展览馆会场1成功举办。
    至顶网  至顶网数字化转型频道  2023-05-23 14:33:51  
  • Hugging Face发布3D Arena:首个大规模3D模型评测平台,123,243次投票颠覆传统评估方式

    Hugging Face推出3D Arena平台,通过123,243次用户投票建立首个大规模3D模型人类偏好评估体系。研究发现用户更偏爱视觉冲击力强的高斯溅射模型和带纹理模型,揭示了审美直觉与技术实用性间的差异,为AI开发提供重要参考。
    至顶网  科技行者  2025-06-27 10:25:11  
  • Enigmata:通过合成可验证的拼图让大语言模型的逻辑推理能力扩展到新高度

    Enigmata是一项突破性研究,通过合成可验证的拼图训练大语言模型的逻辑推理能力。该研究创建了包含36种任务、7大类推理能力的完整训练系统,每项任务都配备了可控难度生成器和自动验证器。基于此训练的Qwen2.5-32B-Enigmata模型在拼图推理基准上超越了o3-mini-high和o1等顶尖模型。更令人惊喜的是,当应用于更大规模模型时,这些拼图数据不仅提升了模型解决拼图的能力,还意外增强了其数学和STEM推理能力,展示了纯逻辑训练带来的广泛泛化优势。
    至顶网  科技行者  2025-05-30 07:43:48  
  • Alita:极简设计打造无限创造力的通用AI助手

    Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。
    至顶网  科技行者  2025-06-01 11:15:55  
  • 事关生死:在医院ICU病房里人工智能可以做什么

    在重症监护室中,人工智能将始终关注病患的一举一动。
    至顶网  科技行者  2018-10-30 15:26:53  
  • 南洋理工大学最新突破:让静态3D模型"活"起来,自动骨骼绑定与动画生成技术

    南洋理工大学研究团队开发了名为Puppeteer的自动化系统,可将静态3D模型转换为完整的动画资产。该系统包含自动骨骼生成、智能皮肤绑定和视频引导动画制作三大核心功能,基于5.94万个高质量样本的大规模数据集训练。相比传统需要数周的手工制作,Puppeteer可在约30分钟内完成整个流程,在多项指标上显著超越现有方法,为3D内容创作的智能化转型提供了重要技术突破。
    至顶网  科技行者  2025-08-19 12:35:08  
  • GPT时代,一位数据产业创业者的“生存法则”

    揭开训练数据之谜。
    至顶网  周雅  2023-04-19 22:06:18  
  • 日本《人工智能运营商指南(草案)》解读

    日本发布《人工智能运营商指南(草案)》,旨在应对生成式人工智能技术变化,提供统一的人工智能治理指导原则。草案分为五部分,包括人工智能定义、社会愿景、行为准则,以及针对人工智能研发者、提供者、业务用户的具体规范。
    至顶网  清华大学智能法治研究院  2024-03-03 14:04:36  
  • ENERVERSE-AC:通过动作条件打造身临其境的机器人仿真环境

    ENERVERSE-AC(EVAC)是一种创新的动作条件世界模型,它能根据机器人预测的动作生成未来视觉观察结果,实现真实且可控的机器人仿真。该研究由AgiBot、上海交通大学和香港中文大学的研究团队开发,通过多层动作条件注入机制和射线图编码技术,支持动态多视角图像生成。EVAC不仅作为数据引擎可增强训练数据多样性,还能作为政策评估器模拟环境响应,无需物理机器人即可进行政策测试,显著降低了开发成本。实验结果表明,EVAC生成的仿真与真实世界场景高度一致,为机器人模仿学习提供了高效、经济的解决方案。
    至顶网  科技行者  2025-05-19 14:59:48  
  • ViStoryBench:一场可视化故事世界的大冒险——StepFun团队打造全面评估标准,帮你判断AI是否真懂讲故事

    ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。
    至顶网  科技行者  2025-07-07 17:38:18  
  • KAIST团队突破性创新:让AI视频生成像调色师一样精确控制每一帧画面

    韩国KAIST团队开发出革命性的"Frame Guidance"技术,这是首个无需训练即可精确控制AI视频生成的通用方法。该技术通过创新的潜在切片和视频潜在优化策略,将内存使用量减少60倍,让普通用户也能精确控制视频中任意帧的内容。实验表明,该方法在关键帧引导、风格化生成等任务上全面超越现有技术,为AI视频创作开启了全新可能。
    至顶网  科技行者  2025-06-16 09:36:15  
  • MPS-Prover:多视角搜索和数据精选让自动定理证明更上一层楼

    腾讯AI实验室和腾讯LLM部门研究人员开发的MPS-Prover是一种创新的逐步自动定理证明系统,通过两大关键创新解决了现有方法的局限:一个高效的训练后数据精选策略,剔除约40%冗余训练数据;以及一个多视角树搜索机制,整合了学习型评价模型与策略性设计的启发式规则,提高策略选择多样性并增强搜索稳健性。实验表明,MPS-Prover在miniF2F和ProofNet等基准测试上实现了最先进性能,生成的证明比现有方法更简洁多样,为开发更强大的混合证明系统提供了宝贵思路。
    至顶网  科技行者  2025-05-21 13:35:23  
  • OmniResponse:打破对话隔阂的全方位响应系统——KAUST团队实现在线多模态对话生成重大突破

    OmniResponse是由KAUST和埃克塞特大学研究团队开发的创新系统,首次实现了在线多模态对话响应生成(OMCRG)任务。该系统能够实时处理说话者的视频和音频输入,并生成与之同步的听众面部表情和语音反馈,通过引入文本作为中间模态并利用Chrono-Text和TempoVoice两个关键模块解决了多模态同步生成的难题。研究团队还构建了ResponseNet数据集作为评估基准,实验表明OmniResponse在语义内容、音视频同步和生成质量方面显著优于基线模型,为人机交互、元宇宙体验和心理健康干预等应用领域开辟了新可能。
    至顶网  科技行者  2025-06-05 18:01:39  
  • 苹果的关键拐点:中国市场遭遇负数,5G迎来未知数

    一度万亿市值的苹果公司正处于艰难时期。
    至顶网  周雅  2019-02-01 09:28:10  
  • 视觉指令瓶颈调优:通过信息压缩提升多模态大语言模型的鲁棒性

    这篇研究介绍了"视觉指令瓶颈调优"(Vittle)方法,该方法通过应用信息瓶颈原理,增强多模态大语言模型应对分布偏移的能力。研究不依赖增加数据量或模型规模,而是教会模型像人类一样进行"概念压缩",在保留关键信息的同时丢弃冗余细节。在45个数据集的30种分布偏移场景中,Vittle显著提高了模型的鲁棒性,同时保持了标准任务上的出色表现,且几乎不增加推理时间。
    至顶网  科技行者  2025-05-27 10:26:51  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号