搜一下
用了 0.140898秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容10171 条
Time-R1: 让3B小模型也能拥有全面时间推理能力,击败671B大模型
这项研究介绍了Time-R1,一个3B参数的语言模型,通过创新的三阶段强化学习训练方法,在时间推理能力上超越了参数量大200倍的模型。该框架依次建立了基础时间理解、未来事件预测和创意场景生成能力,采用精心设计的动态奖励系统指导学习过程。实验证明,小型高效模型通过专门训练可以在时间推理任务上实现卓越表现,为可扩展的时间感知AI提供了实用路径。研究团队还发布了Time-Bench数据集和模型检查点,促进该领域的进一步发展。
至顶网
科技行者 2025-05-29 10:24:11
Meta与卡内基梅隆大学携手打造ATLAS:让3D人体建模像调整游戏角色一样简单
Meta与卡内基梅隆大学联合开发的ATLAS系统革命性地解决了3D人体建模中的核心难题。通过将人体骨架和表面分离处理,ATLAS实现了精确的独立控制,避免了传统方法中调整一个部位影响其他部位的问题。该系统基于60万高分辨率扫描数据训练,采用创新的稀疏非线性姿态校正技术,能从单张照片生成精确3D模型,为虚拟现实、游戏制作、在线购物等应用提供强大技术支撑。
至顶网
科技行者 2025-10-11 09:53:34
斯坦福大学:机器人也能"听从内心声音",无需重新训练就能精准执行新任务
斯坦福大学推出DynaGuide技术,让机器人无需重新训练就能通过视觉示例学会新任务。该系统采用独立的动态模型为机器人提供实时行为指导,成功率达70%,在处理模糊指令时比传统方法强5.4倍。技术支持多目标引导和即插即用部署,已在真实机器人上验证成功,为个性化机器人服务开辟新路径。
至顶网
科技行者 2025-06-24 10:15:47
AUTOMIND:清华浙大联手打造的"数据科学全自动大师",让AI学会像专家一样解决机器学习难题
这项由浙江大学与蚂蚁集团联合研究的AUTOMIND系统,通过构建专家知识库、智能搜索策略和自适应编程三大创新,让AI具备了接近人类专家的数据科学能力。在权威测试中超越56.8%的人类参赛者,相比前代系统效率提升300%,成本降低63%,为数据科学自动化开辟了新路径。
至顶网
科技行者 2025-07-07 17:29:28
字节跳动推出X-Streamer:让静态照片变身会聊天的数字人,实现无限时长实时对话
字节跳动研究团队推出X-Streamer技术,首次实现从单张照片生成具有无限对话能力的数字人。该系统采用思考者-行动者双架构,统一处理文本、语音和视频生成,支持实时交互和长时间稳定对话。在双GPU配置下可达25fps生成速度,在多项指标上超越现有方法,为数字人技术的实际应用奠定了基础。
至顶网
科技行者 2025-10-17 14:07:55
数字化浪潮下的架构融合浅谈——中道为正、无问西东
数字化转型其实是一个比较夹生的表达方式。虽然“数字化”对这一进程本质的揭示更为深刻和普适,但不可否认的是,以“互联网”为前缀的表达方式在逆袭正劲的风口,具有更高的市场辨识度。
至顶网
业界供稿 2018-06-28 10:37:14
芯片设计的新武器:阿里云如何让AI帮工程师走出设计迷宫
阿里云智能集团研究团队在《VLSI设计期刊》发表突破性研究,提出基于图神经网络的芯片布局优化框架。该技术将复杂芯片设计转化为图形网络问题,通过AI系统自动寻找最优布局方案。实验显示相比传统方法,功耗降低15-18%,设计效率显著提升,已在智能手机和服务器芯片项目中成功应用。
至顶网
科技行者 2025-08-21 16:41:22
拍照文档歪歪扭扭?这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整!
这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。
至顶网
科技行者 2025-08-04 13:34:52
对话达观数据陈运文:我们在打破文本智能处理的“真空地带”
陈运文34岁那年,是2015年,他离开任职多年的大厂,转而投身于“大众创业、万众创新”的时代浪潮中。从此,他成为达观数据董事长兼CEO,他的使命是“扛起国内文本智能处理ToB业务这面大旗”。
至顶网
周雅 2022-09-20 10:25:54
微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量
微软发布Phi-4-Mini多模态语言模型,仅3.8亿参数却能媲美两倍规模模型性能。该模型采用创新"混合LoRA"技术,支持文本、图像、语音多模态输入,在数学推理、编程、语音识别等任务中表现出色,在OpenASR榜单排名第一。这种"小而精"设计理念为AI普及化提供新思路,使强大AI功能可在消费级设备运行。
至顶网
科技行者 2025-08-04 10:00:34
让AI真正"看懂"并编辑图片:上海交大团队开创视觉推理新基准
上海交大团队首次建立AI视觉推理评估标准RISEBench,测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度,揭示当前AI缺乏真正理解物理规律和逻辑关系的能力,为AI发展指明了从模式识别向深层推理转变的重要方向。
至顶网
科技行者 2025-07-16 09:17:45
ByteDance推出Seaweed-APT:1秒生成2秒高清视频,AI视频制作迈入实时时代
ByteDance研究团队开发出革命性的Seaweed-APT技术,实现了首个真正意义上的实时高清视频生成。该技术通过创新的对抗后训练方法,将传统需要25步和数分钟的视频生成过程压缩为单步1秒完成,能生成2秒长1280×720高清视频,视觉真实感提升37.2%。尽管在结构完整性方面存在一定权衡,但这项突破为AI内容创作、社交媒体、教育和娱乐等领域开启了实时视频生成的新时代。
至顶网
科技行者 2025-09-15 14:43:48
千人聚会、50万人围观,2024 AI创新者大会暨PEC·提示工程峰会顺利召开
一句提示词,一个新世界。
至顶网
金旺 2024-11-16 20:38:45
AI也有自己的"内心OS"?科学家首次破解大模型推理思考的神秘机制
俄罗斯人工智能研究院等机构的研究团队首次成功破解了大语言模型内部推理机制的奥秘。他们使用稀疏自编码器技术将AI模型复杂的内部状态分解成可理解的功能组件,并开发了ReasonScore评分系统来识别负责推理的特定组件。通过精确调节这些"推理组件",研究团队实现了AI推理能力的显著提升,为开发更可控、更透明的AI系统奠定了基础。
至顶网
科技行者 2025-08-04 11:15:46
AI也会"看脸色"了?南京大学团队让大语言模型学会了见机行事
这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度,该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制,让AI能在发现问题时"重新来过",显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。
至顶网
科技行者 2025-09-03 12:28:34
华盛顿大学等机构重磅推出"锚定解码"技术,让AI模型彻底摆脱版权纠纷困扰
华盛顿大学研究团队提出"锚定解码"技术,通过融合安全和危险AI模型的输出来降低版权侵权风险。该方法能在保持75%版权保护水平的同时维持高质量文本生成,为AI时代的版权问题提供了实用解决方案。
至顶网
科技行者 2026-02-11 13:00:38
AgentGym-RL:复旦大学团队让AI智能体在游戏中学会长期规划
复旦大学团队开发的AgentGym-RL框架通过渐进式训练让AI智能体学会长期规划和多步决策。该框架提供五种训练环境,配合ScalingInter-RL方法从简单任务开始逐步增加复杂度。实验显示70亿参数模型性能提升33.65个百分点,在27个任务中匹敌甚至超越千亿参数的商业模型如OpenAI o3和Gemini-2.5-Pro,为AI智能体训练开辟了新路径。
至顶网
科技行者 2025-09-22 14:54:48
首尔大学团队突破:让AI"压缩文档"变得更聪明,就像聪明的图书管理员一样快速找到关键信息
首尔大学研究团队开发出名为ECoRAG的智能文档压缩框架,解决了AI系统在处理长文档时效率低下和准确性不足的问题。该技术通过"证据性"概念区分有用信息与干扰内容,并具备自我反思能力来决定所需信息量。实验显示,新方法在保持更高准确率的同时,显著减少了处理时间和计算成本,为搜索引擎、在线教育、医疗诊断等领域带来广阔应用前景。
至顶网
科技行者 2025-06-16 09:44:34
基金会AI用"万亿级"网络安全数据训练出首个专业安全助手,竟能读懂黑客心思
Cisco基金会AI团队开发出全球首个网络安全专业对话AI助手Foundation-Sec-8B-Instruct,基于Llama 3.1架构并用50亿网络安全词汇训练。该AI助手在专业测试中超越GPT-4o-mini等大型模型,同时具备出色的对话能力和安全防护机制,能识别99%的恶意请求。已开源发布,为网络安全行业提供了accessible的专业智能助手解决方案。
至顶网
科技行者 2025-08-07 14:16:10
ArtifactsBench:腾讯混元团队重新定义AI代码生成评测标准,让机器写出真正能看能用的界面程序
腾讯混元团队推出ArtifactsBench,这是全球首个专门评测AI生成视觉交互代码质量的综合基准系统。该系统包含1825个真实应用场景测试任务,创新性地通过实际运行代码、动态截图、多模态AI评委等方式,从功能性、美观度、用户体验等十个维度进行评测。实验结果显示其与人类专家判断一致性超过90%,与业界金标准WebDev Arena的一致性达94.4%,为AI代码生成能力评估树立了新标准。
至顶网
科技行者 2025-07-11 10:13:36
<
上一页
495
496
497
498
499
500
501
502
503
504
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号