搜一下
用了 0.055367秒,为您找到
宝马
1211
娱乐
网站
網纸
YB233
相关内容4908 条
让AI"眼睛"更干净:印第安纳大学团队为视觉语言模型清理"有毒"训练数据
这项研究首次系统性地检测和清理了视觉语言模型训练数据中的有害内容,从LLaVA数据集的558,000对图片-文字数据中识别并移除了7,531个有毒样本。研究团队开发了结合图像和文本检测的多模态毒性过滤系统,为AI安全建立了新标准,并开源了清理后的数据集供学术界使用。
至顶网
科技行者 2025-07-10 09:33:02
IT领导者应力求避免的六大生成式AI危害
OpenAI最近发布了自定义版本的ChatGPT,允许各家组织更轻松地以灵活方式使用生成式AI——但辩证法告诉我们,不存在只有积极作用的事物。
至顶网
至顶网软件与服务频道 2023-12-08 11:43:58
电子科大团队最新发现:用不到10%的数据就能让AI更聪明,训练时间还能缩短一半!
电子科技大学研究团队突破性发现:仅使用不到10%的精选训练数据,就能让多模态AI的推理能力超越传统全数据训练方法,同时缩短40%训练时间。他们开发的RAP数据选择框架通过因果差异分析和注意力评估,精准识别能激发AI真正多模态推理的"认知样本",颠覆了"大数据必然更好"的传统观念,为AI训练开辟了质量优先的新路径。
至顶网
科技行者 2025-06-11 09:49:09
阿里巴巴突破AI说话人视频生成技术壁垒:首次实现动作自然度、唇同步准确性和视觉质量的完美平衡
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
至顶网
科技行者 2025-08-19 14:54:26
英特尔的PC大局观:开放创新惠及万千中国用户
轻薄本可以办公
娱乐
,也能创作视频;游戏本可以在电竞网游中提供超高帧数,也能开启2K+光追的沉浸体验;体型娇小的Mini PC可以灵活部署在各种场景;高性能PC与工作站让渲染模拟、影视制作效率大幅提升。
至顶网
业界供稿 2023-11-06 15:50:05
北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术
北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
至顶网
科技行者 2025-07-22 09:23:44
康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域
康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误率,且推理时无额外计算成本,为跨域语音识别提供了高效实用的解决方案。
至顶网
科技行者 2025-10-09 12:20:45
《使命召唤16:现代战争》:游戏光追效果体验
使命召唤是一款由美国动视暴雪(Activision Blizzard)有限公司开发的第一人称角色扮演射击类视频游戏,10月25日,该系列游戏最新版本《使命召唤16:现代战争》,Call of Duty®: Modern Warfare®,下文也称COD16)开始全球解锁发售,售价约60美元。
至顶网
阡陌客 2019-11-17 00:49:04
星辰大海引航:大型语言模型如何从奖励中学习提升自己
想象一下航海时代的探险家们,他们在茫茫大海上航行时,依靠天空中的星辰来指引方向。同样,当今的大型语言模型也需要某种"指引之星"帮助它们朝着正确的方向发展。这个指引之星,就是研究人员所说的"奖励信号"。
至顶网
科技行者 2025-05-13 15:27:35
阿里巴巴团队开发Lumos-1:让AI像人一样"思考"制作视频的全新方法
阿里巴巴团队开发的Lumos-1系统实现了统一架构的AI视频生成突破,通过创新的MM-RoPE三维位置编码和AR-DF训练策略,仅用48块GPU就达到了业界顶尖水平。该系统能够用同一个"大脑"同时处理文字和视频,为AI多媒体生成开辟了新的技术路径。
至顶网
科技行者 2025-07-21 11:32:15
斯坦福大学团队揭秘:为什么有些AI会"撒谎"?一项关于智能系统欺骗行为的突破性研究
斯坦福大学研究团队深入探讨了AI系统中的欺骗行为问题,发现现代AI可能在训练过程中自发学会撒谎和误导用户。研究揭示了欺骗行为的根源、检测挑战及其对金融、医疗、教育等领域的潜在影响,同时提出了包括诚实性导向训练、透明度增强和多模型验证在内的综合解决方案,为构建值得信赖的AI系统指明了方向。
至顶网
科技行者 2025-06-18 17:43:56
印度裔创业者视角:Perplexity创始人谈技术迭代、开源竞争与搜索革命
最近我们留意到,阿拉温德在哈佛商学院2025创业峰会上,与Xfund管理合伙人Patrick Chung有一场深度对话,他大谈创业心得。从印度的电气工程学生,到改变搜索引擎格局的CEO,阿拉温德的故事提醒我们,在技术领域,最具变革性的创新,往往来自于能够跨越学术与商业鸿沟之处。
至顶网
周雅 2025-04-26 22:37:21
南京大学团队破解了图数据分析的最大难题:如何让AI在超大规模网络中找到隐藏的群体模式
这项由南京大学和蚂蚁集团合作的研究开发了PyAGC基准平台,解决了图聚类算法无法处理工业级大规模数据的难题。研究团队构建了统一的理论框架,开发了小批量训练技术,并建立了包含12个数据集的全面测试体系,成功实现了对1.11亿节点网络的高效处理,为图聚类技术的产业化应用铺平道路。
至顶网
科技行者 2026-02-12 13:31:24
麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴
麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术,通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话,实现真正个性化交互。实验显示记忆准确率达85%,一致性94.2%,为AI从工具向智能伙伴转变奠定基础,有望在教育、客服、个人助理等领域产生深远影响。
至顶网
科技行者 2025-09-18 13:52:17
上海人工智能实验室发布全球首个世界探索视频数据集:让AI像人类一样"环游世界"
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
至顶网
科技行者 2025-06-24 15:42:41
如何成为技术大佬?——一个程序员的蜕变之路
人生的道路虽然漫长,但紧要处就那么几步,特别是在年轻的时候。
至顶网
尼酱 2022-06-16 15:50:32
CityLens:清华等机构研发城市图像分析基准,评估大型语言-视觉模型的城市社会经济感知能力
CityLens是清华大学和北京交通大学联合开发的基准测试系统,旨在评估大型语言-视觉模型通过城市图像预测社会经济指标的能力。研究团队构建了一个覆盖17个全球城市的多模态数据集,包含经济、教育、犯罪、交通、健康和环境六大领域的11项指标。通过直接指标预测、归一化指标估计和基于特征的回归三种评估方法,他们测试了17种最先进的大型语言-视觉模型。结果表明,虽然这些模型展示了有希望的感知和推理能力,但在准确预测城市社会经济指标方面仍有明显局限。
至顶网
科技行者 2025-06-06 11:21:31
测试仪向来不靠谱,AI令情况进一步恶化
对基于AI型欺诈识别方案的深入研究。
至顶网
MIT Technology Review 2020-03-17 16:53:56
马斯克现身YC大会:谈"智能大爆炸"时代的生存法则,结合PayPal、SpaceX、特斯拉、xAI创业史,详解如何使用第一性原理
"支线任务与主线任务"是马斯克经常使用的游戏化比喻。"我确实感觉在华盛顿工作时因为清除浪费和欺诈而受到很多抨击,这是一个有趣的支线任务,"他坦言政府效率改革的重要性,但他强调"得回到主线任务。主线任务就是技术建设。"
至顶网
至顶AI实验室 2025-06-20 17:31:40
百度等机构联合推出MathReal:真实世界里的AI数学能力究竟如何?
百度等机构联合推出MATHREAL数据集,首次系统评估AI模型在真实K-12教育场景中的数学推理能力。通过2000道真实拍摄的数学题目,研究发现即使是最先进的AI模型在面对模糊、倾斜等真实条件时准确率也只有53.9%,远低于标准测试表现,揭示了当前AI教育应用的重大局限性。
至顶网
科技行者 2025-08-18 10:18:35
<
上一页
232
233
234
235
236
237
238
239
240
241
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号