用了 0.122087秒,为您找到澳洲 幸运 10 怎么 才能 網纸 YB233相关内容7039 条
  • SCIENCEBOARD:评估科学工作流中的多模态自主智能体

    SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
    至顶网  科技行者  2025-06-01 11:18:02  
  • 小说竞技场:当AI作家与网文达人同台竞技 - WebNovelBench将大模型小说家放在网文分布图上

    WebNovelBench研究为评估AI的长篇故事创作能力提供了突破性方法,利用4000多部中国网络小说建立基准,将AI小说家与人类作品进行直接比较。研究者设计了"摘要转小说"任务,通过八个叙事维度进行评估,发现顶级AI模型如Qwen3-235B-A22B已接近高质量人类创作水平。研究揭示了开源模型正快速追赶专有模型,并为AI创意写作评估提供了可靠标准。这项工作不仅展示了AI在叙事创作领域的进步,也为理解人工智能与人类创造力的关系提供了新视角。
    至顶网  科技行者  2025-05-27 17:07:25  
  • 英伟达推出Llama-Nemotron:开源推理优化的高效思维模型

    想象一下,如果传统AI模型是一辆可以载你去任何地方的汽车,那么这些新的"思维模型"就像是既能当汽车用,又可以变身为越野车的变形金刚。在平坦道路上,它们像普通汽车一样高效运行;遇到复杂地形,它们就能切换到更强大的思维模式,慢慢思考并解决困难问题。英伟达的这项技术突破正是要让这种转换变得更加自然、高效。
    至顶网  科技行者  2025-05-06 11:39:12  
  • 探索中国农业新路径,拼多多五年打造1000个“多多农园”

    4月21日,在上海市政府合作交流办的指导下,拼多多创新扶贫助农模式“多多农园”,首站落户云南保山。通过“多多农园”,拼多多将实现消费端“最后一公里”和原产地“最初一公里”直连,探索农业产业新模式,让农户成为全产业链的利益主体。
    至顶网  科技行者  2019-04-22 17:26:24  
  • 参加完这场阿里云中企出海大会,我脑海中浮现出三个类比

    人与人之间的交流,有时距离会产生美,但对做生意而言,距离往往只能产生更高的成本。
    至顶网  高飞  2025-05-26 18:44:47  
  • 观远数据发布一站式BI 6.0:融合大语言模型,赋能数据驱动的敏捷经营

    2023年,在复杂严峻的外部环境影响下,商业环境愈发多变难测,市场进入周期更替的“蕴新”时刻,对企业应对内外变化的能力提出更高要求。
    至顶网  业界供稿  2023-10-23 17:04:57  
  • AI与物联网科技如何重塑农业形态

    第四次农业革命即将到来。包括物联网(IoT)部署(即用于收集和传输数据的数字化设备)以及AI在内的技术进步,正将效率推向新的顶点,并有望再次从根本上改变人类宰治整个地球的具体方式。
    至顶网  至顶网人工智能频道  2024-09-14 18:23:22  
  • 芯片人才热,最资深的猎头都感到疲惫

    「当前最火爆的赛道之一“芯片行业”正在进行一场洗牌,大量资金的涌入让无数创业公司崛地而起,芯片行业的机会已经多到眼花缭乱。 今日推荐 晚点AUTO(id:gh_30ebd85b0f58)一篇文章,作者:马慧 编辑:黄俊杰。」
    至顶网  至顶网码客人生频道  2022-09-30 10:22:34  
  • 关于当前的宏观形势与市场化改革 ——彭森在“中国新基建领导力峰会”上的讲话

    2020年12月18日,在“2020中国新基建领导力峰会”上,中国经济体制改革研究会会长、国家发展和改革委员会原副主任彭森发表了《当前宏观形势与市场化改革》的主旨演讲。
    至顶网  至顶网数字化转型频道  2020-12-21 11:21:22  
  • 新型存算分离架构技术展望

    大数据存储解决方案一般有存算融合和存算分离两种部署形态。
    至顶网  业界供稿  2022-11-29 17:08:10  
  • Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI

    Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI
    至顶网  至顶AI实验室  2025-06-16 17:03:47  
  • ByteDance的双模型机器人导航系统:让移动机器人像人一样聪明地到处走动

    ByteDance Seed团队开发了名为Astra的革命性双模型机器人导航系统,让机器人具备类似人类的环境理解和导航能力。该系统包含Astra-Global和Astra-Local两个模块,前者负责理解自然语言指令和全局定位,后者处理局部路径规划和避障。通过创新的混合拓扑-语义地图、4D时空编码器和掩码ESDF损失等技术,系统在仓库、办公楼等复杂环境中实现了84%-99%的高成功率,显著超越传统方法,为智能机器人助手的实现奠定了重要基础。
    至顶网  科技行者  2025-06-13 08:04:11  
  • AI终于学会了"看声音":Captions公司让机器理解语音背后的表情和手势

    Mirage向我们展示了一个令人兴奋的未来——一个AI不仅能理解我们说什么,还能理解我们如何说的世界。在这个世界里,技术不再是冰冷的工具,而是能够理解和模拟人类情感表达的智能伙伴。
    至顶网  至顶AI实验室  2025-06-12 17:57:09  
  • 华为:逆转操作系统之“熵”

    无法被断供的鸿蒙,正在筑起一座城。
    至顶网  高飞  2020-09-16 12:09:22  
  • AutoMat:清华大学与上海AI实验室联合打造的"智能显微镜"——从电镜图像自动重建晶体结构的革命性工具

    清华大学和上海人工智能实验室联合开发的AutoMat是一个突破性工具,能自动将电子显微镜图像转换为精确的晶体结构模型并预测材料性质。系统整合了模式自适应降噪、物理引导模板匹配、对称感知结构重建和机器学习性质预测四大模块,由大语言模型代理协调运行。在自创的STEM2Mat-Bench基准测试中,AutoMat远超现有多模态大语言模型,为桥接显微镜成像与原子模拟提供了自动化解决方案,显著加速了材料科学研究流程。
    至顶网  科技行者  2025-05-27 13:26:04  
  • RAVENEA: 哥本哈根大学团队开创多模态检索增强视觉文化理解新基准

    RAVENEA是哥本哈根大学研究团队开发的首个多模态检索增强视觉文化理解基准,集成了超过10,000份人工标注的维基百科文档,用于评估视觉语言模型的文化敏感性。研究发现,轻量级视觉模型在配备文化感知检索功能后,在文化视觉问答和图像描述任务上分别提升了至少3.2%和6.2%的性能,证明了检索增强方法在提升AI文化理解能力方面的有效性,为构建更具文化包容性的视觉AI系统开辟了新路径。
    至顶网  科技行者  2025-05-28 18:35:42  
  • 学了七年计算机,我没换来一个初级程序员工作,也没实现留在国外的梦

    2022年的高考刚落下帷幕,填报志愿又成为了另一个战场,牵系着每个家庭的心,其中最受瞩目的就是那些热门专业。 选择热门专业往往意味着未来会有更多的工作机会、更高的收益回报,但这样真的就等于选择了一条正确的道路吗?
    至顶网  尼酱  2022-07-06 11:13:05  
  • Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件

    Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
    至顶网  科技行者  2025-05-23 07:40:18  
  • Meta发布J1:通过强化学习激励LLM思考和做出更好的判断

    这篇研究介绍了Meta公司开发的J1系统,这是一种通过强化学习训练大语言模型进行评判的创新方法。J1将可验证和不可验证的提示转换为具有可验证奖励的判断任务,从而鼓励模型在做出决策前先进行思考。研究表明,J1在8B和70B参数规模下都超越了同等规模的现有模型,甚至在某些测试中超过了更大的模型如o1-mini和DeepSeek-R1。这种方法的核心创新在于不仅优化最终判断,还优化思考过程本身,使模型学会制定评估标准、生成参考答案并重新评估回答的正确性。
    至顶网  Hugging Face  2025-05-16 17:09:21  
  • 2023双态IT乌镇用户大会圆满结束! 聚焦云原生、大模型,共议IT新质生产力

    2023年10月14日上午,2023第六届双态IT乌镇用户大会两大主题峰会之一的“云原生和大模型革新IT生产力主题会议”成功举办。
    至顶网  业界供稿  2023-10-18 11:22:22  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号