News

总而言之,在视频业务、AI业务的多重压力下,移动通信网络的上行能力提升变得迫在眉睫。在新一代移动通信技术标准5G-A中重点加强上行能力,打造Gbps级的上行速率,也成为整个行业的普遍共识。
奥特曼最新YC访谈火遍全网!他首次曝出创业至暗时刻,差点放弃创立OpenAI,甚至劝诫所有人不要再走ChatGPT老路,完全没有机会。 奥特曼YC创业学院访谈,终于放出了。
这些大模型在面对数学证明题目时,自信满满地输出了「解题思路」和「证明过程」,一切看上去井井有条。但你是否注意到,很多推理其实没有解释关键步骤,甚至直接用一个「看起来合理的句子」替代了逻辑推导?
为此,一种叫做 Sparse Autoencoder(简称 SAE) 的新兴技术正迅速崛起,成为当前最热门的 mechanistic interpretability(机制可解释性) 路线之一。最近,我们撰写并发布了第一篇系统性的 SAE ...
因此,收购一家价值数十亿美元的AI企业,将标志着苹果在并购策略上的重大转变。但如果仍然维持过去那种谨慎保守的节奏,苹果可能将在这场继智能手机之后最关键的科技竞赛中,被彻底甩开。
这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
近日,中国科学院自动化研究所的研究人员提出了一种创新性框架 ——DrSR (Dual Reasoning Symbolic Regression):通过数据分析与经验归纳 “双轮驱动”,赋予大模型像科学家一样 “分析数据、反思成败、优化模型” 的能力 ...
1. 场景生成组件:从真实地理信息数据出发,通过生成模型在线增强纹理、简化几何结构,让粗糙的3D数据焕然一新。更妙的是,它还能创造出交互式对象和高度还原的室内细节。
借助稳定的奖励计算机制、改进版GRPO算法以及延长的训练过程,在不同任务上,新模型Nemotron-Research-Reasoning-Qwen-1.5B都展现出强大的泛化能力。 项目链接:https://huggingface.co/nvidia ...
最近兴起的智能体,就是要求模型利用自身知识,在没有大量与环境互动的情况下生成更优的行动预测,比如思维链(CoT)就能让模型能够对观察到的历史和自己的行动进行推理,提升与环境互动的表现。 不过,在决策(decision-making)场景中,「知识储备 ...
过去,只有在预训练完全结束后,才能启动后训练,最后评估模型的性能。比如说,GPT-4或GPT-4.5(又称Orion),这些模型通常需要大量后训练来「驯服」预训练模型,但性能难以预测,完成时间也具有高度不确定性。
尽管人工智能(AI)在飞速发展,当前 AI ...