新旗舰级人工智能模型 人工智能最新产品
摘要:根据“TheInformation”的报道显示,两位直接知情人士透露,深度求索(DeepSeek)预计将在未来几周内推(2月中旬农历新年前后)出代号为V4的新一代旗舰级人工智能模型,该模型主打强,新旗舰级人工智能模型 人工智能最新产品

根据“The Information”的报道显示,两位直接知情人士透露,深度求索(DeepSeek)预计将在未来几周内推(2月中旬农历新年前后)出代号为V4的新一代旗舰级人工智能模型,该模型主打强劲的代码生成能力。
据悉,DeepSeekV4在超长代码提示词的处理和解析上实现了决定因素突破,支持百万级tokens上下文窗口。
可一次性消化整个中型项目的代码库、技术文档和需求说明,精准领会跨文件依赖关系,化解复杂软件项目开发中的上下文断裂难题,这对开发大型体系、重构遗留代码、领会复杂技术文档具有革命性价格。
V4还化解了AI训练中的壹个常见难题 ——数据玩法领会能力在训练全阶段无衰减,这和传统模型随着训练次数增加性能下降的情况形成鲜明对比。
该突破使模型能更高效地从海量数据中进修,摆脱单纯记忆数据的局限,形成更深刻的抽象领会能力。
DeepSeek员工基于企业内部基准开展的初步测试显示,该模型在代码生成领域的表现优于Anthropic、Claude、生成式预训练变换器系列(OpenAI GPT)等现有主流模型。
还有行业消息称,V4 也许采用最新的mHC架构,具备更好的并行计算效率和国内芯片适配能力,有望降低部署成本,进步推理速度,为大规模商业化应用奠定基础。
值得一提的是,就在本月4日,DeepSeek 在arXiv上更新了R1论文,页数从22页扩展到86页,新增完整训练管线拆解、20多个评价基准的详细数据,被视为给V4的公开做好了技术准备。
