根据近期国内外多个开源社区的榜单和数据,目前国内主流的开源大模型不仅在数量上非常丰富,其整体性能也已经达到国际领先水平。以下为你梳理了部分主要代表及其特点。 为了方便你快速了解,下表汇总了几个核心的开源大模型系列:
模型系列 / 名称 | 主要开发机构 | 核心特点与近期表现 |
通义千问(Qwen)系列 | 阿里巴巴 | 模型矩阵非常完整(从1.8B到超千亿参数),在编程(Qwen3-Coder)、推理、多模态(视频生成Wan2.2)等多个领域均有顶尖开源模型。 |
GLM系列(如GLM-4.5) | 智谱AI | 近期在Hugging Face总榜登顶的开源“全能型”模型,原生融合了推理、编码和智能体(Agent)能力。 |
DeepSeek-R1系列 | 深度求索 | 以强大的数学和代码推理能力著称,在相关专项评测中表现突出。 |
Kimi K2系列 | 月之暗面 | 采用混合专家(MoE)架构,总参数量大,在长上下文处理和智能体任务方面有优势。 |
豆包大模型 | 字节跳动 | 采用MoE稀疏架构以降低推理成本,在企业级智能体平台和应用方面有较多落地。 |
Step系列 | 阶跃星辰 | 原生多模态推理模型,在图像、文本统一理解方面能力较强。 |
Skywork系列 | 昆仑万维 | 在多模态领域有布局,如图像理解与生成统一模型Skywork-UniPic。 |
Baichuan系列 | 百川智能 | 较早开源的中英双语模型,在代码和数学能力上表现稳定,近期也发布了MoE架构模型。 |