大模型工程前沿 · 研发招聘 | Ascend Model Ecosystem

DeepSeekModel AgentvLLMQwenTool Use量化GLMMCPSGLangLlamaFunction CallingKV-Cache推理加速Multi-AgentPyTorchMistralReAct算子优化KimiRAGverlMoE工具编排RLHFFlash AttentionYiAgentic Workflow长上下文LoRASFTDPOTP / PP / EPMiniCPMPlanning投机解码连续批处理

01 — WHAT WE DO

我们站在大模型工程的最前沿 —— 把头部模型跑通、调快、做成 Agent，让前沿能力真正落到生产里。

/ ADAPT 适配

头部模型适配

DeepSeek、Qwen、GLM 等头部模型的快速适配与精度对齐，把开源生态搬到目标算力上。

查看职责

/ OPTIMIZE 调优

极致性能工程

从推理框架到算子，吞吐、时延、显存全链路调优，把模型推到硬件能力边界。

查看职责

/ AGENT 智能体

Model Agent 开发

把适配与调优经验沉淀为一站式 Agent 工具集，让模型全流程自动化、可复用。

查看职责

02 — TRY IT

上手玩玩，这就是我们每天做的事

两个小演示：亲手"调优"一次，看 Model Agent 把全流程一键跑完。

DEMO 01 · 性能调优

调优，就是把这条曲线往上推

拖动滑块，或一键对比"优化前 / 后" —— 吞吐、时延、显存实时联动。

OPTIMIZATION LEVEL 60%

* 数值为示意，用于直观表达"调优"对吞吐/时延/显存的影响。

吞吐 Throughput tokens/s

2.0×

时延 Latency P50

64%

显存 Memory peak

74%

DEMO 02 · Model Agent

一句话，让 Agent 跑完模型上线全流程

搜索 → 验证 → 适配 → 优化 → 量化 → 部署 → 文档，7 步全自动。

Agent 正在自动跑完 7 步…

真实上手 · 4 步在昇腾容器里跑起来

1打开平台，选择 昇腾算力容器 并启动。

2点击 「终端」，进入容器命令行。

3输入 claude 回车，进入 Claude（Model Agent 已内置）。

4把这句话发给它 —— 剩下的全交给 Agent：

请帮我把 Qwen3.5-0.8b 在昇腾上适配，并做优化

打开昇腾算力容器 ↗

03 — OUR RESULTS

成果，都在这张全景图里

我们的成果对外橱窗 —— 昇腾模型生态全景平台。

昇腾模型生态全景平台

全景生态、系列模型与场景方案，一处尽览 —— 背后是 Model Agent 与全链路调优的工程沉淀，让国产算力跑得通、跑得快、跑得稳。

全景生态系列模型场景方案国产算力

访问全景平台

模型总数

已适配模型数

昇腾 Agent Skills

场景方案

04 — OPEN ROLES

三个方向，等你加入

不看你来自哪里，看你能把模型在算力上推到多快、多稳、多智能。

大模型后训练

POST-TRAINING

▹SFT / RLHF / DPO 等后训练与偏好对齐链路的设计与落地。
▹熟悉 verl 等 RL 训练框架，掌握数据构造与奖励建模。
▹大规模分布式训练调优与稳定性保障。

verlRLHF分布式训练

大模型推理适配与调优

INFERENCE & TUNING

▹头部模型在目标算力上的适配与精度对齐。
▹推理性能极致优化：吞吐 / 时延 / 显存、量化、并行。
▹深入 vLLM / SGLang / PyTorch 推理栈与算子。

vLLMSGLang量化 / 并行

Agent 开发

AGENT ENGINEERING

▹研发 Model Agent 的 Skills 与全流程工作流编排。
▹用 LLM + 工具编排把人工经验自动化为可复用能力。
▹打磨开发者体验：CLI / IDE 插件 / 流水线。

PythonAgent 编排LLM 应用

来把前沿模型推到更快、更稳、更智能

后训练、推理调优、Agent 开发 —— 总有一个方向适合你。

投递简历先看看我们的代码

简历投递 · charlotte77_hu@sina.com

扫码加我 · 直接聊聊