研发团队招募中 · WE'RE HIRING

我们做最前沿的
Agent

DeepSeek、Qwen、GLM 跑得更快、更省、更稳;做 大模型后训练推理适配与调优Model Agent 开发 —— 把推理与训练的 infra 一路推到能力边界。

01 — WHAT WE DO

我们站在大模型工程的最前沿 —— 把头部模型跑通、调快、做成 Agent,让前沿能力真正落到生产里。

/ ADAPT 适配

头部模型适配

DeepSeek、Qwen、GLM 等头部模型的快速适配与精度对齐,把开源生态搬到目标算力上。

查看职责
/ OPTIMIZE 调优

极致性能工程

从推理框架到算子,吞吐、时延、显存全链路调优,把模型推到硬件能力边界。

查看职责
/ AGENT 智能体

Model Agent 开发

把适配与调优经验沉淀为一站式 Agent 工具集,让模型全流程自动化、可复用。

查看职责
02 — TRY IT

上手玩玩,这就是我们每天做的事

两个小演示:亲手"调优"一次,看 Model Agent 把全流程一键跑完。

DEMO 01 · 性能调优

调优,就是把这条曲线往上推

拖动滑块,或一键对比"优化前 / 后" —— 吞吐、时延、显存实时联动。

* 数值为示意,用于直观表达"调优"对吞吐/时延/显存的影响。
吞吐 Throughput tokens/s
2.0×
时延 Latency P50
64%
显存 Memory peak
74%
DEMO 02 · Model Agent

一句话,让 Agent 跑完模型上线全流程

搜索 → 验证 → 适配 → 优化 → 量化 → 部署 → 文档,7 步全自动。

Agent 正在自动跑完 7 步…
真实上手 · 4 步在昇腾容器里跑起来
1打开平台,选择 昇腾算力容器 并启动。
2点击 「终端」,进入容器命令行。
3输入 claude 回车,进入 Claude(Model Agent 已内置)。
4把这句话发给它 —— 剩下的全交给 Agent:
请帮我把 Qwen3.5-0.8b 在昇腾上适配,并做优化
03 — OUR RESULTS

成果,都在这张全景图里

我们的成果对外橱窗 —— 昇腾模型生态全景平台。

昇腾模型生态全景平台

全景生态、系列模型与场景方案,一处尽览 —— 背后是 Model Agent 与全链路调优的工程沉淀,让国产算力跑得通、跑得快、跑得稳。

全景生态系列模型场景方案国产算力
访问全景平台
0
模型总数
0
已适配模型数
0
昇腾 Agent Skills
0
场景方案
04 — OPEN ROLES

三个方向,等你加入

不看你来自哪里,看你能把模型在算力上推到多快、多稳、多智能。

大模型后训练

POST-TRAINING
  • SFT / RLHF / DPO 等后训练与偏好对齐链路的设计与落地。
  • 熟悉 verl 等 RL 训练框架,掌握数据构造与奖励建模。
  • 大规模分布式训练调优与稳定性保障。
verlRLHF分布式训练

大模型推理适配与调优

INFERENCE & TUNING
  • 头部模型在目标算力上的适配与精度对齐
  • 推理性能极致优化:吞吐 / 时延 / 显存、量化、并行。
  • 深入 vLLM / SGLang / PyTorch 推理栈与算子。
vLLMSGLang量化 / 并行

Agent 开发

AGENT ENGINEERING
  • 研发 Model Agent 的 Skills 与全流程工作流编排。
  • LLM + 工具编排把人工经验自动化为可复用能力。
  • 打磨开发者体验:CLI / IDE 插件 / 流水线
PythonAgent 编排LLM 应用

来把前沿模型推到更快、更稳、更智能

后训练、推理调优、Agent 开发 —— 总有一个方向适合你。

简历投递 · charlotte77_hu@sina.com
微信二维码 扫码加我 · 直接聊聊