个人简介
专注自然语言处理与大语言模型落地,具备从模型设计、数据构建、训练微调、推理加速到工程部署的全栈能力。当前负责北京匠数科技 NLP 方向,长期聚焦大模型能力在政务、公考教育、内容审核与智能营销等业务中的规模化应用。
开源与社区:活跃于开源社区,GitHub 账号 liwenju0(https://github.com/liwenju0)。在 sglang、ragflow 等项目有多项 PR 贡献,聚焦推理优化与工程可用性提升。
联系方式
核心技能
- AI Infra/系统优化:CUDA/算子优化与 FlashAttention 加速;性能基线、回归监控与容量规划
- 推理引擎与部署:TensorRT 与 Triton Server(Repository Agent/模型加解密);多模型版本治理与可重复部署
- 大模型工程:预训练、SFT、LoRA、RLHF、RAG 端到端落地与评测;推理路径优化与资源成本优化
- 扩散模型/Step1X:熟悉扩散模型原理与工程化实践,撰写多篇 Step1X 执行流程分析与优化笔记,具备落地与故障定位经验
- 编程与框架:Python、Java,熟悉 C++;PyTorch、TensorFlow 框架及内部实现理解
- AI 辅助开发:熟练使用 Cursor AI 代码编辑器(极早期年会员,已续费第二年),利用智能代码补全、自然语言编辑等 AI 功能提升开发效率
- NLP 任务与算法:基于 Transformer 的文本分类、语义匹配与内容审核等
- 研究与表达:中英文论文阅读与实现(CET‑6),工程文档与技术写作
- 全栈交付:需求抽象→数据→训练→评测→部署→运维的闭环交付
工作经历
- 北京匠数科技有限公司|NLP 方向负责人(2022.05—至今)
负责大模型在内容生成与内容安全方向的产品化及规模化部署。
- 华图宏阳网络科技公司|NLP 算法负责人(2019.07—2022.05)
负责公考教育场景 NLP 系统,包括作文批改、情感分析与智能营销等。
- 阿里巴巴达摩院|高级算法工程师(2018.05—2019.06)
参与对话系统与智能语音产品业务,产出面向规模用户的对话能力。
- 解放军陆军|现役军官(2007.06—2018.05)
教育经历
- 2010.08—2012.12 国防科学技术大学|硕士|公共管理(信息管理方向)
- 2003.08—2007.06 国防科学技术大学|本科|军队管理
说明:国防科学技术大学是军队唯一 985/211 院校;硕士为全国统招。
代表项目
- 基于大模型的公文写作助手(负责人,2022.07—2023.09)
基于开源大模型结合内部语料微调,实现政务公文智能写作(输入标题自动生成整篇)。
- 业务价值:已在某市政府部门落地,显著提升政务媒体写作效率。
- 我的工作:数据构建与清洗;大模型微调与效果评估;部署与上线运营。
- 网盯文本审核系统(负责人,2022.05—至今)
结合多模型实现文本审核、错别字校对与语法提醒。
- 业务价值:公司核心产品,年营收规模较大。
- 我的工作:数据标注与评估;FastText/BERT 训练评估;工程部署与运维。
- 作文智能批改(核心人员,2019.07—2021.09)
面向申论作文的自动批改系统。
- 业务价值:业内首个深度学习公考作文批改系统;支撑数百场在线模考,累计百万级人次。
- 我的工作:整体算法方案;基于 Transformer 的论点/论据抽取评级(论点正确率 80%+);知识融合与篇章结构融合提升匹配精度。
- 客户智能营销系统(负责人,2021.05—2022.02)
基于用户行为序列的购课意向预测,为销售提供高意向线索。
- 业务价值:提升销售效率,约 1/3 业绩来自系统推荐。
- 我的工作:需求调研与问题形式化;数据收集与模型验证(含 AB 测试);工程架构与实现。
- 学员评论情感分析(核心人员,2021.03—2022.03)
- 业务价值:累计为老师提供数千条课程建议,负面评论显著下降。
- 我的工作:Multi-Source Transformer 情感分类;TensorRT 推理加速(速度提升数倍);Active Learning 提升标注效率(效率提升数倍)。
- 你想我猜·智能对话游戏(项目组长 5 人,2018.06—2019.05)
- 业务价值:助力智能音箱 DAU 显著提升,全平台累计用户数百万。
- 我的工作:融合问题的回答意图识别(准确率 90%+);基于回传的对话状态管理(开发效率提升);最大熵对话策略;模型迭代平台架构(热门人物智能发现)。
- 二哈电话助手(核心成员,2018.11—2019.05)
- 业务价值:业界首创,上线后被多家公司模仿;智能音箱 APP DAU 显著提升。
- 我的工作:立项调研与 DEMO;对话策略管理架构;意图识别模型设计与实现。
授权专利(节选)
- 一种中文议论文智能批改方法和系统(CN112784878A)
- 一种文本分类的方法、装置、电子设备及存储介质(CN115982368A)
- 一种文本内容异常检测的方法、装置、设备及介质(CN115809662A)
- 一种文本纠错方法、装置、电子设备及介质(CN115630645A)
- 一种文本检测的方法、装置、电子设备及存储介质(CN115563288A)
- 文本内容审核方法、装置及电子设备(CN115587588A)
开源贡献与社区
代表性贡献(节选)
- sglang:Kimi-VL多模态模型支持(PR #5383,已合入主分支)
- 技术规模:79次提交,影响13个文件(+1,189/-11行),获得核心维护者认可
- 核心贡献:为sglang框架添加Kimi-VL多模态模型支持,实现图像理解能力
- 技术实现:
- 模型配置集成:添加Kimi-VL模型配置,兼容现有DeepSeek配置风格
- 接口扩展:新增embedding获取方法,完善多模态推理接口
- 本地验证:实现图像理解测试用例,验证”What’s in this image?”等场景
- 技术影响:扩展sglang多模态推理能力,支持视觉-语言联合任务
- 社区认可:通过Code Review,获得@zhyncs、@BBuf、@merrymercy等核心维护者认可并成功合入主分支