档案主页
介绍
项目经验
企业级大模型智能平台建设项目(RAG + Tool Calling)
角色:大模型平台工程师
关键职责与成果:
- 基于 Dify 和 DeepSeek 搭建企业级私有 RAG 问答系统,支持语义搜索与多轮问答;
- 构建知识库文档处理流程,支持 PDF/Word/网页等多格式文档切分、embedding 与索引(FAISS);
- 实现企业级身份认证接入,确保模型问答权限与数据隔离;
- 基于 MCP 思路,开发大模型工具调用能力,支持数据库查询(ClickHouse)、API 请求、知识检索等工具接入;
- 利用 Function Calling + LangChain 实现工具自动发现与调用,构建具备执行能力的 LLM Agent;
- 平台已部署于多个业务部门,支撑制度问答、数据查询等场景,日均请求量超千次。
技术关键词: Dify、DeepSeek、大模型私有化、RAG 架构、知识库构建、FAISS、MCP、多工具调用、Function Calling、LangChain、ClickHouse、API 集成、LLM Agent
高校数据平台建设项目(多个高校)
项目角色:大数据工程师 项目简介: 参与多个高校数据治理与分析平台建设,涵盖教务、安防、资产等系统多源数据采集与处理,构建统一数据处理流程,提升数据质量与应用效率。
关键职责与成果:
- 负责多个高校项目的数据开发工作,覆盖离线与实时数据采集、清洗、建模及调度;
- 针对实时人员进出门禁数据和人脸摄像头抓拍数据,设计并开发接口接收推送的实时数据;
- 将实时数据对接至 Kafka 消息队列,实现高效异步消费与后续处理;
- 后期通过 Apache NiFi 进行数据流的简单配置与管理,实现数据推送的灵活接入和转发,降低开发复杂度;
- 基于 DataX 自研 Reader 插件,集成多种API接口,支持稳定数据抽取;
- 利用 Spark 封装通用清洗模块,抽象字段映射和异常处理,提升跨项目复用性和数据口径统一;
- 构建标准化数据分层(ODS → DWD → DWS),保证数据一致性和可扩展性;
- 通过 Zeppelin + DolphinScheduler 实现清洗任务调试和调度自动化;
- 自主开发 easybd 工具,将 Excel 中的清洗逻辑自动转换为 SQL 和 DataX 配置,提升开发效率并降低沟通成本;
- 独立负责大数据平台的服务器部署与运维,保障系统稳定可靠运行。
技术关键词: Kafka、Apache NiFi、DataX 插件开发、Spark、Zeppelin、DolphinScheduler、easybd 工具(自研)、Java、SQL、RESTful API、Linux运维、Hive、HDFS
高校数据平台升级优化项目(ClickHouse + Airflow)
项目角色:大数据工程师 项目简介: 在原有高校数据治理平台基础上,针对离线处理性能瓶颈与调度灵活性不足的问题,进行平台能力升级。引入 ClickHouse 替代部分 Hive 存储,结合 Apache Airflow 构建可视化调度与自动化运维体系,全面提升数据处理效率与平台稳定性。
关键职责与成果:
- 设计并实施基于 ClickHouse 的数据清洗与存储方案,提升报表查询响应速度 10 倍以上;
- 梳理已有清洗任务逻辑,逐步将存量 Hive 清洗脚本迁移为 ClickHouse 兼容 SQL;
- 封装 ClickHouse 接入模块,统一支持增量清洗、分区删除与批量写入等常用操作;
- 构建 Apache Airflow DAG,实现接口采集、数据清洗、入库落地等任务的可视化编排;
- 编写通用 Airflow 模板,支持多业务模块(如人员、组织、门禁等)快速复用与接入;
- 利用 Airflow 上下文管理与变量注入机制,增强任务的动态配置能力;
- 对接 Airflow Web UI 实现任务监控与日志查看,提升整体可观测性;
- 支持按高校维度配置任务实例,提升平台复用能力与高校个性化支持能力。
技术关键词: ClickHouse、Apache Airflow、SQL 优化、动态分区、DAG 任务编排、RESTful API、Python、数据清洗自动化、平台化建设
某低空经济可视化大屏项目
项目角色:可视化开发支持 / 数据配置工程师 项目简介: 基于阿里 DataV 实现低空经济相关指标可视化展示,包括飞行轨迹、飞行器统计、作业热力图等模块,助力相关产业数据监测与汇报展示。
关键职责与成果:
- 使用 DataV 蓝图编辑器 搭建大屏交互逻辑,配置全局变量实现图表间的数据联动,提高用户交互体验;
- 实现地图组件与图表组件的数据绑定与联动展示,支持区域筛选下的动态数据更新;
- 设计并配置大屏数据接口,保障数据实时性与可扩展性;
- 参与可视化组件调优与样式配置,确保多终端展示效果一致;
- 项目交付后用于政策汇报、招商引资展示场景,获得业务方高度认可。
技术关键词: 阿里 DataV、蓝图功能、全局变量、地图联动、可视化配置、接口数据绑定、前后端协同
Worktime 工时管理 H5 小程序
项目简介: 利用业余时间自主开发的基于 H5 技术的工时管理小程序,用于高效记录员工工时及应付工资,支持人员信息管理与工资更新,帮助提升团队考勤和薪酬核算效率。
核心功能:
- 员工人员信息的增删改查管理;
- 工时数据录入及对应应付工资的自动计算、更新和删除;
- 简洁直观的界面,支持多终端访问,无需安装,方便使用;
- 提高工时统计准确度,降低手工统计误差。
技术栈: HTML5、JavaScript、CSS、后端接口