得之坦然,失之淡然
91 文章
5 分类
84 标签
小风雷
91 文章
5 分类
84 标签
小风雷
Software Engineer || 前NLPer
后端开发仔,搞过一段时间NLP
  文章统计图
  我的项目
基于Go协程池+Lindorm消费模型,优化消息吞吐,支撑日均千万级告警数据实时处理
基于存量数据同步+分阶段双写+异步数据分离实现非停机迁移
  个人简历

关于我

如果爱,请深爱

Software Engineer || NLPer

教育经历

  • 南京大学 | 计算机技术(保研) | 硕士 | 2019.09 - 2022.06
  • 电子科技大学 | 软件工程 | 本科 | 2015.09 - 2019.06

工作与实习经历

Shopee | 高级后台开发工程师 | 2022.07 - 至今

订单核心交易研发:覆盖购物车加购、聚合购物车展示、订单下单、支付、退款等订单全链路流程。

  • Food Order AI DoD机器人接入:基于外卖高峰期与休息时间接近+订单业务复杂等问题,基于SMART平台+日志平台+监控平台MCP+Prompt规则,实现常规活动/预期内报错和系统错误快速识别,从原有的十分钟级到分钟级响应。

  • 订单异构数据同步优化:并发消费CDC。基于Shopee CDC单Partition及Go Sarama单Kafka Partition仅分配一个协程消费特点,引入多协程并发消费模型+等待队列保证Kafka顺序/延时提交+Channel提升系统吞吐量,系统瓶颈由写ES转为解析Kafka消息,理论性能提升200倍。

  • 订单表无停机分库迁移:解决DDL操作时间过长(单库1T+数据)+RDS迁移需要,完成单库千表→10库百表拆分。基于存量数据同步+分阶段双写+异步数据和同步读数据分离的方式实现非停机迁移订单表,最终满足RDS容量限制(单库≤500G),DDL执行时间从14个小时减少到1小时以内,P99降低10%。

华为 | 算法实习生 | 2020.10 - 2021.07

时间序列算法集成,将WaveNet/MQRNN等算法集成至时间序列算法检测库,用于告警日志数据异常检测及云化告警业务发现。

百度 | 算法实习生 | 2018.11 - 2019.05

事件图谱的事件归一算法研究及上线。包含从数据分析、数据收集、模型调研、模型训练、模型上线整个流程。算法上主要通过BERT进行预训练事件脉络的pipeline集成,包含集成事件判别、事件名生成、事件归一。业务上线至时空阿Top 4卡片。鹰眼系统开发,提供热点事件粗召回功能。

SAP | 后端开发实习生 | 2017.12 - 2018.06

某汽车主机厂CRM的后端开发工作,主要使用C4C针对到店、试驾等任务进行数据处理和接口定义工作。

比赛经历

  • 2020华为Digix AI全球校园AI算法精英大赛 | 第6名/300+/1000+

    • 广告CTR预测任务,给定7天的用户、广告、广告主数据,预测将来(8-10)天的曝光广告的点击率
    • 特征工程包括曝光特征、交叉特征、Target Encoding、Embedding特征等,使用LightGBM和NN模型,获得奖金1.2w
  • 莱斯杯:全国第二届"军事阅读理解"挑战赛 | 第4名/65/653

    • 军事阅读理解任务,包含单答案问题、多答案问题、推理问题
    • 模型层使用百度ERNIE 1.0 + 3层Query-Context CoAttention对答案进行预测

论文成果

  • ICASSP 2023(CCF-B)
  • From Easy to Hard: Two-stage Selector and Reader for Multi-hop Question Answering
  • 多步阅读理解SOTA

技术栈

  • 后端:Golang, MySQL, Kafka
  • 算法:阅读理解、MCP、Prompt、特征工程、LightGBM

英语水平

  • 四六级通过