曾小健 ,男,人工智能多模态AI具身专家。著名GitHub开源贡献人、Kaggle Expert、CSDN博客专家、《深入Transformer自然语言处理》、《基于深度学习的自然语言处理》、《Python机器学习:核心技术与开发实战》《图说深度学习:用可视化方法理解复杂概念》等多部AI专著译者。
多所高校计算机学院硕士生导师。
在数学方面也颇有建树,发表数学与计算机相关论文多篇。
在英国拥有荣誉(with honors)国际金融学位,计算机博士在读。师从两位著名物理和数学科学院院士库鲁教授和王成发(Ong Seng Huat)。有着广泛知名海内外声誉。
QQ音乐人、在酷狗音乐/酷我音乐盒/华为音乐/网易云音乐皆有认证,发表专辑和单曲多部,代表作《我愿意好好地爱你》《你要好好加班》《强化学习发展史》《我会永远爱你》等。
在喜马拉雅电台开有,发布AI和相关课程。
热衷于分享技术,发布技术博客。
曾小健(GitHub: )
Zijian Zeng,
项目经验
强化学习用于大模型和游戏博弈。
多模态大模型
沁言app -- 大模型角色扮演、情感陪伴
万言国学(小程序)大模型手机号算命 八级灵数
金融竞赛
WorldQuant BRAIN - 银牌
UFA全球大学生金融大赛 优异奖
算法竞赛
一、NLP大模型算法竞赛:
·Kaggle - LLM Science Exam (银牌)
·腾讯控股天衍实验室蕴含实体的中文医疗对话生成 竞赛(团队 第5名)、
·天池大数据竞赛CCKS2023-面向金融领域的主体事件检测(团队 flyisfirst 第14名)
二、推荐系统与数据分析算法竞赛
·kaggle H&M fashin推荐大赛(铜牌)
三、计算机视觉算法竞赛
·第二届粤港澳大湾区(黄埔区)国际算法算例大赛 - 竞赛二 看视频说话(团队第二 生椰拿铁)
·百度集团PaddleCamp专场 - 猫十二分类问题 – 个人第5
开源贡献
曾小健(GitHub: ArtificialZeng)开源项目主要有大模型训练,和大模型代码解析(逐行)两块。还有一些重大项目的微小贡献。
Qwen - 阿里巴巴集团出品千问7B/14B同级别SOTA chat项目、
Baichuan 2 - 百川7-13B版本的第二个版本(9.6发布) 、
fastllm - 大模型加速/量化 、
Awesome-Prompt-Engineering - 提示工程合集 、
Pycaret - 自动化机器学习 AutoX - 自动化机器学习 、
ailabx(getee)- 量化金融
torchlm 等
发表论文
Zijian Zeng,
"Optimal Resource Allocation for Multimedia Applications Offloading in Mobile Edge Computing," in IEEE Open Journal of the 计算机 Society, vol. 2, pp. 360-369, 2021, doi: 10.1109/OJCS.2021.3119366.
Optimizing Large Language Models’ 表演 in 软件 Development Tasks through Structured Prompts
探析非线性代数方程组理论引入高等代数课程之教材建设
《高等代数》与《解析几何》课程的整合
《基于神经网络的文本分类方法》, 曾仔健;赵鸣;电子世界,2021, (05)
人物经历
2023年,量化金融与人工智能大数据专家曾小健出席"量化未来,智造金融"2023全球量化金融高峰论坛。
早年间从事诗歌和音乐创作,是QQ音乐人,在酷狗音乐、酷我音乐盒、抖音汽水音乐均发布音乐作品。在《儿童文学》《天涯诗刊》《燕京诗刊》等发表作品。
代表作有:《我的模仿》2015.9月刊,《在无声中》等等
在番茄小说连载小说:《我在马来西亚留学的日子》
曾作为导演助理和经纪人参演《疯狂的酒店》《极恶江湖之蛊惑镇传奇》等电影。