
教育背景
哥伦比亚大学
专业:运筹学(硕士)
2023.09-至今
不列颠哥伦比亚大学(UBC)理学院
专业:统计学(本科)
2017.09-2023.05
实习经历
埃森哲
业务分析实习生
2022.09-2022.12
- 行业分析:就“双碳目标”能源市场趋势、相关金融监管机构和常见行业做法开展案头研究,搜集并分析行业、企业、政策等信息,形成对行业的理解和判断;
- 市场研究:整理能源行业相关课题思路,独立分析一个竞争对手提供的产品和服务,与团队成员合作制定全面计划,涵盖基金运作的方方面面,从基金目标设定、业务模式确定、投资管理到退出战略设计,协助产品和服务的内容设计并进行市场需求测算;
- 模型建立:建立投资回报率预测模型,设计衡量标准,跟踪主要行业参与者的业务表现,通过对行内相关公司的数据简历数据模型为目标公司未来的盈利进行预测,通过我们的推荐和预测公司之后季度利润增长了 5%,模型是可以更新模型,通过替换相关公司的营收数据,可以得出盈利预判,这就使得之后公司的时间成本有着明显的减少;
- 工作成果:提出了一个包含人力分配方法和风险应对程序的基金支持系统,并创建了一个路线图,直观地体现了基金项目的实施过程。
KABU 公司
数据科学家实习生
2022.05-2022.09
- 数据维护:维护 2TB 数据库,从 200 多个变量中挑选有用的变量,并开发动态图表来跟踪变量的分布情况,确保数据库的稳定运行、数据的完整性和准确性、以及数据的安全性,定期备份数据,对数据进行清理和整合,以防止数据丢失或损坏,开发和实施数据质量管理和数据治理策略,以确保数据的准确性和一致性;
- 数据问题分析:应用固定效应、LASSO 和脊回归模型,找出客户流失的根本原因,选择最适合他们数据的模型,调整模型的参数,并对模型的预测性能进行评估;
- 工作成果:创建了一份清晰、简洁、令人信服的报告,其中包含包括数据的描述性统计分析、模型的预测结果、以及关于如何解读这些结果的指南,为客户维系战略的制定提供依据。
项目经历
西蒙弗雷泽大学,数据研究助理
2022.06-至今
- 利用 R 语言实现数据收集流程自动化,并带领 6 人团队清理从埃德加网站不同的数据源获取 60GB 数据,并将其转化为统一的格式,处理缺失值,删除重复数据,检查数据的异常值,以及处理任何可能影响分析的数据问题;
- 利用 LDA 和 KL 发散等 NLP 技术进行文本分析,以确定文本数据中与金融相关的主题;
- 建立项目 GitHub Repo 以促进团队之间的协作,设置版本控制,管理代码的修改和合并,以及跟踪团队成员的工作进度,对团队成员编写的代码进行质量检查,并通过有效沟通主动解决团队冲突;
- 应用各种 ML 方法(脊、套索、OLS 回归和弹性网络)预测 100 个异常投资组合的回报率,并确定最佳模型系数。
不列颠哥伦比亚大学,数据研究助理
2022.01-2023.04
- 使用 Excel 内置函数(Vlookup、ifelse 等)对从基因数据集提取的 4 GB 数据进行预处理,处理缺失数据,检查数据中的异常值,处理不一致或错误的数据,以及进行数据类型的转换等;
- 使用 R 对遗传数据集进行描述性分析,并使用 stats、tidyr 和 tidyverse 软件包进行统计检验(t 检验、皮尔逊相关检验),对数据集进行描述性分析,比如求平均值、中位数、标准差等统计指标,以了解数据的分布和特征;
- 利用 R 语言中的 seaborn 和 pandas,通过热图和柱状图实施说明性分析,并交叉检查图表与模型 结果之间的分析结果,将数据分析和结果以直观的方式呈现出来,帮助理解和解释数据,反复查看和比较图表与模型结果之间的差异,以得出准确的结论。
PUBLISH
- Chen Y, Zhang S, Du S, Jiang J, Wang G. Transcriptome and Metabonomic Analysis of Tamarix ramosissima Potassium (K+) Channels and Transporters in Response to NaCl Stress. Genes. 2022; 13(8):1313. https://doi.org/10.3390/genes13081313
- Chen Y, Zhang S, Du S, Zhang X, Jiang J, Wang G. Analysis of Amino Acids in the Roots of Tamarix ramosissima by Application of Exogenous Potassium (K+) under NaCl Stress. International Journal of Molecular Sciences. 2022; 23(16):9331. https://doi.org/10.3390/ijms23169331
- Chen Y, Li H, Zhang S, Du S, Wang G, Zhang J, Jiang J. Analysis of the Antioxidant Mechanism of Tamarix ramosissima Roots under NaCl Stress Based on Physiology, Transcriptomic and Metabolomic. Antioxidants. 2022; 11(12):2362. https://doi.org/10.3390/antiox11122362
- Chen Y, Zhang S, Du S, Wang G, Zhang J, Jiang J. Effects of Exogenous (K+) Potassium Application on Plant Hormones in the Roots of Tamarix ramosissima under NaCl Stress. Genes. 2022; 13(10):1803. https://doi.org/10.3390/genes13101803
- Chen Y, Zhang S, Du S, Zhang X, Wang G, Huang J, Jiang J. Effects of Exogenous Potassium (K+) Application on the Antioxidant Enzymes Activities in Leaves of Tamarix ramosissima under NaCl Stress. Genes. 2022; 13(9):1507. https://doi.org/10.3390/genes13091507
- Chen Y, Li H, Zhang S, et al. Analysis of the main antioxidant enzymes in the roots of Tamarix ramosissima under NaCl stress by applying exogenous potassium (K+). Frontiers in Plant Science. 2023;14. doi:https://doi.org/10.3389/fpls.2023.1114266
掌握技能
软件
- R Studio
- Python
- SQL
- Tableau
- Latex
- Microsoft Office Suite
- AWS
- Google Analytics
编程语言
- Python (NumPy, Pandas, Scikit-learn, Matplotlib, selenium, webdriver)
- R(Tydiverse, NLP)
- Java
- C++
- VBA
- Git