无辜的Musanzikwa
验证专家 in Engineering
数据工程师和开发人员
Inno是一位经验丰富的数据工程师和开发人员,在过去的十年里,他在非洲和北美的顶级零售数据分析公司iri工作,并在过去的几年里担任自由顾问. 作为SQL和ETL开发人员, 他使用行业标准技术(如Kimball和DataVaults)创建了高质量的数据仓库. 作为数据工程师, Inno使用几种最新的尖端技术,在本地和云上构建了高度健壮和可扩展的数据管道.
Portfolio
Experience
Availability
首选的环境
SQL, PySpark, Python, Hadoop, Apache Hive, Azure突触, Oracle, SQL Server集成服务(SSIS), Azure数据工厂, 数据仓库
最神奇的...
...我设计的大数据仓库和数据集成解决方案——使用Python, SQL, ADF, Hadoop, Hive, spark从六家竞争对手中赢得了加拿大的RFP.
工作经验
Data Engineer
Darwill, Inc.
- 使用AWS Redshift和Aurora数据库构建Tableau仪表板和可视化.
- 为自定义ETL任务和临时请求创建运行Python的AWS Lambda函数.
- 管理AWS Redshift和Aurora数据库,设计数据仓库和数据迁移.
- 使用AWS技术栈重新设计了客户端的数据仓库,并通过引入运行Python管道的联邦查询和Lambda函数改进了他们的迁移过程, 以及彻底改造他们的Tableau仪表板.
Data Engineer
SFL科学有限公司
- 就现有的SSIS设计不良的数据集成项目提供咨询,并帮助确定瓶颈和低效率.
- 使用SSIS重新设计现有的数据管道,以提高效率和可扩展性.
- 执行SQL调优和SQL代码审查以提高流程效率.
BI和数据仓库专家
航空控股有限责任公司
- 设计和开发数据管道,集成来自Quickbooks API的数据, Sage完整API, 和电子表格转换成Azure SQL.
- 在Azure SQL中设计并开发了一个数据仓库.
- 使用Power BI设计和创建业务报告和KPI仪表板.
- 开发复杂的SQL脚本来管理数据转换和加速集成.
迁移项目的数据分析师
JLL - JLLT数据
- 开发数据管道,将数据从Salesforce集成到Microsoft SQL.
- 设计高级SQL代码.g.、CTE、存储过程和管理数据转换的函数.
- 执行SQL调优以提高ETL效率和流程可伸缩性.
- 咨询标准操作程序和最佳情况.
总监|数据工程
IRI
- 开发Azure数据工厂管道,集成来自Apache Hive的数据, HDFS, OAuth 2 APIs, 和各种平面文件类型转换为Azure SQL.
- 管理陆上和海上大数据开发团队, 在Jira上分配任务并跟踪进度.
- 监督新数据源和正在进行的项目的数据策略和建议.
- 指导大数据工程师,帮助他们提高技能.
- 根据客户要求或技术变更,构建新的数据模型并升级旧的数据仓库.
ETL Architect
IRI
- 在本地和云端开发基于sql的数据仓库.
- 集成了从平面文件到基于云的数据源(如Snowflake)的各种数据源, 将AWS和数据湖整合到Azure数据仓库, 以及Hadoop上的Apache Hive.
- 创建了可扩展的数据管道,提高了现有管道的效率.
- 培训和提高新数据开发人员的技能,并参与代码审查.
- 维护所有业务数据组件和策略的系统文档.
SQL首席开发人员
IRI
- 开发了基于sql的数据仓库和数据集市.
- 编写SQL查询,为SSRS报告提供数据.
- 根据客户端需求,ETL进程使用SSIS、Talend、DataStage.
- 使用SQL Server报表服务(SSRS)创建自定义业务报表.
- 管理初级开发人员并主持独立开发会议.
SQL/ETL开发和顾问
Mi9零售(原JustEnough软件公司)
- 管理移动设备和SQL Server之间的SQL复制.
- 使用Kimball方法为报告目的创建SQL数据仓库.
- 使用SQL Server集成服务(SSIS)设计和开发ETL包.
- 在SQL Server报表服务(SSRS)中设计和开发报表.
- 对部署到生产环境中的任何代码执行数据库调优和代码审查.
Experience
从Azure SQL到Snowflake的数据迁移
http://github.com/innowarue/ADF我用我的Azure和Snowflake帐户替换了真实的数据源,以便在不损害机密性的情况下公开提供项目.
来自OAuth2 API的数据集成
SQL Server复制到移动设备
就地数据集成的收购
Kafka流和数据集成
Skills
Languages
SQL, Python, Bash Script, t - sql (transact - sql), Snowflake, 存储过程, SQL DML, Scala, JavaScript, Bash
Frameworks
Hadoop, Spark, Windows PowerShell, ADF
库/ api
PySpark, REST api, Spark Streaming
Tools
Microsoft Power BI, Tableau, BigQuery, Synapse, SSAS, Apache气流, Amazon Elastic MapReduce (EMR), Git, Google Sheets
Paradigms
ETL, 商业智能(BI), 维度建模, 数据库开发, 数据库设计, Data Science
Platforms
亚马逊网络服务(AWS), AWS Lambda, Azure SQL数据仓库, 专用SQL池(以前称为SQL DW), Azure, Microsoft Power automation, Azure突触, Oracle, Databricks, Apache Kafka, Salesforce, Zeppelin
Storage
Apache Hive, MySQL, SQL Server集成服务(SSIS), SQL Server报表服务(SSRS), PSQL, Microsoft SQL Server, SQL存储过程, PostgreSQL, Databases, 数据管道, 数据集成, 关系数据库, 数据库体系结构, RDBMS, 数据库建模, Dynamic SQL, NoSQL, SQL Server DBA, 数据库复制, Azure SQL, MariaDB
Other
Azure数据工厂, 数据仓库, 数据分析, 工程数据, Data, 数据架构, Big Data, 数据迁移, ELT, 数据仓库设计, 数据转换, 数据库模式设计, ETL Tools, 脚本语言, 数据分析, 数据可视化, SSRS Reports, SQL Server 2015, 实体关系, 业务分析, 性能调优, 数据建模, Cloud, APIs, 仪表盘的设计, Dashboards, Web Scraping, 数据构建工具(dbt), iPaaS, CI / CD管道, DAX, 数据清理, Azure砖
Education
信息技术学士学位
南非大学-比勒陀利亚,南非
认证
Databricks注册数据工程师助理
Databricks
SnowPro Core
Snowflake
认证Apache Spark和Hadoop开发人员
Cloudera
用Hive分析大数据
LinkedIn学习
数据科学高级NoSQL
LinkedIn学习
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring