金步国简历

基本资料
姓名金步国性别
出生年份1978年学历本科肄业(同济大学)
个人主页金步国作品集联系电话19952346279
期望地点深圳求职意向运维总监 、运维经理

个人简介

十多年的互联网与金融业工作经验,既有过硬的专业技术水平,也有丰富的团队管理经验。技术方面,精通系统架构设计、网站程序开发、数据库设计与管理、网络安全、操作系统与中间件运维、虚拟化与私有云建设、数据中心建设;管理方面,担任过技术总监、部门经理、运维经理等职务,同时,作为团队负责人,带领团队完成过多个关键项目;此外,通过个人作品网站、积极参与技术社区,也结识了不少运维技术圈内的大牛,彼此之间也经常互相帮助、互相支持。

工作经历

[2015.10-2017.8]君康人寿保险股份有限公司

职务:信息技术部运维经理

(1)负责公司三个数据中心的运维规划与执行、应急响应与故障处理; (2)负责阿里云端的服务器配置、维护、监控、调优、故障排除等; (3)负责监控系统的建设及优化,设计告警策略以保障业务连续性; (4)完善公司的运维管理平台,优化自动化运维体系; (5)优化运维流程、制定运维规范并推进实施; (6)负责运维团队的建设,日常工作的指导、监督、考核,以及人才培养与选拔;

[2012.7-2013.8]无锡朗奇软件科技有限公司

职务:系统运行部经理

(1)全面负责数据中心的日常运维,包括:物理硬件、操作系统、中间件、数据库、网络与安全、虚拟化与云平台、存储与数据备份、监控与报警,等等; (2)制定系统运行管理规范、推进系统环境标准化,指导和培训系统工程师、网络工程师、数据库工程师的日常工作; (3)协助开发部门规划和制订技术构架、系统集成计划、控制项目进度; (4)新技术研究与系统升级改造,确保系统架构的先进性;

[2009.1-2012.6]太平人寿保险有限公司

职务:运营管理部系统工程师 ──> 运维经理

2009年,负责研究开源软件在保险领域的应用、推进"去IOE"工作的研究与实施,并取得了一定成绩。

2010年,在太平集团灾备项目的规划与实施过程中,我以技术专家的身份全面参与了整个项目的规划、评审、实施、演练、验收的过程。

2011年,由于工作表现优秀,我被晋升为全面负责运维工作的运维经理,并继续推进"去IOE"工作的研究与实施。

[2008.2-2008.12]搜狐公司

职务:网络运营部系统工程师

日常工作主要负责数据中心的Linux基础系统与HTTP服务的运维,同时还参与了运维管理平台的开发,负责权限管理与人机信息模块。此外,还有幸参与了北京2008年奥运官网的赛前部署与赛时运维,负责后端RealServer的测试、调优、部署、监控、以及故障应急处理。这是我第一次参与大型网站的部署与运维,海量的访问、苛刻的安全级别、多层次的灾备、复杂的网络结构、大量人员的协同工作,让我对大型网站的架构和管理有了第一次亲身体验。

[2003.3-2006.9]上海厚载教育咨询有限公司

职务:PHP程序员 ──> 系统运维 ──> 技术总监

2003年,我与另一位合伙人共同创办了这家公司,同时兼任PHP程序员,从零开始创建天天家教网,历时半年,完成了整个网站的开发与上线。

2004年,为了更好的促进业务发展,我与另一名美工合作,又将整个网站彻底重写,并将数据库从 MySQL 迁移到 PostgreSQL ,同时工作重心也逐渐转向了系统运维。

2005年,成立信息技术部,我开始担任技术总监兼系统运维,根据公司的业务发展需要,又带领WEB开发组(2美工,3程序)开发了:好学网(2004)、可可家具网(2005)、可可礼品网(2005)、"不要烦"律师网(2006)。不过后继开发的这几个网站由于经营不善,目前已经关闭了。

部分项目经验

[2016.2-2017.2]君康人寿私有云平台

设计目标: (1)实现基础系统环境的高可用,避免单台物理设备故障导致业务中断,彻底消除单点故障; (2)简化数据中心物理设备类型,仅保留TCP/IP交换机与PC服务器,取消传统的集中式存储设备与FC交换机; (3)尽量采用开源软件实现以节约软件成本以及自主可控; (4)拥有良好的横向扩展能力; (5)简洁就是美,避免复杂的设计,便于理解以及后期维护;

方案概要: (1)确保所有硬件都有冗余,比如多运营商线路负载均衡、双路供电、交换机堆叠、多网卡绑定、本机RAID; (2)使用KVM虚拟化技术以及GlusterFS分布式文件系统实现,确保同时兼容Windows与Linux客户机操作系统; (3)所有链路统一使用TCP/IP协议,并且每条链路最低万兆带宽,以保证分布式文件系统的性能;

责任描述: 既是项目负责人也是主要设计人。带领运维组的同事完成了整个项目的规划与设计工作,并主导了前期测试与后期部署实施的全流程。

[2012.8-2013.6]江阴市党政网站集群

设计目标: (1)尽可能降低软件/硬件/人为故障对业务的影响,达到99.9%以上的可用性; (2)实现故障自动侦测、故障自动转移、服务自动恢复; (3)具备入侵检测、网站内容防篡改功能; (4)方案简单、易于维护;

方案概要: (1)将物理设备托管于管理规范、设施完备、双线BGP网络、双路供电的专业数据中心,确保物理硬件的安全、并有冗余备件; (2)存储节点使用双背板硬件iSCSI存储设备,确保存储设备的硬件可靠性; (3)数据库节点使用Oracle的RAC集群技术达到高可用目的; (4)计算节点使用普通的PC服务器配合VMWare ESXi虚拟化平台,实现物理层故障自动转移; (5)计算节点虚拟机内的应用服务使用Nginx+keepalived实现高可用负载均衡; (6)使用Zabbix实现监控与报警; (7)使用第三方厂商提供的入侵检测与网站内容防篡改产品与服务;

责任描述: 既是项目负责人也是主要设计人。带领系统运行部完成了整个项目的设计工作,并主导了前期测试与后期部署的全流程。

[2010.1-2011.6]太平保险集团灾备中心建设

标准的"两地三中心"架构,由上海(生产)与深圳(灾备)两个数据中心组成。按照《保险业信息系统灾难恢复管理指引》的标准,为太平人寿的核心业务系统、财务总帐系统、投资交易系统,创建远程灾备系统。

我以技术专家的身份全面参与了整个项目的规划、评审、实施、演练、验收。

[2008.2-2008.8]北京2008奥运会官方网站

作为2008年北京奥运的赞助商,搜狐承担了2008年北京奥运会官方网站的创建与运营工作。我参与了赛前部署与赛时运维,负责后端RealServer的测试、性能调优、部署、以及故障应急处理。 这是我第一次参与大型网站的部署与运维,海量的访问、苛刻的安全级别、多层次的灾备、复杂的网络结构、大量人员的协同工作,所有这些都让我对大型网站的架构和管理有了第一次亲身体验。