huangk87 home

Excel学习总结

15 Aug 2012 - GuangZhou

工作中比较少用到Excel这个工具,主要都是写些bash、python、hive脚本,另外加上mysql,处理后台数据。但是以后要将大部分精力转向数据分析工作,所以还是需要熟悉Excel比较好。毕竟一些简单的数据处理,还是用到Excel的。因此最近看了下Excel的一些书籍,列如<<EXCEL实战技巧精髓>>。结合个人的工作实践,将Excel处理数据过程大致分为3个步骤:选择数据、数据操作、数据分析。

选择数据

1、选择数据,主要包括单元格选定、单元格定位、数据筛选等处理。
2、单元格选定:主要是利用快捷键快速选择特定区域的单元格。例如Ctrl+方向键,选择区域的开头/结尾处单元格;Crtl+A选择单元格附近非空区域;Crlt+shift+方向键选择单元格到本行/列非空单元格的区域。
3、单元格定位:主要是选择具有某种特征的单元格。例如选择内容为常量的单元格;包含公式的单元格。按F5设定定位条件。
4、数据筛选:有时候需要选择满足某些条件的数据做分析,例如消费总额大于1000的玩家。这时候就需要数据筛选的功能了,通过“数据”--->“筛选”功能,可以选择满足特定条件和属性的数据。
5、条件格式:个人将其列为选择数据操作。因为让符合条件的单元格突出显示,视觉上也相当于选择数据了_^

数据操作

1、数据操作:主要是一些常规的数据处理。例如数据去重、关联、包含、排序。
2、数据去重distinct:利用“数据”-->“高级筛选”中的,”选择不重复记录“实现。
3、数据关联join:有两个表格,通过相同的字段进行join数据关联。可以通过lookup、vlookup、Hlookup等查找函数进行数据映射。
4、数据包含in/exists:有两个表格,需要判第一个表格的字段取值包含在第二个表格中。主要有两种方法:1个是通过“数据”-->“高级筛选”,利用“条件区域”进行抽取;另外一个是通过countif函数,计算前一个表格每个取值在后一个表格出现的次数,然后把出现次数大于0的记录筛选出来。
5、数据排序:large(array,k),small(arry,k),在数组中选择第K大/小的值。

数据分析

1、函数/公式:
2、表格:
3、图表:通过<<EXCEL实战技巧精髓>>,学会了动态图表和动态扩展数据点两个做法。因为工作中常常会碰到数据扩展性。例如游戏第N次测试,需要对比前N-1次的数据,分析测试的效果。这样只需填充第N测试的数据就行了,扩展处理由Excel自动完成。
4、透视表/图:

特殊功能

1、摄影机:某个区域的实时显示快照。通过摄影区可以将不同区域的数据组合起来,实时显示。
2、名称:类似C语言的const变量。当有几个类似的数据区域,而操作时需要指向具体一个区域时,我一般通过名称实现,方便数据分析的扩展。
3、当前Excel窗口布局:工作需要常常会打开几个Excel工作簿做数据分析,有时候下班没完成工作,第二天打开电脑需要重新相同的Excel工作簿会很麻烦。如果可以保留当前断点信息,以后打开,是很方便的事情。“视图”----“保存工作区”就提供了这个功能。这样Excel就相当于永远没有关闭掉~~。

模板化

1、模板化是提高效率的必经途径。Excel设置模板主要有以下几方面:
*文档主题:主题颜色、主题字体、主题效果
*宏命令
*自定义函数
*自定义表格样式
*自定义图标样式