网站首页 > java教程 正文
文章作者│李涛(医院管理教授)
说到分析工具的选择,很容易陷入推销产品的嫌疑,为此,我站在一个具有二十年多国内外医疗数据分析经验的客观角度上来客观评价各种分析工具的优势和劣势,以便给大家一个公正的建议。数据分析类工具大体可以分为以下五类:
?Excel生态工具:Excel、VBA、PowerQuery、PowerPivot、Power View、Power Map
?BI工具:PowerBI、Tableau、Qlikview、SAP BI、Oracel BI、FineBI、Yonghong BI
?数理统计工具:SAS、SPSS、Stata、Minitab、Eviews、Statistica、MATLAB、Mathematica
?数据库工具:MS Access、MySQL、PostgreSQL、Oracle、SQLServer、MongoDB、Hive
?编程工具:Python、R、Julia、Scala、Spark、Java、Hadoop
由于职能部门很少接触后三类分析工具,我们就不再讨论,重点说说Excel和BI。
① Excel
几乎是人人都在用的数据处理软件,由微软开发,是office三剑客之一。毫无疑问,Office是当今工具领域的挣钱王者,每年都给微软带来上百亿美元的收入。国内对标的软件是WPS的表格,功能大体相似。
虽然Excel很容易入手,但大部分人对Excel的使用程度还处在入门阶段,存取数据、做做表格。其实Excel可以用来做数据处理,制作复杂的报表、建立数据分析模型等应用。Excel里的编程语言,通俗理解为“宏”,可以实现自定义的需求、自动化和批量化地操作Excel。
优势:Excel在对小样本数据(10万行200个字段之内)的处理能力还是非常不错的,尤其在学通了Word和数据库MS Access之后,可以形成三者之间的相互调用,加上“宏”的自动化执行,基本也能满足实现自动化的报告和报表的需求。
劣势:一旦数据量偏大,Excel的短板立马就变得非常明显,不但处理速度下降,而且还常常导致系统死机,重启后也容易丢失数据。另外一个短板就是需要掌握VBA的编程语言,才能实现调用过程中的各种功能(Function/Sub)的灵活操作,这对于没有编程基础的业务部门人员来说是一个巨大的拦路虎。
② BI
BI又称商务智能(business Intelligence),起源于上世纪50年代,后在1996年由Gartner明确定义出来。BI通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的可视化工具,是大部分数据分析岗位需要用到的工具。目前国际上最流行的BI软件是Power BI(微软)和Tableau,国内对标的是Fine BI。
优势:由于可以直连不同的数据库,加上强大的数据处理,下钻分析、允许数据混合和实时协作等功能,BI已经广泛地被企业,学术研究人员和许多政府用来进行动态视觉的数据分析。实时数据的更新、直观感强、下钻功能强大等都是BI在数据分析中非常明显的优势。另外,BI的学习成本也很低,实现无代码的编程,人人都能够很快学会在前台的“拖拉拽”,后台却是又复杂的程序来控制。
劣势:凡事都有好坏两个方面,由于直连数据库的原因,存在数据库被破坏的风险,为了安全起见,很多企业都是先由信息科先对原始数据进行处理,然后再分发给业务部门。然而,由于业务部门的人员并不了解预处理过程,不加思索地直接采用系统中的平均值功能,造成平均值的平均等错误结论的情况很普遍。此外,BI的文本功能非常弱,不适合用来制作分析报告,也是其明显的短板之一。
了解“医院运营数据分析实战训练营”信息→微信公众号
- 上一篇: 榨干服务器:一次惨无人道的性能优化
- 下一篇: 深入解析 EasyExcel 组件原理与应用
猜你喜欢
- 2024-12-17 松勤软件测试:丢掉Excel,手把手教你用Python操作Excel
- 2024-12-17 Excel数据还可这样来查询:用SQL查询输出工作表指定区域更高效!
- 2024-12-17 Pandas:一个高性能的数据分析Python库
- 2024-12-17 《github精选系列》——数据可视化分析平台DataGear
- 2024-12-17 测试驱动技术(TDD)系列之5:从excel中读取数据
- 2024-12-17 Python读取与写入Excel模块:openpyxl
- 2024-12-17 基于java的开源BI可视化工具——DataGear使用教程
- 2024-12-17 将Excel表格直接导出成JSON文件格式的一个小工具
- 2024-12-17 java解析doc、docx内容踩坑日记 java解析文本文件
- 2024-12-17 深入解析 EasyExcel 组件原理与应用
你 发表评论:
欢迎- 04-27微服务部署架构设计详解(图文全面总结)
- 04-27Java微服务架构选型与对比:一场技术流派的巅峰对决
- 04-27微服务架构下Java的最佳实践
- 04-27Java微服务架构选型:优雅拆分与高效整合
- 04-27微服务架构下的Java代码拆分策略:像拼图一样构建系统
- 04-27微服务架构下的Java最佳实践
- 04-27微服务架构下Java的挑战与机遇
- 04-27微服务架构下Java事务管理的艺术
- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)