新闻中心
大数据分析课程(好的大数据分析课程是什么)
课程一 数据库基础
课程简介:
数据库的查询语句是每个数据分析师必须掌握的技能,通过数据库阶段的课程使学员掌握数据库的使用。本课程讲介绍了数据库的库管理,表管理等基础操作以及应对各种复杂情况下的查询语句, ER图的使用让学员对数据库中各表的关系有了更为清晰的思路,通过案例让学员对数据库的使用有更充分的理解。通过本阶段的学习学员能够达到使用数据库对数据进行整理及清洗,能够在复杂的表中获取需要的数据。
课程内容:
1.数据库设计概述
2.ER图
3.MySQL数据库安装和配置
4.MySQL数据库管理
5.MySQL表管理课程二
6.表的更新
7.表的查询(正则表达式与连接查询)
8.MYSQL综合案例
课程二 Java编程基础
课程简介:
本阶段重点学习Java编程和面向对象知识,让初学者体会到编程的乐趣,为后面的大数据平台技术打好基础,因为Hadoop平台基于Java开发的,学会Java基础知识是必要的。
课程内容:
1.Java编程语言的主要特性,Java虚拟机的主要功能
2.面向对象基础,重载方法名称 ,构造并初始化对象
3.子 类,覆盖方法,调用覆盖方法,调用父类构造函数
4.类(static)变量,类(static)方法,静态初始化程序
5.一个完整的例子,关键字final,抽象类,接 口
6.异常:java语言的异常,异常处理,异常分类,共同异常
课程三 数学及统计学基础
课程简介:
本阶段包括数学与统计学两个阶段。线性代数与分积分是统计学的基础。统计学部分包括最基础的统计理论
(描述性统计、区间估计、假设检验等),到基本的统计分析(T检验、方差分析等),最后到常用列连分析、相关分析等。以深入浅出的方法,带大家逐步了解统计。
课程内容:
线性代数基础微积分基础描述性统计(均值、中位数、集中趋势等)抽样估计假设检验(T检验、F检验、卡方检验)方差分析列联分析、相关分析课程四 Python编程知识
【1】Python基础编程
课程简介:
Python是基于C的一种面向对象、解释型计算机程序设计语言。近几年来Python在数据分析领域逐渐占据了统治地位,成为了名副其实的Number one。本课程主要是带大家了解Python的基础语言部分,了解基础的Python特性。其强大的数据处理包Pandas可以高效的完成前期数据清洗工作。
课程内容:
Python语言的介绍、基本语法、基础数据类型。Python基础数据结构、控制流语句。数据管理Python的IO和异常处理Python函数和模块。【2】Pandas应用
课程简介:
Pandas包是非常高效的处理清洗数据的包,基于numpy。本部分主要是给大家介绍pandas的实际应用中常用的内容。
课程内容:
Python包的安装管理、Numpy数组、Pandas索引对象Pandas数据结构、统计描述、缺失值处理和常用函数Python结构化数据和非结构化数据清洗课程五 数据挖掘算法详解及Python实现
课程简介:
本阶段内容为数据挖掘各类算法,每种算法进行单独的详细讲解并通过python进行实现。在本阶段的课程结束后,学员能够达到了解常见算法的实现并能够进行优化,使模型更加契合实际情况中的需求。
课程内容:
线性回归原理及Python实现逻辑回归原理及Python实现时间序列原理及Python实现朴素贝叶斯、KNN原理及Python实现决策树原理及Python实现集成学习原理及Python实现随机森林原理及Python实现支持向量机原理及Python实现神经网络原理及Python实现关联规则,协同过滤原理及Python实现11.文本挖掘原理及Python实现
课程六 可视化工具之python实现
课程简介:
大数据分析离不开展示工具,本课程为大家讲解如今使用度相对较高的、功能相对完善的
python工具,通过学习本课程学员可以相似学习其他BI工具操作。
课程内容:
Python介绍及可视化操作视图创建和仪表板设计可视化动态数据分析课程七 大数据环境搭建
课程简介:
本课程介绍了Hadoop的发展、整体架构及Hdfs分布式存储、MapReduce分布式计算框架,使学员对Hadoop平台有一个系统的了解,能够将Hive,Sqoop,Hbase等基于Hadoop平台的组件安装运行。
课程内容:
Hadoop安装配置MapReduce安装配置Hive介绍安装配置Hbase介绍安装配置Sqoop安装配置Scala和Spark安装配置课程八 大数据仓库Hive
课程简介:
Hive是Hadoop的一个数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,将SQL语句转化为MapReduce任务进行运作。Hive不仅提供了一个熟悉SQL的用户所熟悉的编程模型,还消除了大量的通用代码,甚至是那些有时不得不使用Java编写的令人棘手的代码,学员通过本课程的学习可以使用Hive进行数据仓库的统计分析。
课程内容:
Hive简介与基本操作Hive支持的数据类型Hive数据管理Hive的查询Hive分析和聚合函数及案例Hive窗口函数及案例Hive综合案例练习课程九 非结构化数据库HBase精讲
课程简介:
HBase是一个在Hdfs上开发的面向列的分布式数据库。如果需要实时地随机读写超大规模数据集,就可以使用HBase这一Hadoop应用。学员通过学习本课程能够了解HBase数据存储结构及实际操作。
课程内容:
Hbase简介Hbase shell访问Hbase数据类型Hbase的表设计Sqoop数据传输Hbase数据插入Hbase数据查询课程十 Scala语言
课程简介:
Scala是一种面向对象的函数式编程语言,基于内存计算的Spark是基于Scala编写的,它较Java而言更加简单灵活,具有无限扩展的可能性。
课程内容:
Scala简介及安装Scala数据类型与基本语法类、对象、函数继承、特质、高阶函数、集合、模式匹配和样例类类型、隐式转换、并发、actor课程十一 大数据分析工具之Spark
课程简介:
Spark是一个快速通用的大规模数据处理引擎,它基于内存计算,因此相对于基于磁盘计算的MapReduce具有快速计算的特点;Spark编程简单,支持多种语言的API(Java、Python、Scala等),支持多种运行模式,所以Spark成为当今最流行的大数据处理工具,通过学习本课程,学员可以理解Spark运作机制,能够使用Spark解决数据挖掘工作。
课程内容:
Spark的发展、定义、特性、与MapReduce对比分析Spark安装及集群部署RDD详解:定义、特性、操作Spark内核:基本定义、Spark任务调度Spark Streaming 实时流计算Spark GraphX 图计算7.Spark MLlib (聚类,分类,推荐系统,文本挖掘等)机器学习
Spark SQLSpark源码剖析Spark案例分析PySpark安装及部署课程十二 综合案例
课程简介:
项目实战为主,将所学知识串通起来,让学员学会大数据项目经验,详细讲解大数据分析在各个行业中的应用。做到心中有数,找工作更顺心。
课程内容:
1.基于大数据平台的互联网金融监管实战
2.大数据交通案例
3.大数据电力案例
4.医保反欺诈案例
江苏CDA大数据分析研究院欢迎您咨询