Jitesh Khurkhuriya

在你决定成为一名数据科学家之前,你的脑海中可能会有很多问题。这是一个很好的职业选择吗?我能自学数据科学吗?它值得所有的投资和时间吗?我会尽力回答你所有的问题。

什么是数据科学?

维基百科将数据科学定义为:

统一统计、数据分析、机器学习、领域知识及其相关方法的概念,用数据理解和分析实际现象。它使用了数学、统计学、计算机科学、领域知识和信息科学等领域的技术和理论。”

《数据科学2021:完整数据科学与机器学习》

最后更新:2021年3月

  • 282课
  • 所有级别
4.6 (1963)

Machine Learning A-Z, Data Science, Python for Machine Learning, Math for Machine Learning, Statistics for Data Science |由Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队

探索课程

数据科学是一个好职业吗?

数据科学是一个很好的职业选择。数据科学家的平均年薪为11.3万美元到14万美元。学习数据科学可以帮助你在这个有回报的领域工作。独自理解其中一些技能可能听起来很难,有时可能是昂贵的。

这值得所有的投资吗?

为了避免顶级大学课程的费用和时间,你可以自己学习数据科学。自学最大的挑战是不知道要学什么,要学多少,要学的主题的顺序。那么你应该怎么做呢?

成为数据科学家需要的5项技能

除了主题专业技能,每个人都有不同的技能,让我们看看为什么我们需要学习以下技能。

机器学习中的大多数算法都是用数学术语表示的。因此,一定要熟悉并温习指数、对数、多项式方程、因式分解、二次方程和函数的一些基本概念。

基本的概率知识,比如在概率、条件概率、随机过程和随机变量中使用的各种术语就足够了。

描述性统计帮助我们得到一些简单但非常重要的数据。这是一个更简单的解释数据利用数据的集中趋势,我们确定一个核心价值在大多数的数据可以通过使用位于以及色散的测量,这有助于我们理解数据的传播。

顾名思义,推理统计帮助我们基于样本对整个数据进行推断或结论。一些关键的概念是概率分布、钟形曲线或正态分布、中心极限定理、置信区间和假设检验。

推理统计创建概率分布来推断数据。所以对概率项有一些基本的理解是绝对必要的。

有时,数据的简单可视化可以帮助我们推断或识别数据模式。可以帮助可视化数据的一些基本图是直方图、条形图、线图、散点图和箱线图。首先专注于绘制带有默认参数的图表,然后进行自定义。

定性数据以字母数字或文本形式存在,如汽车的颜色、性别、婚姻状况等。像数字特征一样,定性数据的图形可视化可以帮助我们识别不同数据元素之间的相似性或各种关系。

基本了解所有数据类型,特别是字符串、数字和列表类型的变量。对if-else、for循环和while循环进行一些良好的实践。记住,您不需要成为Python编程专家。你应该知道数据科学和机器学习所需的基础知识。Python相对于其他语言的最大优势之一是数据科学所需的各种模块和函数的可用性。如果您专注于学习多个数学函数、日期模块、字符串函数和方法,特别是长度、切片和索引、分割、条带和列表函数和用于搜索、长度的方法,以及如何处理多维列表,将会有帮助。

机器学习非常高效,容易学习,在处理各种数据方面非常灵活。熊猫是每个数据科学家工具箱中必备的工具。从不同类型的源读取数据很重要。您可能需要将各种文本转换为数字数据,并需要将数据分割为训练和测试。同时,学习将数据分解为训练和测试的模块。

每个人在机器学习过程中学习的第一个模型是回归模型。回归有助于我们理解不同类型变量之间的关系。回归用于预测数值,如股票的未来价格或下季度的销售情况。

与回归分析一样,分类方法在预测分类结果方面也很受欢迎。我们可以预测这样的结果,“这个客户会买我的产品吗?”或者“这个客户会拖欠贷款吗?”学习逻辑回归、决策树和支持向量机对解决分类问题有重要意义。

深度学习是数据科学和机器学习中最重要的课题之一。通过深度学习,人们可以处理大量的特征。此外,创建大型神经网络的能力提高了准确性。最显著的优势是它能够非常渐进地学习功能。这减少了对领域专业知识的需求。

那么你该怎么做呢?

使用下面的图表来指导学习什么和花多少时间在上面。

部分 主题 小标题/图书馆/模块 分钟时间(小时) 最大时间(小时)
数学 基本的代数 指数,对数,多项式,二次方程和函数的基本概念 1 2
微积分 变动率
函数的极限
导数
偏导数
1 2
线性代数 向量
矩阵
矢量变换
特征向量和特征值
4 6
概率 概率基本项
条件概率
随机过程
随机变量
1 2
统计数据 描述性统计 数据集中趋势
离差的量度
变量之间的相关性
2 4
推论统计 概率分布
正态分布
中心极限定理
置信区间
假设检验
12 16
数据可视化 数字数据图表 Matplotlib图书馆
散点图
线路图
柱状图
条形图
箱线图
2 4
分类数据的图表 Matplotlib图书馆
柱状图
饼图
1 2
图定制 Matplotlib图书馆
数据
次要情节
编辑图表元素
2 4
Python编程 数据类型 字符串
整数和浮动
列表
元组
字典
1 2
控制流 if - else
For循环
While循环
2 4
文件处理 处理各种文件类型,如csv, tsv和文本文件 2 4
模块和功能 数学
日期
Split, Strip的字符串功能
列表排序,兰
4 6
机器学习 数据处理 使用Pandas读取数据集
访问数据
检查并替换缺失的值
将分类转换为数字
scikit学习预处理
scikit学习model_selection.train_test_split
16 20.
回归 scikit linear_model学习。LinearRegression
scikit学习预处理。PolynomialFeatures
12 16
分类 scikit linear_model学习。LogisticRegression
scikit学习支持向量机。SVC
scikit学习树。DecisionTreeClassifier
scikit学习合奏。RandomForestClassifier
16 20.
特征选择 scikit feature_selection学习。RFE
scikit feature_selection学习。GenericUnivariateSelect
12 16
模型优化和模型选择 scikit学习model_selection.cross_val_score
scikit model_selection学习。GridSearchCV
scikit model_selection学习。RandomizedSearchCV
16 20.
深度学习 Keras模型建立

激活功能
损失函数
优化
初始化器
编译Keras神经网络
24 32
实践项目 项目1 波士顿房价预测 8 16
项目2 自行车的需求预测 16 24
项目3 汽车价格的预测 8 16
项目4 虹膜物种分类 4 8
项目5 皮马印第安人糖尿病分类 4 8
项目6 葡萄酒质量预测 4 8
项目7 银行电话销售 8 16
近似的小时 183 278
每周工作20小时 9周 12周
每周工作40-50小时 4周 6周

每个话题应该深入到什么程度?

在4到12周内,你将获得足够的技能,开始你在数据科学领域的旅程。在先前共享的计划中输入日期并开始执行。让我们建立一些正压力。所以,别忘了打印出来并固定起来。关于Udemy的课程帮助您详细理解每一个主题,并将帮助您开始您的数据科学之旅,以极大的信心。学习如何使你自己的数据科学投资组合这篇博客文章

页面最后更新:2020年11月

数据科学的顶级课程

2021年数据科学Python训练营Numpy Pandas & Seaborn
塔希尔艾瑟夫巴德
4.1 (15)
统计数据科学和商业分析
365职业,365职业团队
4.6 (25530)
畅销书
完整的机器学习和数据科学训练营2021
Andrei Neagoie, Daniel Bourke
4.6 (8333)
数据科学与机器学习(理论+项目)A-Z 90小时
AI科学,AI科学团队
4.4 (134)
2021年的20个真实世界数据科学和机器学习项目
TheMachineLearning。Org。
4.9 (20)
评价最高
拥有5个数据科学项目的数据科学训练营
数据是最好的学院
4.5 (445)
数据科学-项目管理方法论- CRISP-DM
360年digitmg网络学习
4.3 (147)
数据科学课程2021:完成数据科学训练营
365职业,365职业团队
4.6 (97011)
畅销书
R Programming A-Z™:R For Data Science With Real Exercises!
基里尔·艾瑞门科,Ligency小队的
4.6 (42551)
畅销书
机器学习,数据科学和深度学习与Python
圣道格教育由弗兰克凯恩,弗兰克凯恩,圣道格教育团队
4.7 (25829)
数据科学和机器学习训练营
何塞Portilla
4.7 (13737)
评价最高
R编程:数据科学的R高级分析
基里尔·艾瑞门科,Ligency小队的
4.7 (7330)

更多数据科学课程

数据科学的学生也要学习

让你的团队。领导行业。

通过Udemy for Business订阅您组织的在线课程和数字学习工具图书馆。

请求一个演示

Jitesh Khurkhuriya的课程

机器学习2020:机器学习的完整数学
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.2 (120)
Python训练营2021:完成Python编程大师班
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.6 (102)
《数据科学2021:完整数据科学与机器学习》
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.6 (1963)
DP-100: A-Z机器学习使用Azure机器学习
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.6 (4331)
畅销书

Jitesh Khurkhuriya的课程