Jitesh Khurkhuriya

如果你想成为一名数据科学家,你需要学习广泛的主题和一些技能。尽管顶尖大学提供这些主题的课程,但参加这些课程可能会花费你数千美元和数月的努力。所以很自然,我们大多数人都想自己学习数据科学。理想情况下,你可以在空闲时间学习,而不放弃其他任务。

你可以学习成为数据科学家所需的技能。事实上,数据科学家永远不会停止学习——我知道我不会。

让我告诉你怎么做。

数据科学2021:完成数据科学和机器学习

2021年10月

  • 281课
  • 所有级别
4.6 (2022)

学习和掌握Data Science, Python for Machine Learning, Math for Machine Learning, Statistics for Data Science |由Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队

探索课程

为什么大多数有抱负的数据科学家会放弃

如果你已经试图自学数据科学并放弃了,不要惊慌。大多数声称能教你数据科学的资源都存在一个问题,那就是它们没有提供一个清晰的学习路径。要成为一名数据科学家,你不需要掌握每一项技能。你只需要学习以下5个学科的基础知识:

让我们深入研究这些问题,找出你需要学习和不需要学习的东西。

数学:数学的原因吗?

让我们从数学开始。你为什么要懂数学?你需要数学才能和电脑沟通。机器学习中的大多数算法都用数学术语表示。

数据科学家应该学习哪些数学领域?

这看起来可能很多。记住这些是来自更大领域的关键技能。例如,你不需要学习所有的线性代数,只需要从中选择一些。

一个好的数据科学家必须熟悉一些数学的基本概念。这些包括指数、对数、多项式方程、因式分解、二次方程和函数。在这个阶段,你不需要进行太多的练习或深入研究。只要确保你理解了这些概念,并对它们有所了解。微分学或导数的概念对任何数据科学家来说都是必须的。

几乎所有的机器学习算法都是基于最优化原理。这包括神经网络。梯度下降实现了这种优化。这意味着,如果你想在神经网络的流行领域工作,你需要了解优化。

如果你想做预测分析,你需要了解线性代数。它是数据科学和机器学习的预测分析的支柱。线性代数将帮助你理解各种算法是如何工作的。

分类问题都使用概率。概率可以帮助你做出诸如“这个客户会买吗?”以及“该客户会拖欠贷款吗?”推理统计创建概率分布来推断数据。理解常见的概率术语很重要。

统计:统计的原因吗?

现在我们已经学习了数学技能,是时候谈谈统计学了。有一些统计的特定领域对数据科学很重要。你需要了解这些才能了解数据科学的数据。

数据科学家应该学习哪些统计概念?

描述性统计帮助我们得到一些简单但非常重要的数据。描述性统计是对数据的直接解释。他们使用数据的集中趋势。我们确定一个中心值,大部分数据都在那里。我们还确定了离散度的度量,这有助于我们理解数据的传播。

如果你想了解不同的机器学习算法,你需要能够研究相关性。数据点之间的各种关联在数据理解和数据选择中是有用的。

对于真实的数据,通常需要推理统计。推理统计帮助我们基于样本对真实数据进行推理或结论。推理统计创建概率分布来推断数据。

Python:为什么Python ?

Python是一种编程语言,许多数据科学家使用它。这是因为Python有数据科学所需的各种模块和函数。记住,您不需要成为Python编程专家。你只需要知道你将在数据科学和机器学习中使用什么。然后你需要在不同的场景中练习它们。

在Python中,数据科学家应该知道什么?

文件处理是Python中最重要的概念之一,每个数据科学家都应该知道。您需要关注文件的基本读、追加和写。此外,还应该知道如何对读取的数据应用循环。

您还需要对所有数据类型有基本的了解。特别是,数据科学使用字符串、数字和列表类型的变量。一旦了解了这些,就需要掌握list和string变量的循环。

你应该专注于学习Python中的各种数学函数。您还需要日期模块和字符串函数。对于数据科学来说,最重要的是长度、切片和索引、分割和条带。您还需要了解用于搜索、长度以及如何处理多维列表的列表函数和方法。

数据可视化:为什么要使用数据可视化?

人们说一幅画胜过千言万语。可视化给出了这幅图。数据的简单可视化可以帮助我们推断或识别数据模式。

要实现数据可视化,数据科学家需要知道什么?

您可以使用库集中精力构建数据可视化技能。Matplotlib是Python数据可视化的一个优秀包。Matplotlib有许多特性和现成的函数。尝试使用Python列表使用简单的数据创建绘图,然后再从大文件中获取复杂的实际数据。

作为一名数据科学家,您还需要了解图表定制的基础知识。首先专注于绘制带有默认参数的图表,然后进行自定义。快速理解和创建模板可以帮助您在几乎所有未来项目中可视化数据。您可能需要使用图表自定义作为向不同涉众展示的一部分。您必须解释使用不同图表观察到的数据模式。在这种情况下,您可以一次创建多个图。您将希望使这些图表在视觉上具有吸引力。这就需要各种图表定制工具,如图表和子图。此时,您还需要编辑多个图表元素,如标记和线条属性。

您还需要对定性数据进行图形化可视化。定性数据可以是文字而不是数字。可以是汽车颜色、性别和婚姻状况等信息。定性数据的图形化可视化会有所帮助。它可以识别数据元素之间的相似点或各种关系。

机器学习:为什么是机器学习?

数据科学家70%的时间都花在数据操作和数据处理上。你可以使用各种工具和机器学习算法来分析数据进行预测。在这样做之前,您需要清理数据、研究并处理它。它非常高效,容易学习,在处理各种数据时非常灵活。

机器学习需要什么工具?

每个数据科学家都应该学习熊猫。从不同类型的源读取数据很重要。您可能必须将各种文本转换为数字数据。您可能还需要将数据划分为训练和测试类别。这意味着您还需要学习将数据分解为train和test的模块。

回归有助于数据科学家理解不同类型变量之间的关系。你可以使用回归来预测数值。这些可以是股票的未来价格或下个季度的销售额。当您这样做时,您可以重用数据处理模板来节省时间并更多地关注核心概念。

回归是每个人在机器学习过程中首先学习的模型之一。集中在多元线性回归和多项式回归从scikit学习图书馆。学习和实践这些模块和函数的各个参数的效果。

与回归分析一样,分类方法在预测分类结果方面也很受欢迎。比如,“这个客户会买我的产品吗?”或“该客户会拖欠贷款吗?”学习逻辑回归、决策树和支持向量机是解决分类问题的重要方法。学习这3个以及这些算法的每个参数的作用。虽然还有其他类型的方法,记住,我们这里的重点不是学习每一种算法。

特征选择将专业人士和业余爱好者区分开来。根据常识,您可以包含几乎所有或部分预测功能。在处理数百个特性时,不可能理解每个变量。这就是为什么我们需要使用各种统计分析。我们需要选择具有最大预测能力的特性。重点从不同类型的文件读取数据,创建数据帧,并从数据帧读取数据。您还应该关注各种流行的方法和函数,如shape、index、columns、sum、describe、sort_values和loc。

别忘了记录你的进步

当你学习这些技能时,跟踪你的进步是很重要的。你可以制定一个计划,每周或每天跟踪你的进步。您可以了解关于创建跟踪器或计划器的详细信息。

在学习这些话题的同时,你也应该专注于向世界展示你的知识和成就。如今,你的公众形象对招聘决定有很大的影响。单靠简历是不够的。你需要学习如何制作自己的数据科学项目组合。

成为数据科学家的旅程现在就开始了

这篇文章强调了哪些技能和哪些科目是必须学习的,以及在什么水平上。你不需要了解每一个技能和主题的细节,尽管有些技能需要深入学习。这些都是成为一名成功的数据科学家的关键技能。关于Udemy的课程解决所有这些技能,可以帮助你踏上成为一名数据科学家的旅程。了解为什么和如何自学数据科学这篇博客文章

页面最后更新:2020年11月

数据科学的顶级课程

统计数据科学和商业分析
365职业,365职业团队
4.6 (26714)
畅销书
数据科学大课程:#在60天内构建{60个项目}
Pianalytix。
4.7 (30)
评价最高
完成2022年数据科学与机器学习训练营
philip Muellauer, Angela Yu博士
4.6 (3676)
数据科学,分析和人工智能为商业和现实世界™
Rajeev D. Ratan, Nidia sahara
4.2 (279)
畅销书
数据科学课程2021:完成数据科学训练营
365职业,365职业团队
4.6 (98950)
畅销书
R Programming A-Z™:R For Data Science With Real Exercises!
基里尔·艾瑞门科,Ligency |团队
4.6 (43263)
畅销书
机器学习,数据科学和深度学习与Python
太阳狗教育由弗兰克凯恩,弗兰克凯恩,太阳狗教育团队
4.6 (26140)
数据科学和机器学习训练营
何塞Portilla
4.7 (13978)
评价最高
R编程:数据科学的R高级分析
基里尔·艾瑞门科,Ligency |团队
4.7 (7434)
完成机器学习和数据科学训练营2022
安德烈·尼格伊,丹尼尔·伯克,《从无到有
4.6 (8764)
数据科学职业指南-面试准备
何塞Portilla
4.6 (2139)

更多数据科学课程

数据科学的学生也要学习

让你的团队。领导行业。

通过Udemy for Business订阅您组织的在线课程和数字学习工具图书馆。

请求一个演示

Jitesh Khurkhuriya的课程

机器学习2020:机器学习的完整数学
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.1 (128)
Python训练营2021:完成Python编程大师班
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.7 (105)
区块链2021 -完成区块链初学者课程。
Jitesh Khurkhuriya
4.4 (319)
DP-100: A-Z机器学习使用Azure机器学习
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.6 (4545)
畅销书
数据科学2021:完成数据科学和机器学习
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.6 (2022)

Jitesh Khurkhuriya的课程