硅谷AI Mini Program系列培训课程

跟随硅谷技术领袖 学习最热门的职业技能

岗位核心技能

以实际工作的需求为核心,传授工作所必须技能,为你以后的职业道路出谋划策

硅谷实战案例

 深入浅出学习理论与硅谷案例实战,亲自审阅代码并指导完成最新应用案例

硅谷团队主讲

数位来自Google,Uber, Facebook等工程师共同打造不一样的AI培训课程

国内学员量身订造

专为国内学习爱好者打造,课程基本采用中文授课,拒绝翻译以及二次加工


课程背景

Course Background


🅐 AI Mini Program学习目的

硅谷是大数据和人工智能技术主要发源地,顶尖的数据科学家一半以上集中在硅谷。本课程内容分为三个部分,从浅入深,专注于从数据建模到实际工作中的应用,由硅谷最前沿科技公司的资深专家们带领你,从实践中学习到人工智能最核心内容。
我们将从掌握数据采集、处理与提炼的方法和工具开始;到深刻了解什么是机器学习,如何利用机器学习方法解决不同领域的实际问题;以及最终能够通过学习人工智能系列知识,来掌握深度学习中最核心应用模型,让你成为一名能够解决不同领域复杂问题的硅谷人工智能工程师。

🅑 关于本课程教学计划 

本项目以培养硅谷数据与人工智能专家为目标。
课程内容分为三个部分,从浅入深,循序渐进,且独立成篇。每部分约32小时时长,约由8小节组成;每节皆通过1-4个硅谷科技公司实战案例,来深入浅出的学习理论与实践知识;并每部分都会在最后一小节,由硅谷最前沿科技公司的专家来带领学员,进行独一无二的硅谷实战项目实践训练,融会贯通整部分内容。 (如图)

🅒 关于加州大学结业证书

本课程与加州科技大学合作,学习本课程将获得由加州科技大学颁发的结业证书;
 在开展学位教育的同时,加州科技大学也与同样位于硅谷的斯坦福大学和加州大学伯克利分校,以及诸多著名的硅谷科技公司合作,致力于提供 ● 金融科技 ● 人工智能 ● 大数据 ● 云计算 短期培训课程;加州科技大学也一直受加州当地政府授权委托开展计算机职业教育培训,完成职业培训或短期课程的学员,成功加入Facebook,LinkedIn,Amazon,Google公司工作。 


课程大纲

Course Outline


第 0 阶段: 预习准备

为助你夯实 Python 和数学基础、顺利完成入学挑战,教练团准备了一些材料供你自主学习:

1. 了解 Python Numpy 模块:Python Numpy Tutorial
2. 学习相关数学基础
    了解概率论里的条件概率和贝叶斯定理;
    了解线性代数中向量、矩阵的基本运算;
    了解导数和偏导数运算:微积分求导数的链式法则。

第 1 阶段: 大数据及应用(32小时)

学习目的:

通过学习掌握数据采集、处理、提炼的工具和方法,获得提炼整理数据价值的能力,成为一名合格的硅谷数据分析师。
 并为第二、第三阶段的学习做好准备,为你未来的商业分析师、大数据工程师、数据科学 家、以及人工智能专家之路,建立起坚实基础。

第 1-3 节: 数据科学与 Python

 1. Python 准备,基本功能案例练习等。
2. Python 数据科学库的学习与应用,包括以下的库:Pandas,numpy,matplotlib 等。
3. 数据科学在商业分析中的基础应用 
学完后以上部分内容后, 学员将能够通过使用 python工具来导入数据、进行浏览、分析、从中学习、可视化并最终生成易于共享的报表, 从而在大型数据集中找到答案。 

第 4 节:Spark 概论

介绍 Spark Core ,SQL,Hadoop/HDFS/Hive (Needed for Spark)使用方法,实际操作,在线演示,及企业应用案例(如房价数据库)。通过案例了解Skark命令行语法和使用它们的例子及 Spark 程序调优技巧。
通过这次学习,学生对数据存储从 hadoop/hive 到 SPARK 的发展及关联有一个清晰的理解。对 SPARK 的应用场景,如金融数据管理有一个深入的理解。 

第 5 节:SPARK 基本原理

讲述 SPARK 的核心技术,及 SPARK 技术的特点和长处。
Spark SQL 2.1
a. SPARK SQL 基本原理
b. Spark Dataframe 与Dataset
c. Spark SQL 与 Spark Core 的关系
学生通过以房价数据为基础的案例,了解SPARK的数据结构及运行机制,并熟悉实际操作指令。 

第 6 节:SPARK应用及与通用数据库的结合

通过 SPARK 与其他数据库的比较,理解选择 SPARK 的原因及如何与其他数据库数据的联合应用。
SPARK SQL 程序设计应用案例
a. 如何访问 MySQL, HDFS,
b. Spark SQL 的关键点
c. Spark 与 Hive 的整合。
应用案例: 如何对房价数据进行分析, 包括数据提取,寻找最大、最小、中间值等。
还可以对数据进行处理,如清除非理性数据。 

第 7 节:实习项目

综合案例:带领学员完成一个完整的从数据挖掘存储分析到预测的房价咨询系统项目。
a. 如何组建数据库
b. 构建实时处理线
c. 搭建房价咨询系统 

第 8 节:数据与机器学习

介绍机器学习中的基本概念,如监督学习,无监督学习,分类,回归,集群或潜在因素的发现。
实际案例: 通过简单的图像识别深入介绍机器学习的过程。
并通过以下四个案例初步了解机器学习各种算法和应用情况
a. 通过自动驾驶图像识别案例介绍支持向量机(SVM),高斯判别分析,线性回归,逻辑 回归,岭回归和Lasso。
b. 通过一个人脸识别案例介绍 基于重采样的方法:交叉验证,自举和模型选择。
c. 通过一个高科技企业内部投资回报决策案例介绍基于树的方法:决策树(分类和回归树),套袋,随机森林和增强。
d. 通过一个医疗行业图像与语音识别案例介绍神经网络表示和学习及深度学习。 

第 2 阶段:机器学习(36小时)

学习目的:

通过学习机器学习的基础理论以及应用工具,并结合机器学习在不同领域的建模和算法应用情况,使你深刻了解什么是机器学习,如何利用机器学习方法来解决不同领域的实际问题。
通过本阶段的学习,你可以成为一名合格的硅谷初级商业分析师,数据工程师,和数据科学家。也为你进一步学习我们本项目的第三阶段人工智能课程打下牢固基础,最终使你能成为一名合格的硅谷人工智能工程师。 

第 1 节 概述(上)

1.了解机器学习模型的所有基本组成部分:损失函数/目标函数,优化算法,超参数。
2.了解机器学习应用程序的生命周期:模型和问题的形成,特征,培训,验证,测试和服务。
3.了解无监督学习和模型缩减:k均值聚类,层次聚类和主成分分析(PCA),基于重采样的方法:交叉验证,自举和模型选择,监督,回归,分类等等
案例结合:
介绍机器学习模型在医疗、法律、行政等行业中的应用
人脸识别案例应用场景 

第 2 节 概述(下)

1.了解如何编码线性回归问题的端到端
2.充分了解正规化及其对模型质量的影响
3.了解数据大小,特征大小和模型复杂性之间的权衡
1.能够推导出逻辑回归公式
2.能够编码逻辑回归端对端
3.了解随机梯度下降,能够编码逻辑回归的随机梯度下降
4.能够理解其在现实案例中的应用,以及为什么人们使用它
案例结合:
介绍机器学习模型在零售业行业的应用 

第 3 节 神经网络和聚类(上) 

神经网络表示和学习,反向传播算法,卷积神经网络和最近邻居搜索。
1.了解完全连接的神经网络的所有组件
2.了解反向传播并能导出优化算法
3.了解神经网络复杂性与过度拟合之间的权衡与实际操作的例子
案例1
植物识别案例
我们通过一个植物识别案例学习如何用反向传播推导出最优算法 

第 4 节 神经网络和聚类(下)

1.了解聚类公式如何与监督学习不同
2.能够从端到端编码K-means和EM算法
3.理解最佳实践,如分割,过滤聚类
案例2
我们将通过一个动物识别案例来学习和掌握本章节内容
我们通过有一个动物识别案例学习学习聚类公式和监督学习的不同,并理解最佳实践。 

第 5 节 功能和 svm

1.了解特征选择和三种最常见的特征选择技术
2.了解特征降维,线性与非线性,知道PCA,局部线性嵌入等
3.能够对PCA进行编码
案例3
手写文字识别
我们通过一个手写文字识别案例学习实践三种常见的特征选择技术,并进行PCA编码 

第 6 节 决策树和梯度提升决策树

学习基于树的方法:决策树(分类和回归树),套袋,随机森林和增强。
1.知道如何推导SVM公式
2.了解一个常见的快速SVM优化算法
3.知道SVM如何处理与内核的非线性
4.了解如何使用SVM以及哪些是主要的超参数
案例4
我们通过一个安保图像识别案例和某高科技企业内部投资回报决策案例学习使用SVM算法 

第 7 节 朴素贝叶斯和马尔可夫模型

1.文档主题建模概述
2.深入学习狄里克雷分配模型
案例5
人机界面语音识别
我们通过一个人机界面语音识别案例了解学习贝叶斯和马尔可夫模型在机器学习中的应用 

第 8 节 推荐和强化学习

1. 推荐算法概述及在推荐产品中的应用
2.深入分析矩阵分解法
案例6
通过完成一个简单的对战型游戏的编写,学习了解推荐算法的应用 

第二阶段案例实践课程

电影推荐
运用本阶段课程所学的知识和工具,学习并自己动手编写一个电影推荐程序代码 

第 3 阶段 人工智能与深度学习及应用(36小时)

学习目的:

通过学习人工智能-深度学习里最核心应用模型,了解什么是深度学习,什么又是人工智能。通过“看到的”自动驾驶医疗图像识别,“听到的”自然语言识别关键词汇等应用案例使学 员了解到硅谷乃至世界最新的科技成就和应用。掌握如何在不同领域中,应用深度学习(神经元网络)实现更加精准的预测判断,来解决真实世界的多种复杂问题。

通过本阶段的学习,你将掌握人工智能最核心知识内容,成为一名合格的硅谷人工智能工程师,并成为未来各专业领域最稀缺岗位中的一员。
本课程将教授当代 TensorFlow 库用于深度学习及实际应用。 目标是帮助学生理解TensorFlow 的算法,探索它所提供的功能,并学习如何构建最适合深度学习项目的模型。 课程的主要内容包括以下几个部分:

第 1 节

人工智能在谷歌的项目介绍,以及 Python 在人工智能中的应用

案例 1
分享介绍一个如何利用人工智能的方式来完成手写体识别的案例 

第 2 节:

TensorFlow 基础,编程,及程序规范

案例 2 :在人脸识别中的应用
通过一个人脸识别案例介绍 TensorFlow 编程 

第 3 节:

线性和 Logistic 回归及在实际中的应用
如何用 tensorFlow 的库解决Logistic 回归问题
案例 3 :手写体(人脸)图形识别(提高精度)
学习如何利用 Logistic 回归提高手写体(人脸)识别精度 

第 4 节:

DNN(深度神经网络),正则化,丢失,超参数调整。

案例 4 :手写体识别(提高精度)
学习如何利用 DNN 提高书写体的识别精度 

第 5 节:

CNN(卷积神经网络)

 案例 5 :图形识别(提高精度)
学习如何利用 CNN 提高图形识别精度 

第 6 节:

RNN(递归神经网络)

案例 6
一个中英翻译案例的实践,学习如何利用 RNN 提高翻译准确度 

第 7 节:

LSTM 和 Seq2seq
案例 7
语音识别的应用 Speech Keyword Detection 关键词识别,学习和掌握利用 LSTM 和 Seq2seq
进行语音关键词的识别

第 8 节:

学习和掌握增强性能学习在阿法狗中的应用 

第三阶段案例实践课程

运用本阶段所学的知识和工具完成一个复杂的应用项目,例如效果比较等


实战案例

Case Presentation


商品价格或房价趋势分析

Brand

在这个项目中,你会挑战一个数据分析的任务,学员通过使用 python 来导入数据,进行商品价格信息(房价信息)浏览,分析,形成易于分析的报表,从而进行价格趋势的观察。 

自动驾驶图像识别场景

Design

在这个项目中,你将利用监督学习算法建立一个自动驾驶图像识别基本模型,学习岭回归, 线性回归等不同会算法对模型所带来的影响。 

人脸识别案例应用场景

Marketing

在这个项目中,你将利用无监督学习算法建立一个人脸识别基本模型,学习 K 均值聚类,层 次聚类等不同算法对模型所带来的影响。 

某高科技企业内部投资回报决策案例 

Invest

在这个项目中,你将利用所学的决策树的方法,在一个企业内部投资回报决策中进行分析判 断。加深对分类回归等概念的理解。 

医疗行业图像与语音识别应用  

Marketing

在这个项目中,你可以通过一个医疗行业图像和语音识别的案例了解深度学习(神经网络) 基本概念和应用。

推荐算法概述及在推荐产品中的应用

Brand

通过完成一个简单的对战型游戏的编写,学习了解推荐算法的应用

在人脸识别中的应用 

Design

通过一个人脸识别案例介绍 TensorFlow 编程

 Python 在人工智能中的应用

Marketing

分享介绍一个如何利用人工智能的方式来完成手写体识别的案例

图形识别(提高精度) 

Invest

学习如何利用 CNN 提高图形识别精度

语音识别的应用

Marketing

Speech Keyword Detection 关键词识别,学习和掌握利用 LSTM 和 Seq2seq
进行语音关键词的识别 


教师团队

OUR TEAM


Chen Jinsong  

加州大学伯克利博士

本科毕业于清华大学,于加州大学伯克利分校获博士学位,目前就职于伯克利劳伦斯国家实验室(Lawrence Berkeley National Labs),专注于统计方法与数据分析领域十余年,目前主要从事数据集成以及建模方面的研究以及应用工作。

Zhang Ming  

谷歌架构工程师

毕业于清华大学,获硕士学位,在美国硅谷从事计算机软件开发工作十余年,曾就职于雅虎,以及思科。 现就职于谷歌总部,主要负责网络架构,以及数据中心的搭建。 

Xu Qing  

美国范德堡大学计算机博士

主攻机器学习领域,拥有十年以上的机器学习研究及其应用的丰富经验。 曾就职于微软,谷歌,负责算法相关工作,如开发数据挖掘算法和广告点击率预测等等。 现就职于优步美国总部,主要从事定价和动态车辆调度系统的研究和开发工作。 

Zhu Shaojian

美国马里兰大学巴尔博士

本科毕业于复旦大学,于美国马里兰大学巴尔的摩分校获计算机博士学位,主攻AI领域。
目前就职于谷歌AI部门,专注于Google Analysis以及Inline Intelligence integration等工作。 

Andrew Zhang

数据科学与人工智能工程师

美国科学促进会会员,长期从事大数据科学与人工智能技术在能源、交通、环境、金融等领域的研究与应用工作。
曾就职于斯坦福大学卡内基研究院、加州州立大学等;现为金融科技公司HB 高级工程师、以及数据科学与人工智能负责人。 

NieXiaojie

美国加州大学博士

本科就读于清华大学,并于美国加州大学戴维斯分校获博士学位。
长期从事软件开发和应用,目前就职于谷歌公司,主要负责Google cloud 平台及其应用程序搭建方面工作。 

Liu Jing  

美国加州大学博士

曾任美国自然科学基金-高校创新项目的实验室创业负责人,目前专注于VR/AR方面科研工作,并热衷于将高新技术转化为产业。曾就职于谷歌,迪士尼,英伟达,南加大等世界一流创新公司以及实验室。 现为硅谷高科技创业公司 Bellus3D 的工程总监,联合创始人。 

Liao Guang Bing

伯克莱加大哈斯商学院MBA

现任思杰(Citrix)公司市场分析与运营战略总监。在商务分析和数据科学方面有20多年经验。近年来致力于市场数据和行为模式的分析和研究。采用大数据,数据挖掘和机器学习等方法优化市场营销的效率,提高企业营收效率。获得两次SiriusDecisions 市场分析和创新大奖,以及2016 CIO.com全美分析界Analytics50大奖

George Jen

美国西北理工大学计算机科学博士

在硅谷IT行业超过20年的工作与管理经验,目前担任硅谷MicroFocus Vertic公司资深大数据科学家,专注于深度技术问题的解决


课前试听

Audition



课程安排

Class Schedule