原标题:面试AI算法岗,你被要求复现顶会了嘛?
参加AI作业拿到高薪仅仅是作业生涯的开端。现阶段AI人才结构在不断晋级,这也代表着假如现在依然停留在调用一些函数库,则在未来1-2年内很大概率上会失掉中心竞赛力的。几年前假如娴熟运用TensorFlow,一起把握底子的AI算法就能够很简单找到一份高薪的作业,但现在不一样了,AI岗位的要求渐渐的升高,对常识的深度也提出了更高的要求。
假如现在一个面试官让你从零推导SVM的Dual、从零完结CRF、推导LDA、规划一个QP问题、从零编写XLNet、编写GCN/GNN、改造SkipGram模型、用一天时刻复现一篇尖端会议.... 这些要求一点都不过火。相反,连这些底子内容都有些费劲,就需求从头审视一下自己的中心技术壁垒了。
现在AI人才竞赛越来越剧烈,“ 调参侠” 的年代已渐渐曩昔,这些作业其实底子不需求AI工程师来做,未来的研制工程师就能够承当这些了!
我信任不少人从前遇到过以下的状况或许困惑:
- 从事AI作业多年,但技术上 总感觉不行深化 , 并且很难再有提高;
- 对每个技术点了解,但 不具有系统化的认知 , 无法把它们串起来;
- 停留在运用模型/东西上, 很难依据事务场景来提出新的模型;
- 关于机器学习 背面的优化理论、前沿的技术不行深化;
- 方案从事尖端的科研、研究作业、 请求AI范畴研究生、博士生;
- 计划进入最顶尖的AI公司 比方Google,Facebook,Amazon, 阿里,头条等;
为了投合年代的需求,贪心学院(国内仅有系统化AI学院)现在推出了两门高端的AI练习营,分别是 《机器学习高阶练习营》和 《自然语言处理高阶练习营》。 需求必定的AI根底,是为进阶人士量身定做的一套AI进阶课程,选用全程直播授课形式,近距离触摸尖端讲师。
依据以往的经历,很大部分学员都是国内外顶尖公司的AI从业者、还有一部分是大学里从事AI的研究生、博士生, 这儿不乏来自斯坦福、UCSD、USC、哥大、HKUST、爱丁堡等国际名府的学生;在这儿,你不光能够享受到通往顶尖人才的高兴、也能够结识情投意合的AI从业者以及未来的科学家。
那这样的练习营到底是怎么样的呢? 下面以 《机器学习高阶练习营》为例。 《自然语言处理高阶练习营》的内容能够增加咱们专业的AI作业规划师来咨询,咱们的咨询师也是尖端AI公司出来的哦~
01课程纲要
榜首阶段 机器学习根底与凸优化
本阶段首要意图是解说必要的算法理论以及凸优化技术,为后续的课程打下根底。凸优化的重要性显而易见,假如想具有改造模型的才能,关于凸优化的了解是必不可少的!
【中心常识点】
- KNN,Weighted KNN、近似KNN
- KD树,近似KD树、哈希算法、LSH
- 岭回归、LASSO、ElasticNet
- 正则:L1, L2, L-inifity Norm
- LR、GD、SGD、小批量SGD
- 凸集,凸函数、断定凸函数
- LP、QP、ILP、SDP问题
- Duality,Strong Duality、KKT条件
- 带条件/无条件优化问题、Projected GD
- 滑润函数、Convergence Analysis
【部分事例解说】
- 依据QP的股票投资组合战略规划
- 依据LP的短文本类似度核算
- 依据KNN的图画辨认
第二阶段 SVM与集成模型
本阶段首要意图是深化了解SVM以及核函数部分的常识点。为了了解清楚SVM的Dual转化,需求把握榜首部分里的Duality理论。别的,要点介绍Bagging和Boosting模型,以及所涉及到的几项风趣的理论。
【中心常识点】
- Max-Margin与线性SVM构建
- Slack Variable以及条件的松懈
- SVM的Dual、Kernelized SVM
- Kernel Functions, Mercer'定理
- Kernelized LR/KNN/K-Means/PCA
- Bagging, Boosting, Stacking
- 信息论与决策树
- 随机森林,彻底随机森林
- 依据残差的提高树练习思维
- GBDT与XGBoost
- 集成不一样的模型
- VC理论, PAC Learning
【部分事例解说】
- 依据XGBoost的金融风控模型
- 依据PCA和Kernel SVM的人脸辨认.
- 依据Kernal PCA和Linear SVM的人脸辨认
第三阶段 无监督学习与序列模型
本阶段首要意图是学习无监督算法和经典的序列模型。要点解说EM算法以及GMM,K-means的联系,一起花几回课程时刻来细心解说CRF的细节:从无向图模型、Potential函数、Log-Linear Model、逻辑回归、HMM、MEMM、Label Bias、Linear CRF、Inference,最后到Non-Linear CRF。
【中心常识点】
- K-means、GMM以及EM
- 层次聚类,DCSCAN,Spectral聚类算法
- 隐变量与隐变量模型、Partition函数
- 条件独立、D-Separation、Markov性质
- HMM以及依据Viterbi的Decoding
- Forward/Backward算法
- 依据EM算法的参数估量
- 有向图与无向图模型差异
- Log-Linear Model,逻辑回归,特征函数
- MEMM与Label Bias问题
- Linear CRF以及参数估量
【部分事例解说】
- 依据HMM和GMM的语音辨认
- 依据聚类剖析的用户集体剖析
- 依据CRF的命名实体辨认
第四阶段 深度学习
本阶段首要解说深度学习理论以及常见的模型。这儿包含BP算法、卷积神经网络、RNN/LSTM、BERT、XLNet、ALBERT以及各类深度学习图模型。别的,也会涉及到深度相关的优化以及调参技术。
【中心常识点】
- 神经网络与激活函数
- BP算法、卷积层、Pooling层、全衔接层
- 卷积神经网络、常用的CNN结构
- Dropout与Batch Normalization
- SGD、Adam、Adagrad算法
- RNN与梯度消失、LSTM与GRU
- Seq2Seq模型与注意力机制
- Word2Vec, Elmo, Bert, XLNet
- 深度学习中的调参技术
- 深度学习与图嵌入(Graph Embedding)
- Translating Embedding (TransE)
- Node2Vec- Graph Convolutional Network
- Graph Neural Network
- Dynamic Graph Embedding
【部分事例解说】
- 依据Seq2Seq和注意力机制的机器翻译
- 依据TransE和GCN的常识图谱推理
- 依据CNN的人脸要害点检测
第五阶段 引荐系统与在线学习
引荐系统一直是机器学习范畴的中心,所以在本阶段要点来学习引荐系统范畴干流的算法以及在线学习的技术、包含怎么运用增强学习来做引荐系统。 在线学习算法很深具有很漂亮的理论根底,在本阶段你都会逐个体会到!
【中心常识点】
- 依据内容和协同过滤的引荐算法
- 矩阵分化,带条件的矩阵分化
- 依据内容的Gradient Tree
- 依据深度学习的引荐算法
- 冷启动问题的处理
- Exploration vs Exploitation
- Multi-armed Bandit
- UCB1 algorithm,EXP3 algorithm
- Adversarial Bandit model
- Contexulalized Bandit、LinUCB
【部分事例解说】
- 运用GB Tree做依据 interaction 与 content的广告引荐
- 运用深度神经网络做依据interaction 与 content的引荐
- LinUCB做新闻引荐, 最大化rewards
第六阶段 贝叶斯模型
本阶段要点解说贝叶斯模型。贝叶斯派差异于频率派,首要的使命是估量后验概率的方法来做猜测。咱们要点解说主题模型以及不同的算法包含吉布采样、变分法、SGLD等,以及怎么把贝叶斯的结构结合在深度学习模型里运用,这就会衍生出Bayesian LSTM的模型。贝叶斯部分的学习需求必定的门槛,但咱们会让每个人听懂一切细节!
【中心常识点】
- 主题模型(LDA) 以及生成进程
- Dirichlet/Multinomial Distribution
- 蒙特卡洛与MCMC
- Metropolis Hasting与Gibbs Sampling
- 运用Collapsed Gibbs Sampler求解LDA
- Mean-field variational Inference
- 运用VI求解LDA
- Stochastic Optimization与贝叶斯估量
- 运用SLGD和SVI求解LDA
- 依据分布式核算的贝叶斯模型求解
- 随机进程与无参模型(non-parametric)
- Chinese Retarant Process
- Stick Breaking Process
- Stochastic Block Model与MMSB
- 依据SGLD与SVI的MMSB求解
- Bayesian Deep Learning模型
- Deep Generative Model
【部分事例解说】
- 依据Bayesian LSTM的文本剖析
- 运用无参主题模型做文本分类
- 依据贝叶斯模型完结小数量的图画辨认
第七阶段 增强学习与其他前沿主题
本阶段要点解说增强学习以及前沿的内容,包含增强学习在文本范畴的运用,GAN, VAE,图片和文本的Disentangling,深度学习范畴可解说性问题、Adversial Learning, Fair Learning等最前沿的主题。 这一阶段的组织也会依据学员的爱好点做部分的调整。
【中心常识点】
- Policy Learning、Deep RL
- Variational Autoencoder(VAE)与求解
- 隐变量的Disentangling
- 图画的生成以及Disentangling
- 文本的生成以及Disentangling
- Generative Adversial Network(GAN)
- CycleGan
- 深度学习的可解说性
- Deconvolution与图画特征的解说
- Layer-wise Propagation
- Adversial Machine Learning
- Purturbation Analysis
- Fair Learning
【部分事例解说】
- 依据GAN的图画生成
- 依据VAE的文本Style Transfer
- 可视化机器翻译系统
为AI从业者/研究生/研究员专门定制
全网仅有《机器学习高阶练习营》
对课程有意向的同学
报名、课程咨询