园区各企业:
《机器学习实训—短视频推荐系统项目》本课程将引领学员在真实的“项目开发”模式下实现一个完整的推荐系统产品。从一个系统产品的工程项目视角,掌握从产品的需求,概要设计,数据下载与处理,基于内容推荐,协同过滤,点击率预估,算法组合与优化,服务性能评测与监控,基本Web/App服务等产品研发环节,全面提升学员在推荐系统方面的工程实践经验。
【培训特点】
周末线下小班学习(限制人数) 完整的推荐系统产品项目 导师现场辅导+线上一对一辅导答疑 优秀学员将获得推荐就业机会
【培训人群】
有Python编程经验 至少1年软件工程研发经验 初步掌握机器学习算法的理论基础
【培训讲师】
邹 博 中国科学院副教授,某气象公司首席科学家 研究方向机器学习、数据挖掘、计算几何,应用于大型气象设备的图像与本挖掘、股票交易与预测、传统农资产品价格预测和决策等领域。
王 亮 华中科技大学博士,前腾讯研究员。 曾在腾讯负责过多个社区搜索和推荐系统,在人工智能领域有超过10年的经验。研究领域包括搜索排序算法、推荐系统、NLP。2015年初创业,创立APPBK运营助手,关注AI在企业服务中的应用。
【培训模式】
1.实践为主 学习期间将按照真实的“项目开发”模式进行 每天课程3小节,每小节2小时 学生动手实践(讲师全程辅导):1~1.5小时 讲师安排任务,点评代码:30分钟+
2.线上辅助 2位导师+4位助教在线提供一对一答疑辅导
【培训内容】
第1天:工具准备
1. python解释器与概况
2. 数据挖掘和机器学习包的应用
3. 爬虫的编写
4. json与数据交换
第2天:推荐系统的算法基础
1. 线性回归
2. Logistic回归
3. 协同过滤
4. 卷积神经网络
第3天:开题,短视频“热门推荐”
第一节:从产品需求到代码构建
1. 理解产品需求说明书
2. 完成系统概要设计
3. 完成基本软硬件环节的构建
第二节:数据比算法更重要
1. 完成短视频结构和数据库的设计
2. 完成youku和weibo短视频的spider下载系统,下载至少500条数据
第三节:工程比算法更重要
1. 完成视频发布流程
2. 完成短视频推荐基本服务
3. 接入基本的web系统
额外任务:
1. 服务的性能如何衡量、评测、如何监控?
2. 我们用的web页面,怎么转成APP?
第4天:基于“内容”的短视频推荐
第一节:搜索是推荐的系统基础
1. 基于完成阿里云的视频搜索系统构建
2. 基于搜索系统,完成相关视频推荐服务
第二节:分类标签是推荐的数据基础
1. 完成爱奇艺分类语录数据下载
2. 完成基于liblinear的文本分类模型设计
3. 为下载的视频记录打分类标签
第三节:建立用户兴趣模型
1. 构建少量用户访问记录
1. 构建用户关键词模型
2. 构建用户兴趣类别模型
额外任务:
1. 自己写一个简单的搜索引擎
第5天:基于“协同过滤”的短视频推荐
第一节:用户访问记录构建
1. 基于标准测试集,构建用户访问记录
第二节:user-based 推荐
1. 完成实时的user-based推荐
2. 完成离线的user-based推荐
第三节:item-based 推荐
1. 完成离线的item-based计算任务
2. 完成线上的item-based 服务
额外任务:
1. 如何基于hadoop跑相关的任务
第6天:完成短视频“点击预估推荐”,结题
第一节:特征工程:数据挖掘工程师的工作主题
1. 完成特征选择文档
2. 完成特征的构建
第二节:LR:简单即王道
1. 完成基于LR的点击预估模型训练
2. 完成基于LR的线上推荐服务
3. 完成多种推荐算法的整合
第三节:结题
1. 完成系统的全方位监控
2. 完成项目总结
额外任务:
1. 如何获得更多的特征,如截图。
2.是否能使用深度学习模型。
【培训时间】
2017年8月12日 - 9月2日
线下:连续3个周六日线下授课
(8月12日-13日,8月19日-20日,8月26-27日)
线上: 2017年8月12日-9月2日,期间线上提供一对一答疑辅导
【培训地点】
北京海淀立方庭大厦东侧一层
【培训费用】
费用标准: 8000元/人
【报名方式】(以下两种报名方式任选其一)
1. 邮件报名:请下载填写报名表(附件1),并发送邮件至zgcyxxy@163.com,报名成功者会在开课前一天收到工作人员的电话确认。
2. 联系电话:13811366081(滑老师)
18601144812(柳老师)
中关村创新研修学院
2017年8月4日