Datawhale学习
贡献者:Datawhale、伯禹教育、上海交通大学ACM班
本月组队学习,包含了人工智能、数据科学、基础编程3个模块,共11个学习内容。
相关企业、高校、学院、协会、社团等参与,倡导开源学习,通过开放协作的学习方式,探索有意义的工作,建立有意义的人际关系。
中南大学计算机学院科协
厦门大学WISERCLUB
浙江大学人工智能协会
华东理工大学创新创业协会
闽江学院数学建模协会
西安电子科技大学科创社
重庆邮电大学软件工程学院
南通师范高等专科学校科技创新社
华北电力大学大数据与哲学社会科学实验室
华北电力大学LSGO软件技术团队
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上(地址见下方),方便大家有监督和无监督学习,从而帮助到更多学习者成长。
截止今日,Datawhale已经开源50多门学习内容,涉及编程、数据科学、cv、nlp、强化学习和推荐系统6大模块,这源自每一个开源贡献者的参与。
https://github.com/datawhalechina/team-learning
顾名思义,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延症,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促共进。或许你可以从这些文章进一步了解:《黄元帅:组队学习的大航海模型》、《闻韶:我的组队学习经历》、《罗如意:从学习者到贡献者》。
开源教程
1 /吃瓜教程—西瓜书+南瓜书
开源贡献:谢文睿、秦州、卢水琼
内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!详细介绍点这里
学习周期:18天
定位人群:有高数、线代、概率论与数理统计基础的同学
学习名额:180人
️ 配套讲解视频已上传至B站,地址见文末「快速通道」
任务节选
Task02:概览西瓜书、南瓜书第3章(6天)
《机器学习》第3章
涉及的线性回归等数学难点
2 /李宏毅机器学习(含深度学习)
开源贡献:王茂霖、陈安东、刘峥嵘、李玲、吕豪杰、苗圃、宋昊阳、孙子涵
内容说明:辅助大家更好学习李宏毅老师机器学习视频,并加入相关补充资料,帮助你对机器学习有更加深刻的理解。
学习周期:14天
定位人群:深度学习初学者,有微积分,线性代数基础
学习名额:100人
任务节选
Task04:深度学习介绍和反向传播机制(2天)
了解深度学习的基础知识
熟悉反向传播机制
3 /深入浅出PyTorch
开源贡献:李嘉骐、牛志康、刘洋、陈安东、陈玉立、刘兴、郭棉昇、乔彬、邝俊伟
内容说明:PyTorch理论与实践结合,由基础知识到项目实战。详细介绍点这里
学习周期:14天
定位人群:具备高数、线代、概率论基础,有一定的机器学习和深度学习基础,熟悉常见概念,会使用Python。
学习名额:100人
任务节选
Task01:PyTorch的安装和基础知识(2天)
4 /使用PyTorch复现推荐模型
开源贡献:赖敏材、罗如意、吴忠强、汪志鸿、唐鑫、王宇宸、何世福、李拙、王炜良、于宙鑫、王凯、任鹏飞
内容说明:本课程旨在帮助学员掌握torch-rechub框架的设计与使用,掌握深度推荐系统中的排序、召回、多任务模型的设计思想与实战技巧。
学习周期:15天
定位人群:有一定的Pytorch基础,熟悉深度学习,了解推荐系统基本算法,想进一步熟悉业界应用较广泛的深度推荐模型。
学习名额:100人
任务节选
Task01:了解Torch-RecHub框架设计与使用方法(2天)
5 /零基础入门数据挖掘赛事
开源贡献:鱼佬、阿水、田瑶、吴纪洋、张福胜
内容说明:零基础入门数据挖掘赛事,熟练赛事操作流程、学习处理非结构化数据、巩固已学机器学习算法知识。
学习周期:10天
定位人群:具备有一定的Python基础,了解基础的机器学习算法,想要实践学习的入门者。
学习名额:180人
任务节选
Task01:赛事全流程实践(4天)
报名赛事实践并下载数据集;
理解实践场景,梳理解题思路;
按照给定的基线解决方案跑通代码;
提交相应的结果文件。
6 / SQL编程语言
开源贡献:王复振、杨煜、闫钟峰、杨梦迪、苏鹏、刘琳、张翔宇、杨世超、牧童
内容说明:Follow me,从 0 到 1 掌握 SQL。了解SQL基本特点,熟悉基本操作,掌握视图等高阶用法,最后秋招秘籍检验学习效果。详解介绍点这里
组队学习周期:16天
定位人群:0基础学员,希望掌握SQL基础查询的同学
学习名额:80人
任务节选
Task04 集合运算(3天)
表的加减法
连结(JOIN)
7 / 数据可视化(Matplotlib)
开源贡献:杨剑砺、杨煜、耿远昊、李运佳、居凤霞、刘元朋、袁一涵、徐韵婉
内容说明:系统梳理了python最重要的数据可视化包的方方面面,并配有练习题供学习者核查学习效果。详细介绍点这里
组队学习周期:14天
定位人群:希望通过系统学习matplotlib包来提高python可视化技能的人。
学习名额:100人
任务节选
Task02:艺术画笔见乾坤(5天)
作为整个matplotlib宇宙中最重要的一个环节,重点介绍了matplotlib绘图的核心API,以及使用matplotlib绘制基本元素的方法
8 / 动手学数据分析
开源贡献:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、周辉池、崔腾松、于鸿飞
内容说明:以项目为主线,通过边学,边做以及边被引导的方式,既掌握知识点又能掌握数据分析的大致思路和流程。详细介绍点这里
组队学习周期:11天
定位人群:懂一些python,希望入门数据分析的学习者。
学习名额:100人
任务节选
Task01:数据加载及探索性数据分析(2天)
了解数据加载以及数据观察
掌握pandas基础
完成探索性数据分析
9 / C++语言与基础算法
开源贡献:伯禹团队、上海交大ACM班同学、左凯文、聂耀、陈煜昂、谷国伟、高岩、赵文一
内容说明:课程从 C++ 核心语法到程序运行原理进行全方位讲解。并以C++讲解高精度运算、经典排序与搜索、二分查找应用、动态规划与背包问题等基本内容和实现思想。
学习周期:22天
定位人群:零基础希望学习C++的同学。
学习名额:100人
任务节选
Task02:模拟算法、高精度运算、枚举算法、排序算法、二分查找及应用、递归与递推、动态规划等算法及其C++实现。(12天)
10 / GitModel数学建模
开源贡献:李祖贤、刘斯豪、郑伯斌、六一、何清旋、邱广坤
内容说明:讲解数学建模所用到最基本的数学工具——高数、线代、概率统计,并且讲解如何使用Python编程语言进行实现,跨越理论到实践的鸿沟。
学习周期:14天
定位人群:
想要入门数学建模但不知道从何学起的非数学专业的同学;
数学专业出身懂得理论知识,但不知如何实现的同学。
学习名额:100人
任务节选
Task01:动手学高等数学️[Sympy、Scipy、Matplotlib](3天)
11 / 青少年编程:Python语言
开源贡献:王思齐、马燕鹏
内容说明:跟着春雷老师,看视频学习Python编程的基本知识。
学习周期:21天
定位人群:对Python编程感兴趣的小朋友(10~18岁)。
学习名额:100人
任务节选
Task01:第一阶段功法(6天)
打印你的数据
输入功能input
神奇的运算符
比较运算符
阶段复习
时间:6月11日(周六)中午11:30
方式:在Datawhale高校群/在职群发布报名码,扫码报名后学习
关注公众号,后台回复关键词“在校”或“在职”进群;已在则无需重复加入。
由于组织学习非盈利,精力有限,未报名成功可以根据开源教程自行安排学习。
提前名额:在朋友圈分享本篇学习文章获20个赞,发送截图到后台,审核后可获得优先学习名额。
开源地址
为难度系数
1. 吃瓜教程——西瓜书+南瓜书
开源地址:https://github.com/datawhalechina/pumpkin-book
B 站视频教程:https://www.bilibili.com/video/BV1Mh411e7VU
2. 李宏毅机器学习(含深度学习)
开源地址:https://github.com/datawhalechina/leeml-notes
配套课程视频:https://www.bilibili.com/video/BV1Ht411g7Ef
2021李宏毅授权课程视频:https://www.bilibili.com/video/BV1JA411c7VT
3. 深入浅出PyTorch
开源地址:https://github.com/datawhalechina/thorough-pytorch
B站视频:https://www.bilibili.com/video/BV1L44y1472Z
4.使用PyTorch复现推荐模型
开源地址:https://github.com/datawhalechina/torch-rechub
5.数据挖掘竞赛实践
开源地址:https://coggle.club/?platform=xfyun
6. SQL编程语言
开源地址 :https://github.com/datawhalechina/wonderful-sql
7. 数据可视化(Matplotlib)
开源地址:https://github.com/datawhalechina/fantastic-matplotlib
8. 动手学数据分析
开源地址:https://github.com/datawhalechina/hands-on-data-analysis
B站视频:https://www.bilibili.com/video/BV1Uv411p77r
9. C++语言与基础算法
开源地址:https://www.qingzhouzhixue.com/
10.GitModel数学建模
开源地址:https://github.com/Git-Model/__init_Modeling__
11. 青少年编程:Python语言
开源地址:https://github.com/datawhalechina/team-learning-program/tree/master/ChildrenProgramming
B站视频:https://space.bilibili.com/90353310/
一键三连,一起学习️
文章浏览阅读1.3w次。转载自 http://www.miui.com/thread-2003672-1-1.html 当手机在刷错包或者误修改删除系统文件后会出现无法开机或者是移动定制(联通合约机)版想刷标准版,这时就会用到线刷,首先就是安装线刷驱动。 在XP和win7上线刷是比较方便的,用那个驱动自动安装版,直接就可以安装好,完成线刷。不过现在也有好多机友换成了win8/8.1系统,再使用这个_mt65驱动
文章浏览阅读1k次。SonarQube是一个代码质量管理平台,可以扫描监测代码并给出质量评价及修改建议,通过插件机制支持25+中开发语言,可以很容易与gradle\maven\jenkins等工具进行集成,是非常流行的代码质量管控平台。通CheckStyle、findbugs等工具定位不同,SonarQube定位于平台,有完善的管理机制及强大的管理页面,并通过插件支持checkstyle及findbugs等既有的流..._sonar的客户端区别
文章浏览阅读3.4k次,点赞2次,收藏27次。神经图灵机是LSTM、GRU的改进版本,本质上依然包含一个外部记忆结构、可对记忆进行读写操作,主要针对读写操作进行了改进,或者说提出了一种新的读写操作思路。神经图灵机之所以叫这个名字是因为它通过深度学习模型模拟了图灵机,但是我觉得如果先去介绍图灵机的概念,就会搞得很混乱,所以这里主要从神经图灵机改进了LSTM的哪些方面入手进行讲解,同时,由于模型的结构比较复杂,为了让思路更清晰,这次也会分开几..._神经图灵机方法改进
文章浏览阅读2.8k次。一、模型迭代方法机器学习模型在实际应用的场景,通常要根据新增的数据下进行模型的迭代,常见的模型迭代方法有以下几种:1、全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的模型。优缺点:这也是实际最为常见的模型迭代方式,通常模型效果也是最好的,但这样模型迭代比较耗时,资源耗费比较多,实时性较差,特别是在大数据场景更为困难;2、模型融合的方法,将旧模..._模型迭代
文章浏览阅读2.3k次。1、前言上传图片一般采用异步上传的方式,但是异步上传带来不好的地方,就如果图片有改变或者删除,图片服务器端就会造成浪费。所以有时候就会和参数同步提交。笔者喜欢base64图片一起上传,但是图片过多时就会出现数据丢失等异常。因为tomcat的post请求默认是2M的长度限制。2、解决办法有两种:① 修改tomcat的servel.xml的配置文件,设置 maxPostSize=..._base64可以装换zip吗
文章浏览阅读1k次,点赞17次,收藏22次。Opencv自然场景文本识别系统(源码&教程)_opencv自然场景实时识别文字
文章浏览阅读1.3k次。拷贝虚拟机文件时间比较长,因为虚拟机 flat 文件很大,所以要等。脚本完成后,以复制虚拟机文件夹。将以下脚本内容写入文件。_exsi6.7快速克隆centos
文章浏览阅读2k次。本文主要实现基于二度好友的推荐。数学公式参考于:http://blog.csdn.net/qq_14950717/article/details/52197565测试数据为自己随手画的关系图把图片整理成文本信息如下:a b c d e f yb c a f gc a b dd c a e h q re f h d af e a b gg h f bh e g i di j m n ..._本关任务:使用 spark core 知识完成 " 好友推荐 " 的程序。
文章浏览阅读367次。南京大学高级程序设计期末复习总结,c++面向对象编程_南京大学高级程序设计
文章浏览阅读3.1k次,点赞2次,收藏12次。实现朴素贝叶斯分类器,并且根据李航《统计机器学习》第四章提供的数据训练与测试,结果与书中一致分别实现了朴素贝叶斯以及带有laplace平滑的朴素贝叶斯%书中例题实现朴素贝叶斯%特征1的取值集合A1=[1;2;3];%特征2的取值集合A2=[4;5;6];%S M LAValues={A1;A2};%Y的取值集合YValue=[-1;1];%数据集和T=[ 1,4,-1;..._朴素贝叶斯 matlab训练和测试输出
文章浏览阅读1.6k次。Markdown 文本换行_markdowntext 换行
文章浏览阅读6.7w次,点赞2次,收藏37次。win10 2016长期服务版激活错误解决方法:打开“注册表编辑器”;(Windows + R然后输入Regedit)修改SkipRearm的值为1:(在HKEY_LOCAL_MACHINE–》SOFTWARE–》Microsoft–》Windows NT–》CurrentVersion–》SoftwareProtectionPlatform里面,将SkipRearm的值修改为1)重..._错误: 0xc0000022 在运行 microsoft windows 非核心版本的计算机上,运行“slui.ex