文件名称:matlab集成c代码-kaggle-ds-ml-survey:2020年Kaggle数据科学和机器学习调查的见解
文件大小:17.51MB
文件格式:ZIP
更新时间:2024-06-10 21:50:45
系统开源
Matlab集成的c代码大型企业的数据科学工具 随着中小型公司规模的扩大,或大型公司(例如我的公司)加入数据潮流,需要某种工具标准化,以确保数据科学家以相同或相似的语言进行交谈和编码。 有什么比数据科学专业人士和未来的数据科学家更好的方法来启发可能的企业工具? 本笔记本旨在使用中的数据来确定大型企业的理想工具。 TL; DR 我们研究了(1)拥有1,000名或更多员工并且拥有20名或更多个人管理数据科学工作负载的公司中的员工以及(2)学生所偏爱的工具。 这是为了捕获(i)大型企业当前正在使用的工具,以及(ii)新员工入职后会熟悉的工具。 根据数据,最佳选择是: 工具种类 热门精选 编程语言 Python,SQL和R 集成开发环境 Jupyter,Visual Studio Code,PyCharm和RStudio 商业情报 Tableau,Power BI和Google Data Studio 数据可视化库 Matplotlib,Seaborn,ggplot2,Plotly 机器学习框架 越多越好; 默认值:适用于Python的Scikit-Learn,适用于R的Caret 大数据产品