Python机器学习第一章

时间:2023-01-04 09:31:50
1. 机器学习 (Machine Learning, ML)
     
     1.1 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
 
     1.2 学科定位:人工智能(Artificial Intelligence, AI)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
     
     1.3 定义:探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。
          
         Arthur Samuel (1959): 一门不需要通过外部程序指示而让计算机有能力自我学习的学科
 
         Langley(1996) : “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”
 
         Tom Michell (1997):  “机器学习是对能通过经验自动改进的计算机算法的研究”
 
     1.4: 学习:针对经验E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力
 
              例子: 下棋,语音识别,自动驾驶汽车等
 
2)机器学习的应用:
       语音识别
       自动驾驶
       语言翻译
       计算机视觉
       推荐系统
       无人机
       识别垃圾邮件
3)机器学习的基本概念
  基本术语:
    (1)数据集:由若干记录组成的集合被称作做数据集(data set),记录是关于一个事件或者对象的描述。
    (2)属性(特征):对事物或者对象某一方面的表现或性质的事项,叫做属性(Attribute)。
    (3)属性空间(样本空间、输入空间):在属性上能够取到的范围,叫做属性空间(Attribute value)。
    (4)特征向量:将所有的属性张成一个空间,对于每个对象都能在空间上找到自己的坐标点,由于空间中的每个点对应的一个坐标向量,被称作特征向量(feature vector)。
    (5)维数:一般,如果有D = {X1,X2...Xm}表示M个实例的数据集,而对每一个示例有d个属性,这Xi =(xi1,xi2...xid)是d维样本空间的一个向量,xi属于样本空间(没有超出取值范围)那么成d成为样本xi的维数(dimensionnality)。
    (6)学习(训练):从数据学的模型的过程叫做学习(learning)或者训练(training)。
    (7)训练数据:在学习的过程中使用的数据,叫做训练数据(training data)。
    (8)训练样本:每个数据样本叫做训练样本(training sample)。
    (9)训练集:训练样本组成的集合叫做训练集(training set)。
    (10)标记:对与一组记录的标签叫做标记(label)。
    (11)样例:拥有标记信息的实例,叫做样例(example)。
    (12)标记空间(输出空间):一般,用(xi,yi)表示i个样例,其中yi属于Y是示例xi的标记,Y是所有标记的集合(标记的取值范围),Y被称作标记空间(Label space)。
4)机器学习分类:
  (1)监督学习
    分类和回归:分类有两种:第一种是二分类,通常的标记为两个值,这一种叫做分类,另一种是多值分类,通常标记是连续的值,叫做回归。(提前知道标记)
  (2)无监督学习
    聚类:将训练集中的训练数据分成若干组,每个组被称为一个簇,这些自动形成的簇可能对应一些潜在的概念划分。(提前不知道,数据训练时会形成簇。)
  (3)强化学习
 
 
未完待续...
    
  

Python机器学习第一章的更多相关文章

  1. web前端学习python之第一章_基础语法(二)

    web前端学习python之第一章_基础语法(二) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...

  2. web前端学习python之第一章_基础语法(一)

    web前端学习python之第一章_基础语法(一) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...

  3. [Python笔记][第一章Python基础]

    2016/1/27学习内容 第一章 Python基础 Python内置函数 见Python内置函数.md del命令 显式删除操作,列表中也可以使用. 基本输入输出 input() 读入进来永远是字符 ...

  4. python 教程 第一章、 简介

    第一章. 简介 官方介绍: Python是一种简单易学,功能强大的编程语言,它有高效率的高层数据结构,简单而有效地实现面向对象编程.Python简洁的语法和对动态输入的支持,再加上解释性语言的本质,使 ...

  5. 机器学习第一章——NFL的个人理解

    第一篇博客,想给自己的学习加深记忆.看到书中第一个公式时,本来想直接看证明结果就好,然鹅...作者在备注上写:这里只用到一些非常基础的数学知识,只准备读第一章且有“数学恐惧”的读者可跳过...嘤嘤嘤, ...

  6. python学习 第一章(说不定会有第零章呢)one day

    ------------恢复内容开始------------ 一.啥是python python是吉尔·范罗苏姆于1989年开发的一个新的脚本解释程序,是ABC语言的一种继承. 二.python的特点 ...

  7. Python【第一章】:简介和入门

    ython简介 Python的创始人为Guido van Rossum.1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做为ABC 语言的一种继承.之 ...

  8. 进击的Python【第一章】:Python背景初探与Python基础(一)

    Python背景初探 一.Python起源 Python的创始人为Guido van Rossum.1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做 ...

  9. 《head first python》第一章《初识python》总结

    该章主要介绍了python的安装和列表相关 列表主要用了movies做介绍: 1.列表及嵌套列表:movies=["the hodaliy",1975,"zhangyim ...

随机推荐

  1. [linux] FastDFS访问文件,400 Bad Request

    linux 安装nginx,FastDFS后,启动访问指定文件出错, 文件名称格式化错误. 解决办法: vi /etc/fdfs/mod_fastdfs.conf 将 url_have_group_n ...

  2. Hadoop之TaskInputOutputContext类

    在MapReduce过程中,每一个Job都会被分成若干个task,然后再进行处理.那么Hadoop是怎么将Job分成若干个task,并对其进行跟踪处理的呢?今天我们来看一个*Context类——Tas ...

  3. Mysql-学习笔记(==》事件 十二)

    事件 计划任务(定期定时执行) -- 查看当前mysql数据库是否开启时间功能,默认关闭SHOW VARIABLES LIKE 'event_scheduler'; -- event_schedule ...

  4. PHP结合Linux的cron命令实现定时任务

    PHP死循环 来处理定时任务的效率是很低的.(众多网友评价)大家都建议使用Linux内置的定时任务crontab命令来调用php脚本来实现. PHP定时任务的两种方法:1.web方式调用php网页,但 ...

  5. 部署django - Apache + mod_wsgi + windows

    部署django - Apache + mod_wsgi + windows 1.环境 django 1.6.2 python 3.3 32位 apache 2.4.7 32位 一个可以使用的djan ...

  6. C语言编码风格_集锦_1

    参考原地址: http://www.jb51.net/article/79257.htm <一> 在一个标准的C语言程序中, 最特殊的莫过于main函数了. 函数大体上分为内联函数(C99 ...

  7. CSS学习笔记!

    一.关于图像RGB值和像素值的确定! 腾讯QQ截图软件Ctrl+Alt+A进入截图界面,鼠标变成彩色,便会拾取鼠标当前颜色,再按住Ctrl切换到十六进制格式#******.图像的像素值也在截取框内显示 ...

  8. js 自定义html标签属性

    <input type="text" id="txtBox" displayName="123456" /> 获取自定义属性值: ...

  9. PAT 甲级 1027 Colors in Mars (20 分)

    1027 Colors in Mars (20 分) People in Mars represent the colors in their computers in a similar way a ...

  10. 使用FFMPEG类库分离出多媒体文件中的H&period;264码流

    在使用FFMPEG的类库进行编程的过程中,可以直接输出解复用之后的的视频数据码流.只需要在每次调用av_read_frame()之后将得到的视频的AVPacket存为本地文件即可. 经试验,在分离MP ...