Skip to content

Latest commit

 

History

History
121 lines (65 loc) · 9.35 KB

初探人工智能.md

File metadata and controls

121 lines (65 loc) · 9.35 KB

什么是人工智能?

人工智能是通过机器来模拟人类认知能力的技术,它的核心是根据给定的输入来作出判断或预测

传统人工智能方法:逻辑推理、专家系统(基于人工定义的规则来回答问题)等

当代的人工智能普遍通过学习来获得进行预测和判断的能力----机器学习(machine learning)

深度学习的崛起和AI的三次热潮

第一次:1956年达特茅斯会议标志AI诞生

第二次:1986年BP算法出现使得大规模神经网络的训练可能成为AI迎来第二次黄金期

第三次:2006年幸顿提出深度学习,神经网络使得AI性能获得突破性进展

人工智能发展的基石--图灵测试

图灵测试是由英国计算机科学家艾伦图灵在1950年提出测试人工智能的方法。

图灵测试的基本思想:如果一个机器能够模仿人类对话行为,并且人类无法确定它是一个人还是一个机器,那么这个机器就可以被认为是具有人工智能的。

图灵测试通常由一个人类评估者和两个对话者进行对话,一个对话是人类,另外一个对话是机器,如果评估者无法确定那个是机器,那么这个机器就通过了图灵测试

人工智能三大核心要素:数据、算法、算力

数据:人工智能想要变的和人一样聪明就需要有大量的数据作为输入,在这些数据的基础上使用算法进行学习和自我优化,最终能够准确的预测或者处理任务的模型,进而实现人工智能的应用,如果没有足够的数据那么机器就无法学习,也就无法变的智能

算法:当你去让计算机帮你干一个任务的时候,你不但要告诉它做什么,还要告诉它怎么去做,关于怎么去做的一系列指令就叫算法

算法是一组定义了解决问题步骤和操作的指令集合。在人工智能领域,算法是用来处理数据并实现特定任务的数学模型和规则。它们可以帮助机器理解数据的特征、结构和规律,并根据这些信息做出预测或者决策。

算力:算力就好比计算机的大脑,它决定计算机可以处理多快,多复杂的任务,就像我们人类的大脑一样决定了我们的思考和解决问题的能力一样,一台计算机的算力好,那么它就能更好更快的处理复杂的问题,反着就处理慢或无法解决问题。所以,算力是衡量计算机性能强弱的重要指标。提高算力可以让计算机更快、更高效地运行,从而加速人工智能应用的发展。

人工智能关系圈(人工智能包含机器学习包含深度学习)

机器学习:一种实现人工智能的方法

是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

深度学习:一种实现机器学习的技术

是利用深度的神经网络,将模型处理得更为复杂,从而使模型对数据的理解更加深入,是机器学习中一种基于对数据进行表征学习的方法。其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。

人工神经网络:一种机器学习的算法

神经网络一般有输入层->隐藏层->输出层,一般来说隐藏层数量多于两层的神经网络就叫做深度神经网络,深度学习就是采用像深度神经网络这种深层架构的一种机器学习方法。

什么是机器学习?

人类的学习方式:遇到一个问题(输入)-》根据以往经验去搜寻-》预测这个问题结果(输出)

机器的学习方式:输入问题-》去历史数据搜索-》预测给出结果

决策树模型:根据ppt中的一个案例,计算女朋友这次会不会迟到的机率,根据和女朋友以为的约会经验去得出迟到的规律,并得出不同的迟到的概率

机器学习也是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法

什么是神经网络?

人是怎么思考的?生物神经网络:人有感知器,1.外部刺激通过神经末梢,转化为电信号,转导到神经细胞(又叫神经元)2.无数神经元构成神经中枢 3.神经中枢综合各种信号,做出判断 4.人体根据神经中枢的指令,对外部刺激做出反应

机器要怎么思考的?人工神经网络:人造神经元,输入:x1,x2,x3,隐藏层(判断),输出:output

神经网络的逻辑架构:输入,隐藏层,输出

什么是深度学习(Deep Learning)?

深度神经网络&深度学习

传统的神经网络发展到了多隐藏层的情况,具有多个隐藏层的神经网络被称为深度神经网络,基于深度神经网络的机器学

习研究称之为深度学习

人工智能可以做什么?

计算机视觉:

  • 典型技术:人脸检测、追踪、识别和属性分析,行人、车辆的检测、追踪、识别和属性分析,文字检测和识别,物体检测和识别
  • 典型应用:人脸身份认证,智能交通,机器人视觉(如无人机),图像搜索引擎,图像和视频理解,图像和视频美化

语音识别:

  • 典型技术:语音识别、声纹识别、多麦克风阵列系统
  • 典型应用:语音输入,语音控制,智能助手,机器翻译、机器人听觉

自然语言:

  • 典型技术:词句嵌入、语义建模
  • 典型应用:聊天机器人,智能助手,智能客服,视频理解,机器翻译

什么是计算机视觉(Computer Vision)?

几个比较严谨的定义:

  1. 对图像中的客观对象构建明确而有意义的描述”(Ballard&Brown,1982)
  2. 从一个或多个数字图像中计算三维世界的特性”(Trucco&Verri,1998)
  3. “基于感知图像做出对客观对象和场景有用的决策”(Sockman&Shapiro,2001)

总结概括:就是让计算机拥有像人一样,可以看得见,能识别的出东西,能有思考能力,就可以称计算机拥有视觉,既计算机视觉

基于深度学习的计算机视觉

人工智能AI包含机器学习ML包含深度学习DL 而计算机视觉CV 是和这三者一个交集关系

计算机视觉的五大应用

  1. 图像分类:图像分类是指将图像分为不同的类别或标签的过程。这通常涉及到使用机器学习模型来学习如何识别图像中的不同特征,并将图像分类到相应的类别中。图像分类可以用于许多不同的应用,例如图像搜索、图像检索和图像识别等。
  2. 目标检测:目标检测是指在图像中识别和定位特定对象的过程。这通常涉及到使用机器学习模型来学习如何识别图像中的不同特征,并确定图像中是否存在特定对象。目标检测可以用于许多不同的应用,例如自动驾驶、安全监控和图像检索等。
  3. 语义分割:语义分割是指将图像分割为不同的区域,并为每个区域分配一个语义标签的过程。这通常涉及到使用机器学习模型来学习如何识别图像中的不同特征,并将图像分割为不同的区域。语义分割可以用于许多不同的应用,例如图像分析、图像检索和图像识别等。
  4. 实例分割:实例分割是指将图像分割为不同的区域,并为每个区域分配一个实例标签的过程。这通常涉及到使用机器学习模型来学习如何识别图像中的不同特征,并将图像分割为不同的区域。实例分割可以用于许多不同的应用,例如图像分析、图像检索和图像识别等。
  5. 目标跟踪:目标跟踪是指在视频序列中跟踪特定对象的过程。这通常涉及到使用机器学习模型来学习如何识别视频中的不同特征,并确定视频中特定对象的位置。目标跟踪可以用于许多不同的应用,例如自动驾驶、安全监控和视频检索等。

知识点扩展:

算法中的精确性鲁棒性,是评估算法性能的两个重要指标。

精确性指的是算法在解决问题时的准确性和正确性。一个精确的算法能够给出正确的结果或接近于真实值的结果。精确性通常通过与已知标准或者人工标注的数据进行比较来评估。例如,在分类任务中,精确性可以表示为模型对测试样本的正确分类比例。精确性较高的算法意味着它能够有效地解决问题并提供可靠的结果。

鲁棒性则是指算法对于输入数据的扰动、干扰或变化的稳定性和健壮性。一个鲁棒的算法能够在面对无效或者异常数据时仍然保持良好的性能。鲁棒性是评估算法的泛化能力和稳定性的重要标志。在现实场景中,数据往往会包含噪声、缺失或者异常,鲁棒的算法能够更好地处理这些情况,不会轻易受到干扰而导致性能下降。