• 用(yòng)卓越的智能(néng)视觉算法赋能(néng)商(shāng)业
    用(yòng)卓越的智能(néng)视觉算法赋能(néng)商(shāng)业 基于正觉智能(néng)自主研发的AI视频图像分(fēn)析算法,提供软硬一體(tǐ)交付形态,為(wèi)园區(qū)、楼宇、學(xué)校、社區(qū)、工厂等场景提供基于AI识别模型的智能(néng)服務(wù)
    查看详情

行业前瞻

资讯分(fēn)类

计算机如何看世界?如何看懂世界?计算机视觉基础原理(lǐ) 

  • 分(fēn)类:行业前瞻
  • 作者:
  • 来源:
  • 发布时间:2022-09-21
  • 访问量:0

【概要描述】计算机视觉是一门研究如何让机器“看见”的科(kē)學(xué)。进一步说,是指用(yòng)摄像机和计算机代替人眼对物(wù)體(tǐ)进行识别、跟踪和测量,并进一步做图形处理(lǐ),然后用(yòng)计算机处理(lǐ)出更适合人眼观察的图像或传输到仪器上进行检测。

计算机如何看世界?如何看懂世界?计算机视觉基础原理(lǐ) 

【概要描述】计算机视觉是一门研究如何让机器“看见”的科(kē)學(xué)。进一步说,是指用(yòng)摄像机和计算机代替人眼对物(wù)體(tǐ)进行识别、跟踪和测量,并进一步做图形处理(lǐ),然后用(yòng)计算机处理(lǐ)出更适合人眼观察的图像或传输到仪器上进行检测。

  • 分(fēn)类:行业前瞻
  • 作者:
  • 来源:
  • 发布时间:2022-09-21
  • 访问量:0
详情

计算机如何看世界?如何看懂世界?  

 

 

 

  • 人工智能(néng)是来模拟人类认知能(néng)力的技术。人工智能(néng)最核心的能(néng)力就是根据给定的输入,做出判断和预测。例如:在人脸识别应用(yòng)中,它是根据输入的照片判断照片中的人是谁。

 

  • 计算机视觉是一门研究如何让机器“看见”的科(kē)學(xué)。进一步说,是指用(yòng)摄像机和计算机代替人眼对物(wù)體(tǐ)进行识别、跟踪和测量,并进一步做图形处理(lǐ),然后用(yòng)计算机处理(lǐ)出更适合人眼观察的图像或传输到仪器上进行检测。

 

  • 计算机视觉作為(wèi)一门科(kē)學(xué)學(xué)科(kē),研究相关的理(lǐ)论和技术,试图建立一个能(néng)够从图像或多(duō)维数据中获取‘信息’的人工智能(néng)系统,这里的信息指的是香农定义的信息,可(kě)以用(yòng)来帮助做“决策”。因為(wèi)感知可(kě)以看作是从感官信号中提取信息,所以计算机视觉也可(kě)以看作是研究如何让人工系统从图像或多(duō)维数据中“感知”的科(kē)學(xué)。

 

 

 

 

 

 


在技术分(fēn)类上,依据应用(yòng)场景一般分(fēn)类為(wèi)工业视觉和计算机视觉

 

 

 

 

 

 

在应用(yòng)分(fēn)类上,分(fēn)為(wèi)工业检测类以及肉眼可(kě)见类型检测

 

 
工业检测类:瑕疵检测、高精度尺寸检测、产品外观检测、工器具外观检测、工艺检测(印花(huā)、喷涂等),替代人眼检查
 
肉眼可(kě)见类检测:动作检测、物(wù)品检测、颜色检测、流程检测、車(chē)辆检测、人脸检测,基本為(wèi)人眼可(kě)见的形态,主要為(wèi)减轻人员大量检查的摄像头的时间
 
 
 
 
人的视觉,我们是怎么看懂事物(wù)的?
 
 
 
视网膜是含有(yǒu)光感受器官和神经阻滞网络的薄膜,光刺激在视网膜上经神经处理(lǐ)产生的神经冲动沿视神经纤维传出眼睛,通过视觉神经传出大脑皮层进行处理(lǐ)并最终引起知觉,或者说在大脑中刺激对光刺激产生影响,形成关于场景的表象,大脑皮层要完成一系列处理(lǐ)工作,从图像存储直到根据图像做出响应。
 
 
 
 

STEP1 看见事物(wù)

光刺激视网膜接收,并通过视网膜传导。

 

 

STEP2 大脑处理(lǐ)

1. 参考存储的图像(素材)

2. 特征提取:例如形状、颜色、位置、物(wù)理(lǐ)法则、联想

3. 判断确认

 

 

STEP3 进行描述

根据目标的特征、物(wù)理(lǐ)逻辑、联想等手段确认唯一的答(dá)案后,进行描述。

 

 

 

 
 
 
 
计算机的视觉,计算机是怎么看懂事物(wù)的?
 
 
在计算机视觉种主要研究的三维场景中的对象,包括人、物(wù)、环境三大块,针对三维场景中的三维信息(几何、表现、行為(wèi))处理(lǐ)。
 
 

STEP1  看见事物(wù)

通过数字摄像头拍摄物(wù)體(tǐ)获得物(wù)品得图像数据。

 

 

STEP2 模型处理(lǐ)
 

1. 多(duō)层次特征提取:例如形状、颜色、位置等

2. 分(fēn)类

3. 压缩

4. 关联

 

 

STEP4 给出结果

根据目标的特征、物(wù)理(lǐ)逻辑等技术方式确认出多(duō)个答(dá)案,选取其中置信度较高的进行描述。

 

 

  

 

 

 肉眼能(néng)分(fēn)清的不代表计算机可(kě)以识别

 

 

 

 

人类在判断一件物(wù)品或者行為(wèi)时的时候是基于多(duō)年积累的经验,并且带有(yǒu)横向的联想,例如判断是不是足球,你会联想到國(guó)足踢过。计算机做出的判断只能(néng)根据特征,还是人為(wèi)规定好的特征,当超出规定范围的特征出现时,就无法识别了。 通过以上说明,我们会了解人的感知过程和计算机的识别有(yǒu)一定逻辑雷同,但也存在事实上的差异,人眼中看到的简单事物(wù)也许对于计算机来说是漫長(cháng)复杂的判断过程与计算公式,这是因為(wèi)计算机描述画面的过程与人类有(yǒu)差异。在采集素材的过程中,真实的环境对识别结果也会产生较大影响,特别是光線(xiàn)环境的变化,體(tǐ)现在户外、室内的应用(yòng)都会导致准确率上的差异。

 

关键词:

扫二维码用(yòng)手机看

地址:上海市徐汇區(qū)浦北路7号中星城1910号

電(diàn)话:4000-594188

版权所有(yǒu) © 2021 上海可(kě)深信息科(kē)技有(yǒu)限公司