本站域名luhui.net,三秒钟就能记住哦

图片搜索是通过搜索程序,向用户提供互联网上相关的图片资料的服务。图片搜索的目的是查找出自己所需要的特定图片。

基本信息

 
  • 查找

    出自己所需要的特定图片

  • 比如

    百度GOOGLE

 
 

基于原理

对类型1,通常是通过Alt等锚来索引图片搜索图片搜索 ,搜索的,您可以访问搜索引擎,比如百度、GOOGLE。在搜索框内输入搜索文字,点击右侧的"图片搜索"按纽,即可获得相关图片搜索结果。《浅谈图片搜索引擎的实现》中提出了跨越性的图片搜索的实现,具有很高的参考价值。

对类型2,涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。由于我们需要处理相似图片的识别,这里主要介绍图像视觉特征的提取和表达。

视觉特征又可分为通用的视觉特征和领域相关(局部/专用)的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括颜色、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。由于领域相关的图像特征主要属于模式识别的研究范围,并涉及许多专业的领域知识,在此我们就不再详述,而只考虑通用的视觉特征。

对于某个特定的图像特征,通常又有多种不同的表达方法。由于人们主观认识上的千差万别,对于某个特征并不存在一个所谓的最佳的表达方式。事实上,图像特征的不同表达方式从各个不同的角度刻画了该特征的某些性质。

技术分类

分类

从所使用的技术上来分类,可分为:

1 、基于上下文本(context)的图片搜索;

2、 基于图片内容的搜索。

应用

搜索引擎

即输入图片搜索网页,如今国内的图片搜索图片网站有 安图搜,该网站主要应用于网络购物搜索比价购物。使用图片在该网站上进行搜索,就可以找到全网同款商品。

视频搜索

基于图片的视频搜索,俗称"按图找片",类似于Google Images或者百度的图片搜索,属于Image Searching中的一个细分种类。它实现的功能是:根据上传图片找到相关的内容,只是按图找片算法会根据图片的内容找到对应的影视剧或者相关视频,甚至精确到影视剧中的固定时间点。

按图找片功能是由快播播放器首先开发并推出,用户只需将图片下载到本地并拖入到快播播放器,或者直接把图片从浏览器拖入到快播播放器,就可以实现按图找片并在点击开始后播放。

可以在美女瀑布流网站图丽网上找到较多的满足要求的图片,直接拖入快播播放器,都能直接找到影片并实现播放。

面临问题

1. 尺度变化:尺度变化可以有多种形式,包括图像的放大、缩小以及长宽比的改变等等。在网络上,常见的变化是将原来较大的图像变换为相对尺寸较小的图像,以减少存储空间需求和加快网络传输速度。

2. 颜色变化:在许多情况下,彩色图像会被转化为对应的灰度图像,而灰度图像也可能被转化为彩色图像。对于空间遥感图像等,由于原始图像的阅读比较困难,人们往往将图像人为加上不同的颜色以区分图像中的各种区域。

3. 存储格式引起的失真:图像本身有着巨大的数据量,如今人们在存储图像时一般会使用各种不同的压缩算法。常用的算法如JPEG、GIF、PNG等等。为了实现比较高的压缩性能,这些算法绝大多数都是有损压缩,即压缩后的图像不能无失真地进行恢复。所以,当图像在不同格式之间进行转化时,转化前后的图像之间总会存在一定差异。由于这些差异的存在,直接比较两幅图像以判断其是否重复的方法是不可行的。

4. 数字水印:许多艺术图像等具有一定的知识版权,而网络则很容易造成非授权图像的流传。所以,如今人们往往采用数字水印(watermarking)方法在不影响图像视觉效果的情况向图像中注入一定的隐藏信息。

技术革新

谷歌的图片搜索工具如今添加专门搜索动画gif图像功能。新调整将有助于更方便地搜索gif动图,只需点击下拉索索工具选项中的"animated"(动画)框。谷歌称,此外,还添加了一个"透明"单选框,它是指具有空背景的动画图像。

手机软件

软件简介

图片搜索是一个非常实用的搜索网页图片的应用程序,它还可以把你喜爱的图片网站更新到四个动态瓷砖上面。

特点:

- 把您最喜爱的网站图像可创建4个动态瓷砖,从您最喜爱的网站每隔半小时左右会自动更新最新图片。

- 使用Bing搜索图片。

幻灯片播放搜索图像结果。

- 共享或保存图像。

要求

系统要求: wp7.0、wp7.8、wp8.0

图像检索,又称图像检索 ,系统是一个电脑浏览的系统,从一个大型的数字图像数据库去检索和检索图像。大多传统和一般图像检索的方式是利用一些增加元数据(metadata)的方法,例如:字幕、关键词或是图像的说明,如此一来就可以透过注解词完成检索。人工的图像注解是费时、费力并且昂贵;为了解决这个问题,已经有大量的研究在做自动图像注解方面上。此外,越来越多的社会网络应用和语义网已经产生了数个以网络为基底发展的图像注解工具。

第一个以微电脑为基底开发的图像数据库检索系统,是由80年代麻省理工学院里的Banireddy Prasad、Amar Gupta (页面存档备份,存于互联网档案馆)、Hoo-min Toong、and Stuart Madnick所共开发出来的。这是记载于1987年2月发行的IEEE Transactions on Industrial Electronics。[1] .

另一种方法的图像检索是以内容为基底的图像检索CBIR,其目的是为了避免使用文字上的描述而是以视觉相似性为基底透过用户提供查询的图像或是用户指定的图像特征来检索图像。

技术分类[编辑]

1、基于上下文本的图片搜索;

2、基于图片内容的搜索。

评价[编辑]

有一些对于图像检索系统的工作评估回报(evaluation workshops),目的是为了研究和改善这类系统的成果。

参考文献[编辑]

  1. ^ Prasad, B E; A Gupta; H-M Toong; S E Madnick. A microcomputer-based image database management system.. IEEE Transactions on Industrial Electronics. 1987, IE–34 (1): 83–8."Abstract Of Article" (页面存档备份,存于互联网档案馆),URL retrieved on March 13, 2007.

外部链接[编辑]

心智图(英语:Mind Map),又称脑图心智地图脑力激荡图思维导图灵感触发图概念地图、或思维地图,是一种图像式思维的工具以及一种利用图像式思考辅助工具来表达思维的工具。

心智图是使用一个中央关键词或想法引起形象化的构造和分类的想法;它用一个中央关键词或想法以辐射线形连接所有的代表字词、想法、任务或其它关联项目的图解方式。它可以利用不同的方式去表现们的想法,如引题式,可见形象化式,建构系统式和分类式。它普遍地用作在研究、组织、解决问题和政策制定中。

心智图是一张集中了所有关连资讯的语义网路或认知体系图像。所有关连资讯都是被辐射线形及非线性图解方式接连在一起,以脑力激荡法为本去创建一个适当或相关的概念性组织任务框架。但脑力激荡法并非以制式的方式去互相连接语义网路或认知体系,亦即是可以自由相连接使用的。元素是直觉地以概念的重要性而被安排及组织入分组、分支,或区域中。会集知识方法能够支持现有的记忆,去思考语义的结构资讯。

历史[编辑]

心智图是由英国的托尼·博赞托尼·布詹)于1970年代提出的一种辅助思考工具。心智图通过在平面上的一个主题出发画出相关系的对象,像一个心脏及其周边的血管图,故称为“心智图”。由于这种表现方式比单纯的文本更加接近人思考时的空间性想像,所以越来越为大家用于创造性思维过程中。

语义的网状结构,因一个了解人类学习的理论在1950年代后期发展起来,并且在1960年代早期由阿伦·M·科林斯(Allan M. Collins)和M·罗斯·奎廉(M. Ross Quillian)发展成心智图。由于Collins的贡献和公开研究(在学术、创造力和生动的思考上的成果),他则被认为是心智图模型之父。

心智图(或者是相似概念)被教育学家、工程师、心理学家和其他学家使用在学习、头脑风暴、记忆、视觉记忆和解决问题已经有几世纪。而在上世纪这位有名的思想家托尼·博赞宣称发明心智图模型。他说他的想法来自阿尔佛雷德·科齐布司基普通语义学。他发展一些早期心智图的例子,并且生动地将亚里斯多德的概念显现出来。哲学家拉曼·鲁尔(Ramon Llull)也同样使用这些心智图。

心智图延伸向许多不同形式发展,同时也在包括学习、脑力激荡、教育、文档规划在创意、记录笔记和工程图表等场合中广为应用。心智图软件工具很多种,例如:Mindjet公司的Mindjet是专业的心智图工具,XMind.net公司的XMind有跨平台开源码版和商业专业版及分享网站提供、及微软的Visio 2002及以上版本提供了部分绘制心智图的功能。

学习上的效用[编辑]

Buzan[1]宣称心智图是一个深奥优秀的笔记方法,因为心智图不会导致像其他笔记方式的“半睡眠”(semi-hypnotic trance)状态。Buzan也主张心智图全方位利用左右脑的大脑皮质技术,平衡大脑,开发99%断言尚未使用的智力潜能以及直觉(Buzan称之为“超级逻辑”)。然而,学术研究表示这样的主张实际上可能是基于对大脑大脑半球误解的销售宣传。评论家主张“脑半球侧化理论”(hemispheric specialization theory)在心智图制作应用时,已经被界定为伪科学[2]

Farrand、Hussain、和Henney在2002年的学术研究中发现,心智图的技术虽然有限,但在对照其他大学生所喜好的读书、笔记方式下,发现心智图的使用对大学生在记忆上,有着显著的影响;在一个礼拜之后发现,运用心智图的学生上在技巧上有了更健全的改善,而使用其他读书、笔记方式的受试者,在采用过去所习惯的笔记动机上,有明显的减少。

然而Farrand以及其他学者表示,即使如此,但学习者却倾向使用其他学习方法学习,其原因为使用心智图是一种手段。[3]也正因此,心智图在“记忆增强”技术的地位上并未得到依赖。

不过在Pressley,VanEtten,Yokoi,Freebern,和VanMeter1998年的研究发现,关于更好的学习方面,学习者着重学习材料的内容更胜于担忧任何一个特殊的笔记方式。[4]

商标[编辑]

“MindMaps”的商标在英国[5]以及美国[6]被Buzan有限公司使用,该商标并没有在加拿大智能财产局[7]有过纪录。在美国,“MindMaps”被标记为“服务商标”─“教育服务,即在课程中的自我充实”。

心智图示例[编辑]

手绘心智图示例[编辑]

手绘心智图示例由托尼·布詹所发表的作品《蜂的技巧》,为极标准的传统作图技法,着重于自然感官的发挥,形成生动有机性的图形[8]

数字心智图示例[编辑]

数字心智图示例由开放原码软件XMind所制作的作品《XMind!》,其中部分的格式及功能不同于传统型式,且着重于数字化信息的运用,使用电脑软件制作心智图操作容易快速,可以结合各式电脑工具的搭配或用于智识系统的集成。大多数的心智图法工具软件皆有类似的型式及功能[9]

软件工具[编辑]

心智图制作软件(List of mind mapping software)是运行在电脑上的思维导图软件。这些软件支持类似于手绘思维导图的枝形图效果以及可以使用枝形图链接来组织文件,梳理思路。

参考文献[编辑]

引用[编辑]

  1. ^ Buzan, Tony.(2000). The Mind Map BookPenguin Books, 1996. ISBN 978-0-452-27322-1
  2. ^ Williams (2000)Encyclopedia of Pseudoscience. Facts on file. ISBN 978-0-8160-3351-5
  3. ^ Farrand, P.; Hussain, F.; Hennessy, E. The efficacy of the mind map study technique. Medical Education. 2002, 36 (5): 426–431[2005-05-05]doi:10.1046/j.1365-2923.2002.01205.x. [永久失效链接]
  4. ^ Pressley, M., VanEtten, S., Yokoi, L., Freebern, G., & VanMeter, P.(1998). "The metacognition of college studentship: A grounded theory approach". In: D. J. Hacker, J. Dunlosky, & A. C. Graesser(Eds.), Metacognition in Theory and Practice(pp. 347-367). Mahwah NJ: Erlbaum ISBN 978-0-8058-2481-0
  5. ^ Trade Mark 1424476 (页面存档备份,存于互联网档案馆), UK Intellectual Property Office, filed Nov. 1990
  6. ^ US TrademarkUSPTO Trademark Application and Registration Retrieval system
  7. ^ Canadian Intellectual Property Office
  8. ^ Bee Skills Mind Map (页面存档备份,存于互联网档案馆) .Mind Map Art
  9. ^ XMind: The Most Professional Mind Mapping Software.[2011-09-23]. (原始内容存档于2011-12-23).

来源[编辑]

计算机视觉(Computer vision)是一门研究如何使机器“”的科学,更进一步的说,就是指用摄影机计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像[1]

作为一门科学学科,计算机视觉研究相关的理论和技术,试图创建能够从图像或者多维数据中获取“信息”的人工智能系统。这里所指的信息指香农定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

作为一个工程学科,计算机视觉寻求基于相关理论与模型来创建计算机视觉系统。这类系统的组成部分包括:

  1. 过程控制(例如工业机器人无人驾驶汽车
  2. 事件监测(例如图像监测
  3. 信息组织(例如图像数据库和图像序列的索引创建)
  4. 物体与环境建模(例如工业检查,医学图像分析和拓扑建模)
  5. 交感互动(例如人机互动的输入设备)

计算机视觉同样可以被看作是生物视觉的一个补充。在生物视觉领域中,人类和各种动物的视觉都得到了研究,从而创建了这些视觉系统感知信息过程中所使用的物理模型。另一方面,在计算机视觉中,靠软件和硬件实现的人工智能系统得到了研究与描述。生物视觉与计算机视觉进行的学科间交流为彼此都带来了巨大价值。

计算机视觉包含如下一些分支:画面重建,事件监测,目标跟踪,目标识别,机器学习,索引创建,图像恢复等。

计算机视觉的发展现状[编辑]

计算机视觉与其他领域的关系

计算机视觉领域的突出特点是其多样性与不完善性。

这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。

尽管如此,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、文字等),因而无法被广泛地应用于不同场合。

对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。

人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。

物理是与计算机视觉有着重要联系的另一领域。

计算机视觉关注的目标在于充分理解电磁波——主要是可见光红外线部分——遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理固态物理,一些尖端的图像传感器甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展。

另一个具有重要意义的领域是神经生物学,尤其是其中生物视觉系统的部分。

在整个20世纪中,人类对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域——人们试图创建人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。

计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其对是时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。

除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学最优化理论以及几何学

如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。

相邻领域的异同[编辑]

计算机视觉图像处理图像分析机器人视觉机器视觉是彼此紧密关联的学科。如果你翻开带有上面这些名字的教材,你会发现在技术和应用领域上他们都有着相当大部分的重叠。这表明这些学科的基础理论大致是相同的,甚至让人怀疑他们是同一学科被冠以不同的名称。

然而,各研究机构,学术期刊,会议及公司往往把自己特别的归为其中某一个领域,于是各种各样的用来区分这些学科的特征便被提了出来。下面将给出一种区分方法,尽管并不能说这一区分方法完全准确。

计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。

图像处理图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。

机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。

模式识别使用各种方法从信号中提取信息,主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。

还有一个领域被称为成像技术。这一领域最初的研究内容主要是制作图像,但有时也涉及到图像分析和处理。例如,医学成像就包含大量的医学领域的图像分析。

对于所有这些领域,一个可能的过程是你在计算机视觉的实验室工作,工作中从事着图象处理,最终解决了机器视觉领域的问题,然后把自己的成果发表在了模式识别的会议上。

计算机视觉的经典问题[编辑]

几乎在每个计算机视觉技术的具体应用都要解决一系列相同的问题。这些经典的问题包括:

识别[编辑]

一个计算机视觉,图像处理和机器视觉所共有的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。

广义的识别在不同的场合又演化成了几个略有差异的概念:

识别的几个具体应用方向:

运动[编辑]

基于序列图像的对物体运动的监测包含多种类型,诸如:

场景重建[编辑]

给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景创建一个三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会创建起完整的三维表面模型。

图像恢复[编辑]

图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等

计算机视觉系统[编辑]

计算机视觉系统的结构形式很大程度上依赖于其具体应用方向。有些是独立工作的,用于解决具体的测量或检测问题;也有些作为某个大型复杂系统的组成部分出现,比如和机械控制系统,数据库系统,人机接口设备协同工作。计算机视觉系统的具体实现方法同时也由其功能决定——是预先固定的抑或是在运行过程中自动学习调整。尽管如此,有些功能却几乎是每个计算机系统都需要具备的:

更复杂的特征可能与图像中的纹理形状或运动有关。

影响视觉系统的要件[编辑]

参考文献[编辑]

  1. ^ 黄亚勤。基于视线跟踪技术的眼控鼠标研究与实现[D].西华大学, 2011.

外部链接[编辑]