2021年荣获科技型企业称号 咨询热线:
致力于推动人工智能在各行业细分领域的普及和应用 18103867856
< >

图像识别的激动人心的用途已经改变了我们的生活

作者:睿如信息技术 日期:2024-05-28 点击:83
一键分享

图像识别这项技术近来一直受到热捧,我们想看看图像识别软件在当今不同行业中还有哪些有趣甚至非传统的用途。


20240511174126_49835.jpg


医疗保健中的图像识别应用


你知道半夜醒来,睁开眼睛,看到一片漆黑的感觉吗?对一些人来说,这构成了他们一生的感受。


除了盲人或视障人士带来的更明显的限制之外,这些群体还无法使用我们这个时代基本的工具之一:社交媒体。


几年前,Facebook 改变了盲人和视障人士使用和与 Facebook 互动的方式,这一切都归功于图像识别。乍一听,这可能听起来很简单,但对于生活在几乎或完全黑暗环境中的人来说,浏览 Facebook 查看朋友的活动可能需要几个小时,而不是几分钟。


Facebook 结合其人脸识别、图像分类应用程序和自动替代文本技术,不仅可以生成照片所含元素的准确描述,还可以准确识别照片中的人,即使他们没有被标记。


他们由一个无障碍团队为视障人士开发了这项功能,其中包括 Facebook 的一位盲人工程师马特·金 (Matt King)。马特自 20 多岁起就已是法定盲人。


此功能基于建议在照片中标记哪些朋友的相同技术。它是一种机器学习系统,可分析图像中人脸的像素,创建所谓的“模板”,供将来识别人员时参考。


这里还有更多图像识别示例。值得注意的是,广为人知的受益于图像识别技术的领域是放射科。IBM 去年估计,至少 90% 的患者数据都包含图像。这对每天需要评估越来越多图像的放射科医生来说是一个沉重的负担。


虽然许多医学图像对人类放射科医生来说都是坏消息,但对于许多图像识别技术的核心深度学习算法来说却是个好消息。深度学习算法需要数据来学习。数据越多,算法就越好。


今天,我们实际上看到很多案例,深度学习算法和图像分类应用程序的表现优于人类放射科医生,并成为医疗保健的一部分。


另一个图像识别示例是澳大利亚公司 Enlitic,该公司由 Kaggle 前总裁 Jeremy Howard 创立。Enlitic 专注于通过肺部 CT 扫描检测肿瘤并提供早期诊断。在他们的一项内部测试中,得益于图像识别技术,Enlitic 的软件在诊断肺癌恶性肿瘤方面的准确率比一组放射科医生高出 50%。这只是少数几个案例,还有更多的图像分类用例。


图像识别在安防行业中的应用


识别和辨认面部的能力对于安全行业来说是一项非常有用的功能,特别是对于保护私人财产免遭入侵者侵害。


家庭安全系统并不是什么新鲜事。许多房主安装带有运动探测器的系统,并与 24/7 全天候待命的安保公司相连。这类系统的问题在于它们很原始。它们经常会触发误报,因为它们主要依靠运动或热量探测器,而这些方法无法区分忘记密码的房主、在屋内散步的宠物或真正的入侵者。


有了图像识别技术和二维码生成器,家庭安全系统现在可以解决这些问题。它们可以识别和记住家庭成员(无论光线或角度如何),并区分人和宠物。


例如,Netatmo Welcome 具有一项功能,只有当系统检测到未知面孔时才会开始录制视频。可爱的猫头鹰形个人安全设备 Ulo 具有类似的功能,但更进一步。当出现未知面孔时,设备将开始将实时视频传输到您选择的设备。


图像识别也正在被执法部门所接受。在英国,南威尔士警方正在使用面部识别技术来帮助他们扫描大型活动和人群以搜寻嫌疑人。


该系统与警员合作,而不是代替他们。如果系统标记出任何与嫌疑人至少有 59% 相似度的人,则匹配结果会发送给人类警员进行复核,然后再采取行动。图像识别系统的使用大大降低了成本,提高了警队的整体效率。


汽车行业图像识别


自动驾驶汽车虽然尚未普及,但正在朝着这个方向取得重大进展。图像识别在汽车如何在没有驾驶员的情况下顺利行驶方面功不可没。多个摄像头与激光雷达和雷达传感器配合使用,可以检测交通信号灯、读取路标并跟踪其他车辆,同时还可以留意行人和其他障碍物。


无人驾驶汽车的好处很多,而且很强大。无人驾驶汽车可以减少事故数量、提高排放合规性并缓解拥堵。原因是,机器比人类更善于遵守规则,对突然出现的干扰做出反应的速度也更快。


谷歌的自动驾驶项目 Waymo 已经测试和开发自动驾驶汽车近 10 年了。他们甚至在美国亚利桑那州的沙漠中建造了一个小镇,以在不同的生活场景中测试他们的算法。


这种技术飞跃对于自动驾驶汽车来说非常重要,因为与其他行业不同,自动驾驶汽车的容错率很小。算法处理的每一帧图像都需要尽快实时准确分析,因为人类的生命依赖于此。


零售行业图像识别


得益于图像识别技术,您可能再也不需要再购买衣服之前试穿了。


一些知名品牌(如 Topshop 和 Timberland)已使用一种名为“视觉镜”的设备来试穿其系列的所有服装。视觉镜可以安装在商店内,也可以安装在商店外,以吸引顾客进店。


这面镜子其实就是一块大屏幕,上面有多个摄像头,可以检测站在它前面的人的不同身体部位。镜子会选择正确的尺码,你可以转过身来,从各个角度查看衣服穿在身上的效果。你还可以搜索自己喜欢的颜色和款式,让购物体验更加便捷。


某些版本的视觉镜子可以让你拍摄你搭配的服装,将其发送到你的手机,并创建你可以在商店中找到的所有服装的完整清单。


可视镜子使购物变得更加便捷,同时,一家日本公司还创建了一种名为“AI Guardian”的安全系统,旨在杜绝商店偷窃行为。


AI Guardian 背后的技术不仅扫描脸部,还扫描全身,并根据描述商店扒窃者属性的训练数据集识别所谓的可疑行为。


20240511174124_75761.jpg


日本一家商店的测试显示,实施该技术后,商店盗窃率下降了 40%。尽管这项技术尚未普及,但 AI Guardian 和其他类似安全摄像头的创造者表示,这项技术很快就会普及,而且结果的准确性也会越来越完美。

上一条:电子商务中的视觉人工智能和图像识别

下一条:在组织中实施生成式 AI 的 5 个技巧