深度神经网络彻底升级了计算机视觉模型的表现
只要是成熟且完成度较高的技术,慢慢就不会被大家当做智能来看待了。
比如我问身边的老母亲老父亲老阿姨们,手机指纹解锁、手写输入、地图导航、游戏NPC、美颜相机等等是不是人工智能,他们纷纷流露出了质疑的小眼神儿:
这么常见朴素不做作,怎么能是AI呢,最起码也得挑战一下那些看起来不可能完成的任务吧,比如能撒娇的智能客服,360度旋转跳跃闭着眼的机器人,扫一眼就能看病的大白,动不动就血虐人类的智能体什么的。
行……吧……如此看来,最“危险”的要数计算机视觉了。
估计再过不久,人脸识别、看图识物、假脸生成,就要被“开除”出AI的队伍了。
近年来,深度神经网络彻底升级了计算机视觉模型的表现。在很多领域,比如视觉对象的分类、目标检测、图像识别等任务上,深度神经网络(Deep Neural Network,DNN)完成的比人类还要出色,相关技术解决方案也开始频繁出现在普通人的生活细节之中。
这就够了嘛?并没有!视觉模型表示自己除了在图像任务里很好用,非图像任务也是一把好手。
前不久,深度学习开发者,Medium知名博主 Max Pechyonkin在其博客中,介绍了将视觉深度学习模型应用于非视觉领域的一些创造性应用。
咱们就通过一篇文章,来了解一下求生欲极强的视觉模型是如何在其他领域发光发热的吧。
生活不易,DNN卖艺
由于有迁移学习和优秀的学习资源,DNN在计算机视觉领域的应用落地远超于其他任务类型。
加上各种开放平台和公开的预训练模型加持,任何人都可以在数天甚至数小时内,将视觉深度学习模型应用于其他领域。
两年前,就有外国农民开发出了自动检测黄瓜的智能程序,北京平谷的桃农也用上了自动检桃机。
背后的技术逻辑也很容易理解:先选用一个简单的卷积神经网络(CNN)模型(可以在开放平台上轻松地找到),将各种带有标签的图片扔进去,跑出一个baseline,主要是为了确定数据集是否合适,图像质量和标签是否正确,需不需要调试等等。
OK以后,就可以投喂处理过的图像数据集了,一般图像越多、标注质量越高,模型的性能和准确率就越好。
听起来是不是学过高中数学就能搞定?
既然技术门槛并不高,其应用范围自然也就被无限延伸。面对很多非视觉类的原始训练数据,视觉模型也表示“不怂”。
其中有几个比较有意思的应用案例:
1.帮石油工业提高生产效率
石油工业往往依赖于一种名叫“磕头机”的设备开采石油和天然气,通过游梁活动让抽油杆像泵一样将油从地下输送到表面。高强度的活动也使抽油机极容易发生故障。
传统的故障检测方式是,邀请非常专业的技术人员检查抽油机上的测功计,上面记录了发动机旋转周期各部分的负载。通过卡片上的图像,判断出哪个部位出现故障以及需要采取什么措施来修复它。
这个过程不仅耗时,而且只能“亡羊补牢”,无法预先排除风险。
而石油公司正在试验,将视觉深度学习应用到故障检测中。
贝克休斯(Baker Hughes)公司就将测功计转换成图像,然后作为数据集传给ImageNet预训练好的模型中。结果显示,只需采用预训练好的模型并用新数据对其进行微调,机器自动检测故障的准确率就达到了93%,进一步优化则接近97%!
(左侧是输入图像,右侧是故障模式的实时分类。系统在便携设备上运行,分类时间显示在右下角)
应用了视觉算法训练出来的新模型,不需要等待专业人员的排期和诊断,就可以自行判断绝大多数故障并立即开始修复。听起来是不是很棒很奈斯?
2.帮金融网站进行在线风控
金融网站与欺诈团伙的斗智斗勇,往往是一场“道高一尺魔高一丈”的技术军备竞赛。想要区分访问者是普通客户还是潜在风险客户,仅仅依靠IP过滤、验证码等互联网技术显然不够了。
但如果金融网站的系统能够根据鼠标使用模式来识别用户行为,就能够预先规避欺诈交易的发生。要知道,欺诈者使用电脑鼠标的方式是独一无二而且非常异常的。
但如何得到一个深度学习鉴别模型呢?Splunk就将每个用户在每个网页上的鼠标活动转换为单个图像。用不同的颜色编码代表鼠标移动的速度,红点和绿点则代表使用了鼠标键。这样,就得到了大小相同、且能够应用图像模型的原始数据了。
Splunk用了一个由2000张图片组成的训练集,进行了2分钟的训练后,系统就能识别出普通客户和非客户,准确率达到80%以上。
对于某个特定用户,系统还能够判断出哪些是用户自己发出的,哪些是模仿的。这次只用了360张图片就训练出了78%左右的准确率。麻麻再也不用担心我的理财账户被盗了。
3.通过声音检测进行动物研究
2018年10月,谷歌的研究人员使用视觉CNN模型对一段录音进行了分析,检测到了其中座头鲸的声音。
他们将音频数据转换成了视频谱,一种表示音频频率特征的图像。
然后使用了Resnet-50架构来训练这个模型。有90%的鲸鱼歌声音频被系统正确归类。而如果一首录音是鲸鱼的,也有90%的几率它会被贴上正确的标签。
这项研究成果可以用来跟踪单个鲸鱼的运动、歌曲的特性、鲸鱼的数量等。
同样的实验也适用于人类语音、工业设备录音等等。使用类似librosa这样的音频分析软件,就可以用CPU生成时频谱。
至此,可以总结一下视觉深度学习模型“跨次元”应用的基本操作了:
1.将原始数据转换成图像;
2.使用预训练的CNN模型或从头训练一个新模型进行训练。
由此得到一个能够解决非视觉问题的新模型。
开脑洞才是最难的
当然,上述都是作者分享的一些已经在实践中取得成效的应用,我们还可以将其应用于很多有趣、有意义的场景之中。前提是,能够找到一种将非视觉数据转换成图像的方法。
比如儿童餐食的健康问题,仅靠学校食堂和家长自学营养学显然不是一个足够效率、且能大规模推广的办法。
利用视觉模型,可以对餐盘的自动扫描与检测,对图像中的餐食特征和瑕疵点进行提取,以此推测出餐盘和饮食的洁净度是否合格,营养搭配是否符合基本要求。
再比如,通过智能摄像头将零售商超中的人群分布和动线转化为图像,进行分析和检测,可以判断出不同社区的需求和消费特征,从而有针对性地进行选品和陈设,进一步提升坪效。或者是通过汽车行驶轨迹来预测和优化不同时段的路况及定价。
总而言之,目前计算机视觉模型早已从实验室和科学家案头,帮助越来越多的现实问题寻找解决方案。
由此也可以看出,在AI落地中并不缺成熟、可落地的算法,大开脑洞的创造力才是最难的。
当然也有隐患
作为一个负责任的“AI吹”,故事显然不能在“AI好AI妙AI呱呱叫”中戛然而止。
虽然计算机视觉表现出了极大的适应性,但在实际应用时,有一些缺点是其本身也没有解决的, 这也导致很长一段时间内,图像识别、生成等应用还能被当做展示人工智能的神奇能力而被夸耀着。
首先,是视觉神经网络对于图像变化和背景过于敏感。无论是转换非视数据,还是直接训练原始图片,机器视觉的处理逻辑都是将图像转换为系统可理解的“数字”,再进行对比和识别。因此,将背景和变化等噪音识别成其他物体也就不足为奇了。
(在照片中增加不同的物体,会影响照片中原有的猴子的识别结果)
既然是通过视觉模型进行训练,那就需要大量有标注的高质量数据,而在现实应用中,一些非图像的原始数据,比如用户鼠标习惯、零售店动向等等,包含了多个维度、不同数量的数据点,不仅标记数据集的工作耗时耗力,而且训练这些庞大的数据也需要大量的GPU资源。
但遗憾的是,受标注质量、模型准确率、专业领域知识等影响,最终的成果在真实世界中的体验也可能非常糟糕。想要让商业机构冒着投资打水漂的风险进行尝试,恐怕还有很多工作要做。
更何况,视觉深度模型并不是一种放之四海而皆准的解决方案,有些任务是难以进行视觉化标注,或者实现成本很高的,短时期内也只能望AI兴叹了。
总而言之,视觉深度学习模型的成熟和非视觉场景的试探,给AI开发带来了新的故事和想象力,比起千箱一面的智能语音、人手一个的人脸识别,更令人惊喜,实用性也值得期待。
不过本质上讲,一切技术问题最后都是经济学问题。只要不计成本,总能搞得出来。《三体》中,秦始皇不也用三千万大军搞出了能计算太阳运行轨道的人形计算机队列吗?
这也和如今的人工智能产业现状悄然重合,技术不是关键性问题,没钱又不会搞工程的项目,就别让AI背锅了吧……
相关阅读
精彩推荐
阅读排行
相关词
- 美国社交电商再起波澜:TikTok商城开张,Meta却要闭门做生|今日快看
- 世界快资讯:上海再保险“国际板”正式启动
- 特别好评RPG游戏《恐怖的世界》 完整版10月19日上线|环球精选
- 易会满:持续加大对伪私募、地方交易场所等重点领域风险的整治
- 十元店重回巅峰:新穷人与日本1990s
- 每日快报!教育股震荡走低 国新文化跌超8% 荣信文化跌逾7%
- 全球快讯:央行潘功胜:人民币债券具有良好的投资组合分散化价值
- 国产大飞机开启常态化商业运行:C919带动产业链一起飞 市场规模有望达万亿元量级
- U盘安装系统时蓝屏怎么解决 全球头条
- ROG蓝屏后该采取什么解决方法来重启 世界快报
- 中国地震局:国家地震烈度速报与预警工程已完成主体建设任务 焦点讯息
- win10启动就蓝屏是怎么回事 全球热点
- 环球头条:华硕笔记本acpi蓝屏该如何解决
- 世界最资讯丨打击违规销售作弊器材行为 海南省市场监管部门多措并举为高考中考保驾护航
- 每日热议!永劫无间蓝屏死机应该如何处理
- KMODE蓝屏出现应该如何处理 全球观热点
- 携程集团发布2023年第一季度财报
- 甘肃省华亭市东华镇市场监管所开展农村夏季食品安全专项检查_环球热资讯
- 深圳市市场监管局总部经济审批服务“全市通办”正式落地
- 解码开化(一) 文旅产业:从“高看一眼”“棋高一招”到“焕然一新”
- 第五届京津冀石墨烯大会在北京房山举办,加速三地产业链深度融合
- 高考期间海南天气如何?未来两天多云有雷阵雨 焦点速读
- 别被“蚊蝇通杀”迷了眼
- 啥是海洋?直播带你一起看 天天快看点
- 内罗毕:低碳和电动交通载具展 天天观速讯
- 环球播报:斯诺克新星赵心童为涉赌遭禁赛道歉
- 《沙石镇时光》:1.0版本发售日期公布!通过“塑造你的未来”预告片为前方的秘密和危险做好准备 世界独家
- 关注眼健康亟须全社会行动起来
- 哈利波特魔法觉醒怎么尊享眉色 尊享眉色方法攻略 环球速看
- 甘肃省华亭市市场监管局多举措保障中高考期间食品安全 环球新动态
- 第19届深圳文博会人气旺 每日快报
- 甘肃省嘉峪关市市场监管局镜铁分局全力保障高考期间食品和特种设备安全
- 河北沙河:太行古村落焕发新活力_天天快播
- 世界百事通!晋陕峡谷遇奇石
- “共建首都跨境电商新生态”系列活动在京启动 每日热门
- 环球看热讯:汉字工坊上班不带饭怎么过 找出9个公司吃的答案分享
- 甘肃省张掖市新墩市场监管所“三力齐发”加强中高考期间特种设备安全保障_环球热推荐
- 快消息!小心,这种眼疾易盯上上班族
- 眼药水怎样使用才正确
- 当前讯息:机器人:公司基本实现了35kg以下新款机器人减速器的国产化替代
- 华菱钢铁:钢材产品在新能源新材料领域需求前景将持续向好-天天通讯
- 今早发布!雷雨!_天天即时
- 全球快报:云顶之弈s9暗影岛格温阵容攻略 s9赛季暗影岛格温阵容搭配
- 江苏“智造”夯牢实体经济“家底”
- 加拿大野火烟尘飘至美国 部分地区被烟尘笼罩
- 【环球时快讯】文字玩出花无法原谅怎么过 无法原谅十二处细思极恐在哪
- 环球快播:百亿授信!民生银行与协鑫集团达成全面战略合作
- 前5月外贸保持稳定增长 制造业转型升级塑造出口新动能
- 简讯:江苏油田页岩油累产突破4万吨
- 让城市成为“开放的艺术馆”(金台随笔) 视点
- 易会满:适时出台资本市场进一步支持高水平自立自强的政策措施 全球报道
- 【全球聚看点】河南麦收进度过八成 夏播已完成近五成
- 今起,在锡启幕!
- 两大国际组织上调中国2023年经济增长预期
- 仲景食品:公司产品以国内销售为主 出口业务占比较小-每日速看
- 天天速递!U盘装系统进入PE蓝屏该采取什么解决方法
- 充满算计!日美澳在南太铺光缆,日媒炒“抗衡中国影响力” 焦点热门
- 重点聚焦!力箭一号火箭的专属发射工位长什么样?
- 袁明辉:拍摄下来记录下来用自然摄影留住那些美好
- 扫码支付已在国内迅速发展普及 刷掌支付是否还有市场前景
- “去风险”成脱钩新马甲
- 环球微资讯!360qpesv.sys导致蓝屏该采取什么解决方法
- 【新要闻】北海市海城区地角街道辖区率先完成第二季度食品安全“两个责任”包保工作
- 国家开发银行前5个月发放交通领域贷款2687亿元
- 当前视点!带火原料药企,马斯克加持的“减肥神药”又火了
- 什么是股份制企业?股份制企业和私营企业的区别有哪些?
- 怎么才能正确安装python39.dll
- 全球连线|对两国合作机遇充满期待——洪都拉斯各界热议中国驻洪使馆开馆
- 兰州新区召开第二季度落实食品安全“两个责任”推进会议
- 民泰银行绍兴分行创新产品助共富系列① | 动产融资业务,为民播下“共富”希望-世界实时
- 【世界快播报】我国外贸连续4个月保持正增长
- 偷渡罪一般判多少年?偷渡人员怎么正规回国?
- 吉利雷达以“真乘用化”撬动市场,5月销售1016台创历史新高 焦点资讯
- 故意伤害致人死亡如何处罚?故意伤害致死赔偿多少?
- “6·6”全国爱眼日公益讲座在京举办
- 上古诸神:卡牌对战官网在哪下载 最新官方下载安装地址 环球热推荐
- 天天头条:电脑中缺失alrsvc.dll文件应该怎么处理
- 赡养费标准是什么?不给赡养费最严重的后果有哪些?
- 只允许跟院方合作民营救护车辆进入?医院回应
- 涉案金额959万元!海口曝光9家定点医疗机构
- 世界快播:如何解决电脑端丢失rasmans.dll提示问题
- 微资讯!江西省新余市市场监管局:强化建材质量监管 守牢质量安全防线
- 【快播报】警惕“负首付”骗贷
- 财产税有哪些税种?所得税和财产税的区别有哪些?
- 高考第二天部分地区已公布查分时间 胜利在望,加油少年!|全球快看点
- 青海省海西州四项措施为“中高考”保驾护航_每日看点
- 嫖娼拘留多少天?初次涉黄拘留几天?
- 青海省市场监管局发布中高考期间食品安全消费提示 天天热门
- 浙江金华婺城区:天然富硒,“硒”望之旅
- mtfutils.dll缺失如何恢复
- 忘了车限号开了一天罚多少钱?郑州限行免罚有几次机会?
- 焦点快播:网红化妆大师官网在哪下载 最新官方下载安装地址
- 动态:量子密钥分发攻防研究获重要进展
- 什么是违法所得?违法所得和非法财物的区别有哪些?
- 仙迹之九州神剑官网在哪下载 最新官方下载安装地址|今热点
- 工程预付款是怎么规定的?工程预付款为什么要扣回?
- 种一颗牙便宜多少钱?海南打出种植牙降价“组合拳”
- 劳动合同法第38条是什么内容?公司不辞退故意调岗怎么赔偿?
- 无证驾驶怎么处罚?无证驾驶会被马上拘留吗?
- 当前时讯:生存冒险游戏《血清》新预告 拥有4人合作模式
- 天天观热点:岭南街道构建“一网二联三队伍”服务模式,为社区长者健康保驾护航
- 通信业全力保障高考|莘莘学子逐梦未来 通信业全力护航
- 焦点观察:华为品质宽带智能运维系统荣获CAICT光接入网L3.5等级认证
- 青海省启动“企业商业秘密保护能力提升服务月”活动-天天速看
- 黑龙江省北安市市场监管局着力打造“帮您办”服务品牌|动态焦点
- 非遗 | 高校留学生走进安徽文旅扶点-环球通讯
- 今日快看!FPS游戏《无畏契约》国服今日终测 删档充值返利
- 环球最新:黑河联通多措并举提升廉洁文化教育质效
- 每日视点!语文名师点评AI高考作文:百度搜索AI伙伴优于New Bing、ChatGPT
- 国家金融监督管理总局李云泽:正式启动上海再保险“国际板”-环球快看点
- 全球报道:重庆油菜喜获丰收 总产量实现连续16年增长
- 冒险游戏《血清》发布实机视频 支持简体中文 四人联机
- 全力保障高考通信畅通,重庆电信在行动!_环球速读
- 《无人深空》发布季节性更新“奇点”预告视频 现已正式上线-环球微速讯
- 世界殿堂级名团重返中国舞台 玛莎·葛兰姆现代舞团尽展风采 观速讯
- 上海移动获得DC-Tech数据中心智能建造最高等级认证 当前快讯
- 戴尔电脑开机后蓝屏重启应该怎么应对
- 电视剧《照亮你》在都市类型中铺展新的叙事面向 世界要闻
- 黑白琴键抒写长三角风情 全球新要闻
- 上海世纪出版、米哈游、东方明珠新媒体上榜
- 电脑提示vcomp140.dll文件丢失的解决方法|环球新要闻
- 世界今热点:切实保护金融消费者合法权益
- 全球快报:电脑蓝屏nv1ddmkm.sys怎么办
- “拆楼”式装修必须叫停
- 世界今日讯!李云泽:下好风险前瞻防控先手棋,以更加主动态度应对风险隐患
- 湖北馆展品超5000件:五大“重器”显实力 五类“非遗”溢楚风_今日看点
- 国家金融监督管理总局李云泽:监管体制改革是金融改革的重要一环 天天快资讯
- 公安部交管局公布近期三轮车肇事肇祸典型交通事故案例
- 网传重组人生长激素进浙江集采 长春高新连夜召开电话会回应
- 当前通讯!传记文学《灵魂的旋律:我的父亲刘炽》:再现作曲家刘炽艺术人生
- 全球微头条丨欢乐家的椰子“野心”:去年椰子汁饮料营收超8亿,今年加码投资
- 腾势D9车型5月销量11005辆,环比增长约9.6%
- 两部门:举办全国和美乡村篮球大赛(村BA)
- 最新资讯:Win10 watchdog.sys蓝屏该采取什么解决方法
- 世界视讯!《神仙道3》神阙风物志第五章详细通关攻略
- 全球净零技术制造竞争全面展开 时讯
- 海口江东新区盛泰仕家安居房项目预计10月底全面封顶
- 刀具等特殊商品退货难邮寄,如何解?
- 如何解决提示cnbbr332.dll丢失报错问题
- 【小康头条】高考第二天,这些话想对你说......_世界微速讯
- 全球新消息丨国家医保局:1-4月基本医疗保险基金总收入11403.13亿元,同比增长8.1%
- 携程集团发布2023Q1财报:净营收92亿元 同比增长124%
- 茶园里开“茶话会” 专家齐献“金点子” 当前视讯
- 《崩坏星穹铁道》访问筛查拍照位置大全
- 树立安全“红线”意识 筑牢安全生产防线_天天快资讯
- 每日热文:安徽省休宁县市场监管局开展中高考考点周边药械安全专项检查
- 医院只允许有合作的民营救护车辆进入?调查结果来了
- 海口江东新区快速通道项目启动首联钢梁吊装作业-环球速看料
- 世界要闻:加拿大野火持续蔓延 美东多地被浓烟笼罩
- 评论 | 传统中国画教育的时代价值挖掘|世界最新