无边界的AI福祉
186****8833
186****8833

3月14日著名物理学家史蒂芬•霍金离世,在他的传奇一生中,大半辈子在轮椅上度过,他曾说:“医药没有治愈我的疾病,所以我更依赖于科技”。通过轮椅上的各项科技手段,这位世界级物理学家在全身瘫痪不能言语的情况下,依旧为学术界作出了杰出贡献。

AI催生的化学反应

不可置否的是技术在过去15年间正在以难以想象的速度发展着,成熟的技术正逐渐渗透进生活,在方方面面对我们产生着影响。霍金成就与信息无障碍有着分不开的关系。 其实此前各国都格外重视无障碍方面的建设,以天天接触的键盘为例,细心观察就会发现在F和J按键上有一块小凸起,对于视障人群而言,这个凸起能够帮其进行键位判断,而常人除了靠肌肉记忆外,也可通过这一设计进行快速定位。 这里要强调一点是,无障碍技术所覆盖的并非只有障碍人群,老年人及健全人亦可从中获益。而这一次得益于AI技术的突破,各行各业都开展了新一轮技术变革,也让“信息无障碍”的发展取得了阶段性成果。为何这么说,以文字识别(OCR)技术为例,该技术起源于60年代初期,发展大致分为四个阶段: •第一阶段只能识别指定字体下的数字、英文及部分符号; •第二阶段出现在60年代中期-70年代初,可对手写体数字的识别; •80年代初期,OCR技术迈入第三阶段,主要解决了大字符集识别问题; •随着深度学习技术的成熟,OCR技术迈向了新的阶段,也具备了较强的通用性。 整体来看OCR技术发展至今,算法是基石,催化其成熟的是可进行深度学习的训练集群。回看AI技术60余年的发展史,算法远比数据集诞生的要早,但真正实际性突破的节点在于有效数据集的产生。 直白点来说,未来视障人群可通过图片识别结合语音等全新方式来进行外界信息的获取,常人亦可享受到更好的使用体验。在这其中AI起到的催化作用,让“信息无障碍”技术彻底发酵出来。

国内外创新对比

技术的发展带动了应用的革新,在上周微软与谷歌各自召开的年度大会上,两家不约而同的展示了在信息无障碍技术上的成果。 谷歌此次展示的AI语音导盲Lookout,该应用与此前推出的AI图像识别工具Lens原理相近,Lookout的愿景是帮助数百万盲人和视障人士变得更加独立。通过Google Pixel设备上的摄像头,Lookout能够对文本或物体进行识别,并以语音的方式将方位等外部信息反馈给使用者。

1526866317387.jpg Lookout应用共分为家庭、工作与娱乐、扫描、实验四种模式,在家庭模式下,可为用户反馈家具所处的方位,而在工作与娱乐模式下,告知的则是电梯间或所需工具的空间位置。

另一个巨头微软在信息无障碍方面的应用落地要先于谷歌,其研发的App“Seeing AI”自去年推出以来,下载次数接近15万次。微软这套方案的区别之处在于,采用了手机摄像头+智能眼镜两个硬件设备作为支持,以此来对周围环境、颜色、纸币及文件在内的所有物体进行辨别。

1526866317439.jpg 这款应用不仅帮助了一个盲人教师来监督自己的学生是否在课堂中偷偷溜走,更帮助了一些身处在飓风肆虐区域的使用者,进行障碍物方面的回避。在上周微软Build大会上,AI for Accessibility项目也被正式推出,主要为丰富更多场景下的信息无障碍技术应用。

1526866339147.jpg 回看国内BAT、小米、搜狗等代表性企业,他们也时刻推动着这一技术的发展。在韩国釜山冬奥会的火炬传递现场,视听双障碍的李鸿利顺利完成了200米火炬接力,这个火炬手的另一个身份,正是为阿里巴巴旗下钉钉、淘宝等产品提供信息无障碍服务的工程师。在实际应用中,阿里针对视障者所开发的内置辅助语音识别技术,帮助障碍群体进行在线商品的选择与下单,甚至是在支付宝上购买机票。
腾讯在2009年便启动了无障碍产品改造项目,2011年年初,QQ空间推出了读屏版的QQ农场,让视障人群能够享受到社交生活。2012年腾讯正式成立了无障碍产品同盟会,呼吁行业内更多的企业加入到无障碍化的行动当中。现今腾讯又对外开放了自家文字识别、语音合成、图片转语音三大AI技术,在提供感知信息新方式的基础上,丰富无障碍化的产品品类。

1526866339944.jpg 而百度则在2016年时正式将信息无障碍纳入了公司技术规范当中,先后对百度地图、输入法、贴吧等三款应用进行了无障碍改造,以声音的形式输出内容,实现与障碍群体的交互。 总的来说推动信息无障碍技术的方式分为两种,其一是落地产品,其二是开放平台。以微软谷歌落地的产品为例,有品牌背书产品更具靶向也更被用户所认可,而开放平台则是让整个行业不再受技术与人才上的局限,从而在多个领域内进行横向复制。

无边界的AI福祉

科技正让复杂的世界变得更为简单,也为无障碍事业发展提供了全新思路。据世界卫生组织估计,目前全球约有2.85亿视力受损人群,失明人群3900万,这个庞大的人群此前缺少科学专业的方法来表达诉求,而现今他们却能与常人一样,完成在线购物、订票、出行乃至社交。
正如谷歌李飞飞所说:“AI没有国界,AI的福祉亦无边界。”往小了说,AI为障碍人群提供了一份生活保障,往大了说技术所提供的更是一份权利保障。
众所周知,此前障碍群体曾因身体原因受到过不平等的工作待遇,而现今我们都身处信息化时代,障碍群体完全可借助AI的辅助,来创造出更大的个人价值,扩大自身就业机会,融入社会重拾自己的信心,享受新技术革命所创造出的每一个红利。

0

2018-05-21 6530 0
最新评论 (0)
  • 意见反馈