加入图像辨识,手机无所不能

来源:互联网 发布:安卓网络设置软件 编辑:程序博客网 时间:2024/06/11 08:08
拿起照相手机拍照、留下生活纪录,已成为现代人生活的一部分,用手机来视讯通话也稀松平常。从产业端来看,苹果(Apple)公司推出触控式手机,整合各种娱乐服务;Google推出Android手机平台,要把网络服务串连起来,整个手机市场又进入新一波的竞争,各家无不思考手机还有哪些应用可能? 现在,它甚至可以担任你的个人翻译。当你在不同国家旅行,遇到不懂的单字,只要透过手机内建的数字相机镜头,对着陌生单字拍摄,透过图像辨识功能,就可立刻在屏幕上显示翻译结果,再也不用带着大本字典或是慢吞吞地在电子翻译机输入单字。

拆解文字技术速递信息

这项新技术是由诺基亚(Nokia)中国研究中心所开发,用照相手机拍摄任何物体表面的文字,经由光学辨识,将影像的文字抽取识别,再透过内建的翻译软件转换成不同语言。诺基亚中国研究中心负责人裴斯博(Seppo Pienimaa)表示,该中心针对亚洲语言的研究已长达八年,包括汉语、粤语、英语、泰语、越南语等,希望能够创造多语言通用的服务,让使用不同语言的人,可以在生活中更便利地沟通。

诺基亚中国的研发人员表示,现在已经能将中文与英文的文字影像进行拆解辨识,可逐字翻,也可以配上人工智能的词组辨识,大从海报广告牌、小至报章杂志的说明文字都可翻译。这项技术最快将可在今年搭配产品问世,届时可望免除参加北京奥运的外国观光客看不懂中文菜单的困扰。

透过影像识别的技术,再加上传输到某些终端或网络辨识,照相手机的应用还可以作为更精确的个人身份识别。日本松下电器(Panasonic)和夏普(Sharp)公司都已经开始制造具备「面部识别」功能的手机,透过内建相机,来捕捉使用者五官的轮廓与距离,再透过软件运算,辨别识使用者是否为原手机持有者。

这项研究的应用,不单是打算以手机取代翻译机,研究人员更试图让手机扮演搜寻引擎的角色。诺基亚在加州帕拉阿图(Palo Alto)的研发中心,就推出一个名为「Point Find」的计划,只要以照相手机拍摄生活周遭的景物,就可以实时从网络上得到相关信息。去年秋天,数家印度宝莱坞(Bollywood)电影片厂尝试了一项新服务:手机用户将相机镜头对准电影海报,然后就可以下载该部电影的主题曲作为手机铃声。研究人员在实验室示范,把手机的相机镜头对准一只红色的鞋子,手机立即可以从网络上搜寻出附近鞋店的资料;对准店面,就能得到门市营业时间的讯息。

诺基亚承诺这项计划将在三年内实现,而这个概念型科技已经吸引很多人的注意。因为它让消费者简单地使用照相手机,得到他们感兴趣的信息。甚至当消费者想要购买某件海报上的洋装,照相手机也可以搜寻最实惠的价格和购买方式,比起现有搜寻模式(消费者在网络上寻找关键文字)便利许多。不过,除了影像辨识,这项技术需要大量科技的配合,例如GPS定位、人工智能算法。MIC研究顾问王胜宏表示,利用影像辨识在实体世界搜寻,需要庞大的数据库和运算能力,更要能够跨平台的分享信息,不是单一企业可以做到的。

未来图像辨识可望与更多应用程序结合,但重点在于要找到利基,提供特定族群消费者一个「渴望拥有」的加值选项,「好用」才能让图像辨识成为新的杀手级应用。  
原创粉丝点击