大数据人|中国大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

泰一数据:猜画小歌的5000万组数据群与人工智能的三大基石

2018-7-25 09:39| 发布者: 泰一指尚| 查看: 284| 评论: 0

摘要: 新一代信息技术的快速发展,使计算能力、数据处理能力和处理速度得到了大幅提升,机器学习算法快速演进,大数据的价值得以展现。所有AI应用的诞生于都离不开丰富的数据积累和训练资源。

谷歌发布的“猜画小歌”小程序3小时占领朋友圈“C位”,不仅激发了身边一票灵魂画手,更是为谷歌AI刷足存在感,从谷歌的AlphaGo、猜画小歌,到微软“小冰”、英特尔精准医疗、特拉斯无人驾驶……人们正在全方位的感受AI的强大。

 

Google Brain5000万组数据群

 

猜画小歌小程序基于谷歌AI开发,主要技术是计算机视觉和神经网络,其神经网络源自全世界最大的、囊括超过5000 万个手绘素描的数据群。用户可以在有限的时间内进行速写,在每一轮体验中,需要在20秒的时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),AI“小歌”则需要在时间结束前猜出图画中的物体,当 AI 猜出你图画中的物体时,你就会进入下一轮,你的猜画连胜次数也会相应增加,用户还可以分享有趣的素描图,并在体验过程中不断收集新的题目和图画。

 

很多时候,即使用户所画图像并不形象或仅划出几笔,小歌就已经猜出来答案,这与程序背后的递归神经网络RNNRecurrentneural network)的技术密切相关,通过该技术让AI来理解人们在绘制涂鸦时如何起笔、如何走笔、在哪儿停笔,如同按照笔画写字,就容易猜出用户想要写的字。为了让AI能够猜出大家的画作,在上线之前已经喂了大量的数据模型。

 

猜画小歌的前身是AI涂鸦网页游戏“快画”(Quick, Draw!)的看图猜物品功能,它可以根据你勾勒的几笔猜测三个可能的物品,背后的技术支持就是谷歌AI研究部门Google Brain上线的第一个基于云服务并与绘画相关的人工智能Sketch-RNN。在这之后,Google Brain进一步升级推出了“AutoDraw”,它可以把用户画的轮廓描绘成理想的画作,依赖于谷歌的图像识别技术,并通过手绘图像数据库来和用户的画作匹配。例如,你告诉它要画个蚊子,然后随意画一个椭圆形后,人工智能Sketch-RNN可以自动帮助补完整只蚊子。同样,这款游戏的目的也远不止让用户开心,而是利用这些草图,让计算机学习如何像人类那样绘画。

 

数据库规模越庞大,结果准确率越高。随着这款小程序的风靡,不仅让谷歌刷了一波好感,也使它在短时间内获得更多的标注数据,用于图像识别算法的闭环训练,用户绞尽脑汁的灵魂化作将被用于丰富庞大的人类涂鸦数据集,训练 AI 更聪明地识别手绘作品,提高智慧程度。

 

AI基石: 大数据、芯片以及智能算法

 

新一代信息技术的快速发展,使计算能力、数据处理能力和处理速度得到了大幅提升,机器学习算法快速演进,大数据的价值得以展现。所有AI应用的诞生于都离不开丰富的数据积累和训练资源。

 

大数据、半导体芯片以及智能算法是人工智能的三大基石。目前是信息爆炸的时代,仅中国智能手机以及各类平板电脑的数量已经超过13亿,而每个智能手机能携带超过16种传感器,每天每部手机可产生超过1G的数据,如何对信息进行采集、运算、储存、传输都是目前AI技术遇到的关键瓶颈。同时,得益于海量数据的产生为人工智能的茁壮成长提供了充足的养料,从而推动了AI走向市场、落地应用,智能终端和传感器的快速普及,海量数据快速累积,基于大数据的人工智能也因此获得了持续快速发展的动力来源。

 

 

△人工智能三大基石

 

人工智能的实现首先需要大量的数据训练,这些数据包括文字,语音、影像以及用户行为等等。然而,存在于生活场景中的大量信息是无法直接用于计算机算法的训练,且大量数据的存储以及处理成本高昂,因此如泰一指尚等专业的数据采集、处理以及存储公司应运而生。其次,智能算法与大数据两者相辅相成,算法通过数据训练不断完善,同时也由于智能算法的不断改进,大量自然数据得以完成归类和整理,成为可用于算法训练的结构化数据。目前人工智能需要挑战的是解决现实场景中的各类问题,例如识别图像、识别语音或者识别生物特征。这涉及到将真实信息进行抽象处理从而转化为计算机可以理解的程序语言。为了实现这一目标,各类方法被提出。与之相匹配的新型算法往往对计算机的计算能力提出了更高要求,更强运算能力的计算机芯片也应运而生。

 

如在医疗行业,AI的应用正逐步更好的解决医疗资源不平衡的问题。国内2016年门诊患者数量高达77亿,每千人配备1.5名医生,医疗资源的不足导致医生投入问诊的时间越发的少,更容易造成误判、漏判的现象。随着神经网络、深度学习网络等算法的推广和应用,机器可以通过训练学习自主建立识别逻辑,进一步提升图像识别的准确率,加上医疗大数据不断累积得到的分析结果,使行业发展进入了一个新阶段。目前,疾病风险预测和医学影像已经是AI在医疗领域的两大热门应用场景。

 

随着人工智能技术的逐渐成熟,科技、制造业等业界巨头布局的深入,AI在汽车、零售、家居、教育等行业均已取得了不同程度的突破,报告显示,2017年中国人工智能市场规模达到237亿元,同比增长67%预计2018年我国人工智能市场增速将达75%。互联网时代,新的一波高新技术浪潮将带动新的经济业态,人工智能是历史和科技发展的必然趋势。

 

关注微信公众号“泰一数据”,了解更多大数据行业应用


鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

关闭

站长推荐上一条 /2 下一条


id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_forum_2" >社区BBSid="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

QQ|广告服务|关于我们|鄂ICP备14012176号-2|Archiver|手机版|小黑屋|大数据人    

GMT+8, 2018-9-20 19:11 , Processed in 0.450408 second(s), 22 queries .

Powered by 小雄! X3.2

© 2014-2016 bigdataer Inc.

返回顶部