【技术】深入机器学习系列1-序章

     

       1996年,美国费城举行了一次特别的国际象棋比赛,其中一位参赛者是名为“深蓝”的国际象棋计算机。在决赛中,IBM公司研发的深蓝2:4输给了世界冠军卡斯帕罗夫。这是人类与计算机的第一次交锋。当时的深蓝并没有像人类一样演绎归纳的经验而只能评价海量的计算和人类抗衡,但最终败下阵来。然而1年后,对战双方又进行了一次对决,这次深蓝完成复仇,总比分3.5:2.5战胜了卡斯帕罗夫,拉开了AI的序幕。


(dota2人类冠军Dendi 图片来自liquipedia)


        为什么人工智能的发展速度如此超乎人类社会的想象?曾经AI似乎仅仅是利用其庞大和快速的计算量来打败人类。“把下每一步棋的后果都记算一遍”是人类曾经认为的AI的思考方式。然而过去20年中,随着大数据技术的快速发展,AI已不仅仅是简单无脑的暴力计算,AI有了自己的学习方法:深度学习。深度学习的概念源于人类神经网络的研究,通过分析底层数据和现象演绎得出更加高级抽象的结论。深度学习的特征是研究数据的分布式特征。通过研究大量数据并分析其特性,可以得出数据群体的特性并且预测其发展态势。早期的计算机专注于处理人类能力很难完成的事,比如在几秒内计算出2的100次方或者pi小数点后的几千万位。然而今天的人工智能聚焦于那些人类认为“很简单”的任务。比如人脸识别,字符识别或是人类的情感变化。这些任务并没有明确的公式帮助计算机完成,人类通常靠所谓的“直觉”来解决这些事情。然而深度学习通过分析面部表情的细微变化或是字符笔画间固定的间距可以得出异常客观准确的结论。让计算机自己从大量的经验和数据中分析学习可以避免人类下达指令提供计算公式的被动局面。由于人脑在思考时是一层层得出结论,因此深度学习同样要求足够的深度。在计算时,从一个输入到输出的最长路径被称为深度。如果一个深度架构被潜架构表示,那么深度学习归纳出的结论便并不准确。


2017年中国乌镇围棋峰会上柯洁对阵Alpha Go,第二局比赛以柯洁中盘认输结束。 图片来自新华社


        我们会在接下来陆续发布机器学习有关的教程。Apache Spark是一款处理大规模数据的计算引擎。相比于Hadoop,Spark更适合进行数据挖掘和机器学习。TensorFlow则是谷歌开发的第二代人工智能学习系统,在语音识别和图像识别领域有广泛的运用。我们总结了四个部分:常见机器学习算法,自然语言处理,深度学习以及高级机器学习算法。常见机器学习算法主要是介绍一些spark mllib中已经实现的算法,通常要求对数学原理、mllib中的代码实现,以及如何应用于实际问题的解决等方面都要比较熟练的掌握。深度学习主要是针对一些常见的概念、优化的trick等的介绍,以及在流行深度学习框架上解决实际问题。而高级机器学习算法,通常对数学原理以及如何使用等做介绍。我们会慢慢分享这些成果。



以上内容来自智子AI,后续还会有更多技术文章不断推出

长按右侧二维码关注哦~




点击或回复关键词,查看相关内容


公司

简介 | 星环科技成长大事记 

投资 | 星环科技获腾讯领投2.35亿C轮融资,与腾讯云达成战略合作


产品

产品 | 星环的划时代版本-Transwarp Data Hub 5.0

TDH社区版 | TDH社区版提供官方下载

评测 | 大数据产品最新测试基准看哪家(TPC-H or TPC-DS)?

流式计算 | 用Slipstream构建复杂事件处理应用

Holodesk | 业界最强的SQL引擎Inceptor为何这么快?

培训 | 学完这些课程,你也是大数据专家了!

认证考试 | 数据中心联盟—星环联合认证体系首次认证考试报名中


技术

技术 | 原创技术干货大合集!

技术支持 | 最完整的星环技术支持体系

评测 | 大数据产品最新测试基准看哪家(TPC-H or TPC-DS)?

TED视频 | TEDxLujiazui精彩视频:【大数据 大趋势】

白话大数据 | 白话大数据合集


案例

银行 | 河南农信:数据辅助决策,决策引领创新

证券 | 中泰证券:剑指大数据处理 多券商革新IT架构

智能金融 | 星环科技发布证券业大数据战略规划纲要(白皮书)

运营商 | 运营商的新方向-运用Hadoop技术将大数据资产变现

交通 | 大数据在智慧高速中的创新应用

物流 | 星环Hadoop发行版助快递业迎战“双十一”

邮政 | 中国邮政大数据平台建设

税务 | 大数据提升税务系统核心能力

审计 |让数据成为竞争力

视频监控 | Hadoop大数据在实时视频监控的应用场景

广电 | Hadoop企业级应用新添重磅案例

电力 | 华南某市供电局全景可视化大数据平台案例

能源 | 厉害了,我的营销大数据!

智能工厂 | 大数据技术助力中国石化智能工厂

农业 | 农业大数据的研究与实践

医药 | 医药产业链大数据前沿探讨

速记

【速记】河南农信 牛玲玲:数据辅助决策,决策引领创新

【速记】数起科技 李明国:让数据成为竞争力

【速记】天士力 刘晓煜:医药产业链大数据前沿探讨

【速记】国家农业信息化工程技术研究中心 陈天恩:农业大数据的研究与实践

【速记】同济大学教授 王伟:同济-星环“数据科学与大数据实践平台”建设

【速记】第一创业证券 瞿任雄:基于星环TDH大数据平台构建新一代券商数据中心

【速记】南方基金 屈磊:基于TDH数据中心大数据平台建设

【速记】中泰证券 何波:基于机器学习的场外配资自动识别系统



相关文章
相关标签/搜索