数学之美读后感

2024-05-13

1. 数学之美读后感

 数学之美读后感1     看到吴军的另一本书《数学之美》,激起了很深的兴趣,所以很快把书看完了,普及了很多基础的知识的同时也启发了很多想法,感觉很爽。
     我自己在交大学的是工科(虽然没怎么上过课),小学、初中、高中都是一路参加数学竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己对数学有很深的感情,同时女朋友大学也是数学系,有点后悔的大学选了个并不感兴趣的专业(交大当时允许我随便选专业,我没有跟父母商量自己选了船舶制造)。看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定理还很有亲切感
     书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax说得对,也许是出版社为了卖书取得名字
     不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人(即使他自己会自谦说是一个二流的工程师之类)
     书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的:
     1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?有啥用?
     2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词
     3.搜索引擎是如何工作的—网络爬虫是怎么回事儿
     4.PageRank是怎么回事?为了解决什么问题?
     5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下
     6.拼音输入法的数学模型
     7.、文本自动分类的模型
     ……
     看完之后最大的感受就是:
     1.数学模型巨大作用,推动着新技术的发展
     2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉
     3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点上的持续优化就没有意义了。
     但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕竟公司不是科学研究所,所以追求通过技术直接解决用户需求或者做成易用的工具给业务人员、运营人员来间接解决用户需求是挺重要的,可能不是技术人员觉得做到80分就可以了,而是用户、使用工具的人觉得做到80分是一个重要的衡量
     提到工具,想到赵赵说过的一句话:不好用就等于没有,可能就是这个点,同时运用工具的人必须好好的运用,如果用不好甚至不用就太对不起技术了。
   数学之美读后感2     《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。  
     在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
     在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
     最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
     因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。
     写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
     废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系……),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
     吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现……感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的……)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
     除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
     总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的`运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。
   数学之美读后感3     读完这本书有一点强烈的感受:工具一定要先进。数学是强大的工具,计算机也是。这两种工具结合在一起,造就了强大的google、百度、亚马逊、阿里、京东、腾迅等公司。他们不是百年老店,但他们掌握了先进的工具。
     掌握了先进的工具,必将获得竞争优势。如果你知道哪里有一群软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使用他们提供的服务,因为这会给你带来优势。所以我们使用Google的搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ和微博联系朋友,使用银行卡和网上银行,利用交易终端在全球市场上进行各种交易……
     人类历史就是一部工具的进化史。石器、青铜、铁器、火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具的进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联网视频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸质书那样。
     但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花费许多时间。毛笔就是这样一个例子。今天学习掌握毛笔这种落后的工具,还有什么意义?其实我们在使用一些落后的工具时,主要是在学习工具背后的思想。书法和绘画中蕴含的艺术审美的一般原则,经得起具体工具变迁的考验。甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值得现代人学习。思想工具是比实物工具更强大的工具。
     工具组合使用,形成更强大的新工具。《数学之美》中提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机新闻分类这样的难题!
     每一种工具的背后,是人们对世界的一种理解。蒸汽机和内燃机背后,是力学的世界。电报、电话、电视、计算机和互联网背后,是信息的世界。数学是抽象的工具,是其他工具背后的工具。每一门学科要成为科学,都少不了数学。也许有一天人们会习惯,用数学工具来分析艺术。数学是一种语言,它源于具体的世界,又高于具体的世界。如果说语言是对世界的认识和描述,如果说数学是一种语言,那么它一定是最接近神的语言。看似毫不相关,却又能描述万事万物。
     学习数学有什么用?物理学家费曼当年在大一时提出这个问题,他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有扎实数学功底的人才正进入各行各业,例如金融业。我认识一个出版社的老总,他招应届毕业生有一个条件:数学要好。
     工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件算法工程师加上计算机集群,这是目前一流企业必需的装备。正如马克。安德森所说的,各行各业的一流公司,都是软件公司。优秀的软件算法工程师,是人才争夺的焦点。这样,我们就容易理解Google招工程师的要求。
     对信息加工处理和传递的能力不断增强,是知识经济的特点。《数学之美》展示了Google如何运用数学和计算机网络,带领我们进入云计算和大数据时代。
     知识经济时代的工作,就是在各自的领域中进行科学研究。科学研究要大胆假设,小心求证。科学研究要量化。科学研究要有对比实验。科学研究要有数学模型。科学研究要有田野调查。科学研究要有文献查证。科学研究要有同行评议。《数学之美》向我们介绍了自然语言分析领域的科研方法和过程。
     任何一个领域,深入进去都有无数的细节。有兴趣的人不但没被这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达到的高度。值得我学习。
   数学之美读后感4     在网上看到有人推荐吴军博士的《数学之美》,尽管我从事社会科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验正如吴军博士在书的后记中所说,把自己境界提升了一个层次。
     那么,对我而言,到底提升了什么境界呢?
     首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
     计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以语言的数字化成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
     我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
     吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50-70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
     在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。
     观国内的学说界,官风盛行、腐败当道、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚远。
     看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。

数学之美读后感

2. 《发现数学之美》读后感600

数学家的眼光读后感 范文一
数学家的眼光和普通人的不同:在普通人眼中十分复杂的问题,在数学家眼中就变得异常简单;普通人觉得相当简单的问题,数学家可能认为非常复杂。作者张景中院士从我们熟悉的问题入手,通俗生动地介绍了数学家是如何从这些简单的问题中,发现并得出不同凡响的结论的。《数学家的眼光》讲的不是解某一类数学题的技巧,它告诉我们的是思考数学问题的思路和方法,让我们做题更加简便的“捷径”。
数学家的眼光可以从“三角形的内角和是180°”这个众人皆知的数学常识中看到“任意n边形外角和都是360°”,看到“蚂蚁在卵形线上爬一圈,角度改变量之和是360°”,这样的眼光,怎能不让人惊叹!
用圆规画线段﹐一般人立即反应:怎么可能呢?若按照常规思考,我们可能回答:“把圆规当铅笔用,再配合直尺,不就可以画线段了吗?”但是在只能用圆规不能用其它工具,画出绝对的直线段的情况下,可能就需要思考一下了。想一想,若不拘泥在平面上呢?用一个中空的圆罐子,将纸卷成圆柱状置入,将圆心固定在罐子中央,转动圆规,在罐子内侧的纸上画圆,当纸拿出后,线段便完成了!
鸡兔同笼,数学家的眼光从这个小学的数学问题又能看出什么呢?鸡兔同笼用方程的解法会很简单,但是它除了方程,还可以用最原始的方法去解。有人可能会笑了:有了简便的方法,还用那么笨的方法干什么?但如果倒过来想,用鸡兔同笼的方来做方程的话,那么很难方程不就好解了吗?
数学家的眼光,能从基本的数学常识中看出复杂的理论,能从不可能中看出可能,能从简单的问题中看出那题的解法。在数学家的眼中,最最基础的理论也可以衍伸变化出高深的数学问题。数学的领域是无穷广阔的,真正的关键在于自己,若我们用心观察四周的事物,抓住平凡的事实,思考、探索、发掘,会发现数学是耐人寻味且无所不在的。数学家的眼光从洗衣服中都能看见数学的影子,那么我们也一定能够从其它事情中看到数学,久而久之,就会慢慢理解数学,喜欢上数学。这样,数学就不再是让我们绞尽脑汁去思考的难题,而是生活中处处都有的小精灵。
《数学家的眼光》读后感范文 二
《数学家的眼光》是中国科学院张景中院士写给中学生的一本科普读物,是一本雅俗共赏的科普读物。刚拿到这本书的时候真是爱不释手,一口气读完了,只是迟迟没有写读后感,因为我觉得每读一篇文章都能够感觉到数学的奇妙,数学家眼光的犀利,知识的神奇联系,那种感慨不是一时半会能用语言描述清楚的。这几乎是我所有书籍里最喜欢的一本书了,张景中院士讲到的数学总是深入浅出,出神入化,读他的著作就像在感触大自然的鬼斧神工一样,奇妙无穷!读过一遍仍然想着继续读第二遍,第三遍……一篇篇慢慢品味才好。即便现在要写一写读后感,我也只能就其中的某个知识点说一说自己的感想了。
数学是具有一定的超前性的,但是超前性的东西只有数学家和数学爱好者才会感兴趣。这里不妨就说说生活中的数学吧--洗衣服中的数学。普通人觉得洗衣服哪有什么数学问题呢,直接洗不就行了吗?数学家可不这样想,首先是世界范围内水资源的紧张要求节约用水,其次,我觉得数学家的生活总是很精致,他会考虑怎样才能用最少的水洗出最干净的衣服。这就引出了数学问题,当然数学家是很不喜欢含含糊糊的,首先把问题理清楚,把现实问题转化为纯数学问题,这个过程其实就是建立数学模型的过程了,也就是利用数学思想和知识解决现实问题的过程。
首先要把现实的问题量化。假如现在衣物已经打好了肥皂,揉搓的也已经差不多了,再拧一拧,当然不可能完全拧干。设衣服上还残留含有污物的水1斤,用20斤清水来漂洗,怎样才能漂洗的更干净?书中就每一个方案给出了详细的解答,如果20斤水一次漂洗,最终衣物上的污物残留量是原来的1/21。如果分两次漂洗,情况就比较多了,比如第一次用5斤水漂洗,使污物减少到1/6,再用15斤漂洗,污物减少到1/96,如果两次都是用10斤水漂洗,污物会减少到原来的1/121,。当然可以分别计算出分3次、4次、n次漂洗的干净程度。最后得出一个干净程度关于清洗次数和用水方案的关系式,就会分析的更彻底,更明了。不过是不是洗的次数越多就越干净呢?不完全正确,因为现实生活中的正确标准有很多,而且衣物再怎么漂洗,污物量都不会比原来的2的40次方分之一更少。实际上分三四次漂洗效果就很好了,如果把时间耗费和衣物磨损在考虑进去的话那就是一个新的更复杂的数学模型了。仔细分析,还会得出很多很出乎意料的结论,这里就不一一介绍了。感兴趣的话自已一定要亲自看看原书,体会是完全不一样的,张景中院士一定会让你有种畅游数学海洋的欢快感觉。
看,典雅生活中处处有数学的影子。正所谓真理无处不在啊。看来,精致生活还是需要数学来点缀。


望采纳

3. 数学真美妙读后感

数学真美妙读后感
今年暑假,我看一本叫《数学真美妙》的书。
这本书分为十二章,有数学游戏、数学奇观、数学猜想、数学美妙等若干部分。每一章都很有趣。书中还详细介绍了国内外古代数学知识,如伏羲氏与八卦,河图与十进制,洛书和九宫格,魔方和数独,这些都引起我对数学的浓厚兴趣。
最让我回味的是第一章24点经典题目。所谓24点就是把四张有数字的纸或扑克牌用加减乘除来凑成24。我有不少题目都答不出来,但外公却很快算出来了。我们一起讨论,外公从旁指点,总算都算完了。最后一章也很好玩,讲述阿基米德怎样发现阿基米德原理并用它测出国王王冠里有没有银子。
书里还有许多有趣的数学题,让我越看越有劲,越做越开心。数学真有趣,怪不得叫数学真美妙呢

数学真美妙读后感

4. 《数学真美妙》读后感

最近,学校组织全校同学开展“读书节”活动。在学校老师的推荐下,我读到了一本让我在欢乐中学习的好书——《数学真好玩》。
“这是一本能让人十分钟爱上的数学书”字。书的扉页上写着这样一行字。书中以作者的弟弟菲洛和爷爷为主角,通过爷爷生动风趣的一个个故事,带领我们和菲洛一起探索数学王国的奥秘。
这本书看似其貌不扬,但读起来却让人爱不释手。平常被看得复杂和繁琐的数字,被书中幽默的对话、生动的例子,充满意大利风情的插图,欢快地展现在读者的面前。在作者的笔下,好奇的弟弟总是不断地向爷爷提出问题,而教龄40年的爷爷总是不厌其烦地向他讲解。
书中的爷爷慈祥和蔼,弟弟菲洛聪明淘气,所有抽象、枯燥的数学知识都在爷孙两人的对话中展现出来,变得亲切易懂,你会发现,数学并不仅仅是数字、公式、例题,它还是历史、趣味和生活道理,原来数学这么好玩、如此简单!
当然,书中最令我喜爱的,还是正文前面的那些标题。我不喜欢那些故弄玄虚的标题,一看到那样的标题,我阅读的兴趣就会大打折扣。而《数学真好玩》这本书,却给了我完全不一样的感受。
就比如“肚脐的位置恰倒好处”这个标题,一见到它,我的心里就产生了一个大大的悬念。恰到什么好处?为什么恰到好处?急切地催使我继续看下去。
可相反的,如果把这个标题改为“黄金比例”或“0.618的比例”,给人的感觉就完全不一样了。文章会显得呆板、无趣,就更加谈不上什么生动形象了,而这些也正是我从这本书的阅读中获取的最大收获。
同学们,这是一本让人10分钟就爱上数学的神奇之书,就在此书中,你会和菲洛一起体验到前所未有的趣味数学学习方法,认识数学的奇妙与乐趣,学会用数学知识解决实际问题,变为生活中的小小数学达人。让我们一同跟随爷爷和菲洛在数学世界中探险,体验一段快乐而充实的数学之旅

5. 美丽的数学读后感100

美丽的数学读后感

我读书的时候,数学成绩一直都很好,虽然离开学校已经10多年,自觉当初的知识还是记得很多,6~7年前再考线性代数和概率论,还是得到了很高的分数。不过我也和大部分人一样,觉得数学没有太多用处,特别是高中和大学里面学的,那些三角函数,向量,大数定律,解析几何,除了在考试的题目里面用一下,平时又有什么地方可以用呢?
  看了《数学之美》,惊叹于数学的浩瀚和简单,说它浩瀚,是因为它的分支涵盖了科学的方方面面,是所有科学的理论基础,说它简单,无论多复杂的问题,最后总结的数学公式都简单到只有区区几个符号和字母。
  这本书介绍数学理论在互联网上的运用,平时我们在使用互联网搜索或者翻译功能的时候,时常会感叹电脑对自己的了解和它的聪明,其实背后的原理就是一个个精美的算法和大量数据的训练。那些或者熟悉或者陌生的数学知识,一步步构建了我们现在所赖以生存的网上世界。

美丽的数学读后感100

6. 数学之美总结

1.信息度量
  
 信息就是不确定性的多少,信息就是要减少不确定性;
  
 熵: 信息的混杂程度,越大,信息越杂,越不纯;
  
 条件熵: 一个信息确定的条件下,另外一个信息不确定度的减少量;
  
 互信息: 在一个信息的条件下,为了是另外一个信息不确定度减少所需要提供的信息量;
  
 相对熵: 衡量两个函数值为正数的函数的相关性。
  
 
  
  
 2.指纹信息
  
 指纹: 每段信息包括文字,图片,音频,等都可以对应一组不太长的随机数
  
 伪随机数:压缩
  
 基于加密的伪随机数:密码
  
 集合的判定,文章,网页的判定,视频的判定
  
 指纹可能重复,但可能性很小
  
 相似哈希:词,权重,指纹,二进制的结合(提供了一种思路)
  
 
  
  
 3.最大熵模型
  
 最大熵原理: 保留全部的不确定性,让风险降到最小;
  
 最大熵模型: 在所有满足约束条件的模型中选出熵最大的模型;
  
 模型学习: 任何一组不自相矛盾的信息,最大熵模型存在并且唯一,都具有相同的形式,指数形式;
  
 特点: 能同时满足成千上万的中不同条件的模型(有效的组合很多特征)
  
 参数训练: 对数似然函数求极大
  
 
  
  
 4.期望最大
  
 如果模型的变量都是观测变量,用极大似然估计或贝叶斯估计
  
 如果存在隐含变量,用EM迭代,最大后验概率
  
 典型:kmeans聚类,隐马的参数训练,最大熵模型的训练
  
 特点: 局部最优,计算速度慢
  
 
  
  
 5.散列表与布隆过滤器
  
 散列表的核心:哈希函数hashcode(),equals()函数;
  
 散列表的特点:时间复杂度o(1),浪费空间,冲突;
  
 布隆过滤器核心: 一组二进制数和随机映射函数;
  
 布隆过滤器的特点: 时间复杂度o(1),节约空间,到存在错误率
  
 
  
  
 6.文本分类
  
 相似性: 余弦定理,距离
  
 方法: k近邻思想,自底向上的两两合并,EM迭代,奇异值分解;
  
 技巧: 计算时存储重复计算的变量,只考虑非零元素,删除虚词
  
 余弦定理和奇异分解:余弦定理多次迭代,计算量大,消耗资源多;svd无需多次迭代,时间短,但存储空间需求大,适合超大规模分类;建议svd粗分类,余弦定理细分类
  
 TF-IDF解决两个重要问题:词的预测能力越强,权重越大;停止词的权重为零
  
 
  
  
 7.隐马尔可夫
  
 马尔可夫假设: t时刻的状态只取决于t-1时刻
  
 马尔可夫链: 状态链
  
 隐马模型: 初始概率分布,状态转移概率分布,观测概率分布(马尔可夫假设,观测独立)
  
 3个问题: 
  
 参数估计-baum-uelch算法
  
 计算概率-直接,前向,后向算法
  
 预测状态-维特比算法(动态规划)
  
 
  
  
 8.贝叶斯网络
  
 是马尔可夫链的推广(链状-拓扑)
  
 又称信念网络: 弧+可信度
  
 训练: 结构和参数训练,交叉进行
  
 方法: 贪心算法,蒙卡,互信息
  
 
  
  
 9.条件随机场
  
 特点:观测值可能和前后的状态都有关
  
 条件随机场是无向图,贝叶斯网络是有向图
  
 核心:找到符合所有边缘分布的最大熵模型
  
 
  
  
 10.有限状态机和动态规划
  
 有限状态机: 开始,终止状态,有向弧,条件
  
 常见:  建立状态机,已知状态机匹配字符串
  
 区别: 基于概率的有限状态机和离散马尔可夫链等效
  
 动态规划: 把全程路径最短锁定到局部路径最短

7. 《数学之美》

《数学之美》
    
 阅读前的准备: 这本书的书名为《数学之美》我认为这本书主要讲述的内容是数学思维,希望通过阅读这本书可以了解到作者吴军为什么会认为数学存在美感,数学之美体现在哪些方面,我们应该如何使用数学的知识知道现实生活,即如何培养数学思维。希望自己在阅读完这本书之后能够掌握数学思维,领略数学之美。
  
 阅读中的摘抄:
  
 1)伽利略:数学是上帝描写自然的语言
  
 2)爱因斯坦:纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给予我们理解自然现象的钥匙
  
 3)数学既是对自然界事实的总结和归纳,又是抽象思考的结果
  
 4)数学的意识是通过学习获得的知识
  
 5)数学的演化过程是生活中遇到的具体事物及其运动的规律,不断抽象化的过程
  
 6)弗朗西斯·培根:美德就如同华贵的宝石,在朴素的衬托下更显华丽
  
 7)《从一到无穷大》《时间简史》
  
 
  
  
 阅读后的回顾:
  
 这本书的书名为《数学之美》,本书是作者吴军在谷歌工作时期在谷歌黑板报上的《数学之美》相关系列的博客文章整理而成,在本书中作者依旧贯彻用通俗易懂的语言表达深奥的道理,生动的语言,将数字的发展史与实际的案例相结合,系统性的阐述现代科技领域背后重要的数学理论的来源、发展及其作用。 作者在书中认为数学的演化历史就是人们在实际生活中遇到具体事物及其运动规律不断抽象化的过程,抽象化是其最大的特征,过度的抽象化最终结果是学习者只要一想起数学就不自觉地想起公式、定理、概念与之相伴的是自己悲惨的童年。作者吴军试着从通信的角度出发让读者了解到数学在实际生活中的应用,让读者在阅读后有一种“哦,原来数学还可以这样使用”的惊讶感。 作者在书中强调当代企业过多的将时间与金钱过多的投入到产品的营销、产品的外观上,而没有将资源用到刀刃上,通过了解数学之美,培养数学思维,运用系统化的模型掌握与数学工具解决现实问题,这是作者写作的真正目的。
  
 
  
  
 亮灯时刻:
  
 这本书给我自己影响最深刻的是书名“数学之美”,通常情况下我们认为的美指的是视觉意义上的美感,一幅画、一位年轻貌美的女子等等,而数学在一代人的心目中扮演的是摧毁美的角色,单调枯燥的数学定理,纷繁复杂的证明过程,令人头秃的计算公式等等,“数学”与“美”在经历过数学考试的人来说压根不搭边,但在作者吴军看来,数学之美美在思维方式上,数学之美体现在人们应用数学模型解决现实问题的一致性上,简言之数学之美美在思想上。正如文中所言:“数学既是对自然界事实的总结和归纳,又是抽象思考的结果”,当我们把数学当做一种美的时候再次遇到相同的证明题时,或许我们不再苦恼数学的枯燥而是感叹人类思维的美妙把。

《数学之美》

8. 数学之美

数学之美---毕达哥拉斯树