ggjucheng ggjucheng
关注数: 7 粉丝数: 15 发帖数: 556 关注贴吧数: 13
java推荐书籍及下载 一直有这么个想法,列一下我个人认为在学习和使用Java过程中可以推荐一读的书籍,给初学者或者想深入的朋友一些建议,帮助成长。推荐的的都是我自己读过,也会推荐一些朋友读过并且口碑不错的书籍。以下的资料都是免登陆下载,而且都是free的。 如果大家觉得资料好的话,推荐给周围的朋友,让更多的人少走弯路。 入门类 《Thinking in java》 下载地址 在有了一定的Java编程经验之后,你需要“知其所以然”了。这个时候《Java编程思想》是一本让你知其所以然的好书,它对于基本的面向对象知识有比较清楚的交待,对Java基本语法,基本类库有比较清楚的讲解,可以帮你打一个良好的Java编程基础。这本书的缺点是实在太厚,也比较罗嗦,不适合现代人快节奏学习,因此看这本书要懂得取舍,不是每章每节都值得一看的,挑重点的深入看就可以了。 《Agile Java》中文版 java入门读物,这本书一大特点是以单元测试和TDD来贯穿全书的,在教你Java各种重要的基础知识的过程中,潜移默化的影响你的编程思维走向敏捷,走向TDD。另外这本书成书很新,以JDK5.0的语法为基础讲解,要学习JDK5.0的新语法也不错。还有这本书对于内容取舍也非常得当,Java语言毕竟类库庞大,可以讲的内容太多,这本书选择的内容以及内容的多寡都很得当,可以让你以最少的时间掌握Java最重要的知识,顺便培养出来优秀的编程思路,真是一本不可多得的好书。 本书暂时无完全中文版电子书 进阶类 《Effective Java》下载地址 在熟悉语法、API之后,你需要知道最佳实践和陷阱,没有比这本更好的。 《Java Puzzlers》下载地址 通过谜题介绍一些你可能没有注意到的边角料,由一个个谜题开始,提出Java程序开发中常遇到的有关问题,分析问题的原因,总结经验,帮助开发者迅速提高开发水平。 《深入Java虚拟机》下载地址 sun核心丛书,翻译一般,但不可不读,最好结合最新的JVM规范来读。 网络编程 O'Reilly的《Java nio》下载地址 很多人都推荐,我个人觉的一般,基本上只是个API更详细的说明文档,O'reilly的java系列很多都是这样。 本书只有英文版 《Fundamental networking in java》下载地址 由浅入深教你怎么做java网络编程,并且介绍很多背景知识,甚至介绍了各种最佳实践、网络编程模型以及Java socket在不同平台之间的差异等等。 本书只有英文版 《unix网络编程》下载地址 学习网络编程必读书,看懂它需要一点点c语言背景,java网络编程的书写的好的不多,至少我现在还没听说过,该书写得通俗易懂,历久不衰,评价甚高。网络编程其实和语言关系不大,想学好网络编程,此书必读。 《C++网络编程》下载地址 上下两卷,介绍ACE的,但是其中对各种模式运用的介绍非常值的一读。 并发编程 《Java Concurrency in Practic》下载地址 并发领域必读经典,学java并发不可不读。 《Java并发编程:设计原则与模式》下载地址 同样是Doug lea的作品。
淘宝Hadoop集群的概况 国内外使用Hadoop的公司比较多,全球最大的Hadoop集群在雅虎,有大约25,000个节点,主要用于支持广告系统与网页搜索。国内用Hadoop的主要有百度、淘宝、网易、华为、中国移动等,其中淘宝的Hadoop集群属于较大的(如果不是最大)。 淘宝Hadoop集群现在超过1700个节点,服务于用于整个阿里巴巴集团各部门,数据来源于各部门产品的线上数据库(Oracle, MySQL)备份,系统日志以及爬虫数据,截止2011年9月,数量总量已经超过17个PB,每天净增长20T左右。每天在Hadoop集群运行的MapReduce任务有超过4万(有时会超过6万),其中大部分任务是每天定期执行的统计任务,例如数据魔方、量子统计、推荐系统、排行榜等等。这些任务一般在凌晨1点左右开始执行,3-4个小时内全部完成。每天读数据在2PB左右,写数据在1PB左右。Hadoop包括两类节点Master和Slave节点, Master节点包括Jobtracker,Namenode, SecondName, Standby, 硬件配置:16CPU*4核,96G内存。 Slave节点主要是TaskTracker和DataNode, 硬件配置存在一定的差别:8CPU*4核-16CPU*4核,16G-24G内存 (注:通常是一个slave节点同时是TaskTracker和DataNode,目的是提高数据本地性data locality)。 每个slave节点会划分成12~24个slots。整个集群约34,916个slots,其中Map slots是19,643个,Reduce slots是15,273个 所有作业会进行分成多个Group,按照部门或小组划分,总共有38个Group。整个集群的资源也是按各个Group进行划分,定义每个Group的最大并发任务数,Map slots与Reduce slots的使用上限。每个作业只能使用自己组的slots资源。
1 下一页