• 新时代 新担当 新作为 2019-03-20
  • 习近平:坚决打好污染防治攻坚战 推动生态文明建设迈上新台阶 2019-03-18
  • 重庆市渝北区:积极打造“律师驻所”新模式 2019-03-18
  • 游走休闲马德里,做一个阳光收割机 2019-02-16
  • 你好,游客 登录
    rss订阅 手机访问 
    开源技术
    当你谈论大数据的时候你还在说Hadoop?
      现在再写这篇文章感觉有些不合时宜,目前,貌似很少人再讨论大数据,也很少人再讨论Hadoop。整理这篇文章,是为了探寻新的技术方向。
    日期:11月01日 作者:
    从A到Z,26个实用Python???函数速览
    Python是世界上较受欢迎的按需编程语言之
    日期:11月01日 作者:
    一文读懂Apache Flink技术
      Flink是款分布式的计算引擎,它可以用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时地处理些实时数据流,实时地产生数据的结果;也可以用来做些基于事件的应用,比如说滴滴通过Flink CEP实现实时监测用户及司机的行为流来判断用户或司机的行为是否正当。
    日期:10月30日 作者:
    一文理解 Apache Hadoop 机架感知
      分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架,由多个机架上的机器共同组成个分布式集群。
    日期:10月30日 作者:
    Hadoop集群从180到1500,携程大数据实践之路
      2015年我刚加入携程的时候,它的Hadoop集群规?;菇鲇性?80台,现在已经发展到超过1500台,也就是8倍的提升。同时每天的数据增量在200T以上,调度任务数9万,运行的实例超过18万,其中80%的作业都运行在SparkSQL上。
    日期:10月26日 作者:
    教你用几行Python和消费数据做客户细分
    细分客户群是向客户提供个性化体验的关键。它可以提供关于客户行为、习惯与偏好的相关信息,帮助企业提供量身定制的营销活动从而改善客户体验。
    日期:10月26日 作者:
    12种Python机器学习&数据挖掘工具包
      作为种解释型语言,Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词)。相比于C++或Java,Python让能够用更少的代码表达想法。不管是小型还是大型程序,该语言都试图让程序的结构清晰明了。
    日期:10月24日 作者:
    基于Hadoop的数据分析平台搭建
      企业发展到定规模都会搭建单独的BI平台来做数据分析,即OLAP(联机分析处理),般都是基于数据库技术来构建,基本都是单机产品。除了业务数据的相关分析外,互联网企业还会对用户行为进行分析,进步挖掘潜在价值,这时数据就会膨胀得很厉害,天的数据量可能会成千万或上亿,对基于数据库的传统数据分析平台的数据存储和分析计算带来了很大挑战。
    日期:06月20日 作者:
    当云HBase2.0被赋能了search
      云HBase2.0也就是我们即将要上线的ApsaraDB for HBase2.0。它不仅兼容开源HBase2.0,也承载着阿里多年大规模HBase使用的技术积淀,还有广大公有云用户喜欢的商业化功能。在大数据量场景中已经具有如此优势的云HBase2.0,如果还能search呢?
    日期:06月07日 作者:
    2018年数据科学和机器学习调查:Python完胜R语言,Hadoop被抛弃!
      近日,数据科学网站KDnuggets发布 2018年数据科学和机器学习工具调查结果。下面起来看看调查结果
    日期:06月07日 作者:
    深度:Hadoop对Spark五大维度正面比拼报告!
      每年,市场上都会出现种种不同的数据管理规模、类型与速度表现的分布式系统。在这些系统中,Spark和hadoop是获得较大关注的两个。然而该怎么判断哪款适合你?
    日期:06月07日 作者:
    大数据时代数据库-云HBase架构&生态&实践
      2018第九届中国数据库技术大会,阿里云高技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBase及生态,较后分享了大数据数据库的实际案例。
    日期:06月06日 作者:
    大数据分析系统Hadoop的13个开源工具
      Hadoop是由Apache基金会开发的个大数据分布式系统基础架构,较早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。
    日期:06月06日 作者:佚名
    Hadoop大数据面试题全版本

    以下资料来源于互联网,很多都是面试者们去面试的时候遇到的问题,我对其中有的问题做了稍许的修改了回答了部分空白的问题,其中里面有些考题出的的确不是很好,但是也不乏有很好的题目,这些都是基于真实的面试来的,希望对即将去面试或向继续学习hadoop,大数据等的朋友有帮助!

    日期:05月23日 作者:
    Accordion:HBase “呼吸式”内存压缩算法
    现今,HBase 所支持的现代产品对Hbase读写性能的期望越来越高。理想情况下,HBase 也希望在保证其可靠的持久存储的前提下能同时享有内存数据库的速度。
    日期:05月23日 作者:疯子
  • 新时代 新担当 新作为 2019-03-20
  • 习近平:坚决打好污染防治攻坚战 推动生态文明建设迈上新台阶 2019-03-18
  • 重庆市渝北区:积极打造“律师驻所”新模式 2019-03-18
  • 游走休闲马德里,做一个阳光收割机 2019-02-16