-
hadoop常用命令
-
hadoop删除正在运行的job
-
hadoop 网站日志分析
-
PV(PageView): 页面访问量统计 IP: 页面独立IP的访问量统计 Time: 用户每小时PV的统计 Source: 用户来源域名的统计 Browser: 用户的访问设备统计
-
hadoop 节点正常启动可是50075/50030不能访问
-
hadoop 节点正常启动可是50075/50030不能访问情景描述: 因为以前namenode节点下面的hadoop/lib文件夹加入了一些别的jar包(为了测试一些
-
Hadoop面试45个题目及答案
-
1.Hadoop集群可以运行的3个模式? 单机(本地)模式 伪分布式模式 全分布式模式 2. 单机(本地)模式中的注意点? 在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开
-
Cannot delete .... . Name node is in safe mode
-
如何关闭安全模式呢? 命令为: bin/hadoop dfsadmin -safemode leave 原因: 在分布式文件系统启动的时候,开始的时候会有安全...
-
hadoop 节点正常启动可是50075/50030不能访问
-
转载:http://www.cookqq.com/lookBlog.action?id=079198bd-603f-43d8-910d-81d0d1789c34 情
-
Hadoop杂记
-
namenode(hdfs)+jobtracker(mapreduce)可以放在一台机器上,datanode+tasktracker可以在一台机器上,辅助namenode要单独放一台机器,jobtracker通常情况下分区跟datanode一样(目录最好分布在不同的磁盘上,一个目录对应一个磁盘),namenode存储目录需要格式化,datanode存储目录不需...
-
hadoop-ID分析
-
我们开始来分析Hadoop MapReduce的内部的运行机制。用户向Hadoop提交Job(作业),作业在JobTracker对象的控制下执行。Job被分解成为Task(任务),分发到集群中,在TaskTracker的控制下运行。Task包括MapTask和Reduc...
-
hadoop-reduce分析
-
Map的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出。...
-
hadoop-Mapper分析
-
* Licensed to the Apache Software Foundation (ASF) under one package org.apache.hadoop.mapreduce; import java.io.IOException; /** * Maps...
-
hadoop-mapreduce分析
-
把整个Hadoop看作是容器,那么Mapper和Reduce就是容器里的组件,*Context保存了组件的一些配置信息,同时也是和容器通信的...
-
ubuntu 安装hadoop 伪分布模式
-
1/首先在官网下载hadoop文件,hadoop-0.23.6.tar.gz 2/系统下要安装jdk 我的系统jdk安装在:JAVA_HOME=/usr/lib/jvm/java-6-oracle 3/解压hadoop-0.23.6.tar.gz文件:...
-
长平狐 [Hadoop] Sqoop安装过程详解
-
Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。 Sqoop官方版本:http://apache.dataguru.cn/sqoop/1.4.2/ Sqoop CDH版本:...
-
hadoop-streaming 例子
-
Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:
采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer)...
-
hadoop-双色球-统计
-
1/使用hadoop把双色球相邻的红球进行统计: 测试数据在:http://pan.baidu.com/s/1hq82YrU import java.io.IOException; import java.text.DateFormat; i...
-
基于Eclipse的Hadoop应用开发环境配置
-
基于Eclipse的Hadoop应用开发环境配置 我的开发环境: 操作系统centos5.5 一个namenode 两个data...
-
Hadoop Namenode不能启动 dfs/name is in an inconsistent
-
前段时间自己的本机上搭的Hadoop环境(按文档的伪分布式),第一天还一切正常,后来发现每次重新开机以后都不能正常启动,在start-dfs.sh之后jps一下发现namenode不能正常启动,按提示找到logs目录下namenode的启动...
-
Hadoop学习资料、博客及网站汇总
-
Hadoop官方的中文文档 http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html...
-
Hadoop 实现定制的Writable类型(附部分源码)
-
本人博客开始迁移,博客整个架构自己搭建及编码
-
Hadoop序列化中的Writable接口(附部分源码)
-
序列化是将结构化对象为字节流以便与通过网络进行传输或者写入持久存储。反序列化指的是将字节流转为一系列结构化对象的过程。
序化在分布式数据处理的两
列
大领域经常出现:进程间通信和永久存储
hadoop中,节点直接...