一点一滴

“大数据”

大数据-分类

详细记录python的range()函数用法

使用python的人都知道range()函数很方便,今天再用到他的时候发现了很多以前看到过但是忘记的细节。这里记录一下range(),复习下list的slide,最后分析一个好玩儿的冒泡程序。这...

k-近邻算法

什么是k-近邻算法(kNN)?工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有变迁的新数据后,将新数...

hive的bin目录的hive文件

下面我们看下hive命令的运行脚本/home/hive/hive/bin/hive文件#!/usr/bin/env bash # Licensed to the Apache Software...

hadoop内存环境变量

hadoop内存的配置,涉及到两个方面:namenode/datanode/resourcemanager/nodemanager的HEAPSIZE环境变量在配置文件/Configuration...

hadoop配置文件和常用配置参数详解

hadoop-env.sh : 用来定义hadoop运行环江相关的配置信息,比如配置JAVA_HOME环境变量、为hadoop的JVM指定特定的选项、指定日志文件所在的目录路径一级mast...