“大数据”
大数据-分类详细记录python的range()函数用法
使用python的人都知道range()函数很方便,今天再用到他的时候发现了很多以前看到过但是忘记的细节。这里记录一下range(),复习下list的slide,最后分析一个好玩儿的冒泡程序。这...
k-近邻算法
什么是k-近邻算法(kNN)?工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有变迁的新数据后,将新数...
hive的bin目录的hive文件
下面我们看下hive命令的运行脚本/home/hive/hive/bin/hive文件#!/usr/bin/env bash # Licensed to the Apache Software...
hadoop内存环境变量
hadoop内存的配置,涉及到两个方面:namenode/datanode/resourcemanager/nodemanager的HEAPSIZE环境变量在配置文件/Configuration...
hadoop配置文件和常用配置参数详解
hadoop-env.sh : 用来定义hadoop运行环江相关的配置信息,比如配置JAVA_HOME环境变量、为hadoop的JVM指定特定的选项、指定日志文件所在的目录路径一级mast...